谷歌新Gemini AI模型在基准测试中击败GPT-4o

时间:2024-09-22 编辑: 浏览:(44)

作者:Tristan Greene,CoinTelegraph;编译:陶朱,

生成式人工智能基准测试领域又出现了一位新霸主,它的名字是 Gemini 1.5 Pro。

之前的冠军 OpenAI 的 ChatGPT-4o 终于在 8 月 1 日被超越,当时谷歌悄然发布了其最新模型的实验版本。

Gemini 的最新更新没有大张旗鼓地发布,目前被标记为实验性的。但它很快引起了社交媒体上人工智能社区的关注,因为有报道称它在基准测试分数上超越了竞争对手。

人工智能基准

自 GPT-3 发布以来,OpenAI 的 ChatGPT 一直是生成式 AI 的标杆。过去一年左右,其最新模型 GPT-4o 和最接近的竞争对手 Anthropic 的 Claude-3 在大多数常见基准测试中都遥遥领先于大多数其他模型,几乎没有遇到任何竞争对手。

来源:大型模型系统组织。

最受欢迎的基准测试之一是 LMSYS Chatbot Arena。它测试各种任务的模型并分配总体能力分数。GPT-4o 的得分为 1,286,而 Claude-3 获得了可观的 1,271 分。

Gemini 1.5 Pro 的先前版本得分为 1,261。但 8 月 1 日发布的实验版本 (Gemini 1.5 Pro 0801) 得分高达 1,300。

这表明它总体上比竞争对手更强大,但基准测试并不一定能准确反映 AI 模型能做什么和不能做什么。

社区兴奋

在没有更深入的比较的情况下,我们正进入一个 AI 聊天机器人市场已经足够成熟,可以提供多种选择的时代。最终由用户来决定哪种 AI 模型最适合他们。

据传,Gemini 的最新版本引起了一波兴奋,社交媒体上的用户称它“非常好”。一位 Redditor 甚至写道,它“完全胜过 4o”。

目前尚不清楚 Gemini 1.5 Pro 的实验版本是否会成为未来的默认版本。虽然截至本文发表时,它仍然普遍可用,但它处于早期发布或测试阶段这一事实表明,出于安全或协调原因,该模型可能会被撤销或更改。

最新 更多 >
  • 1 带你了解市场现状:调整不可避免 发掘百倍币更加困难

    目前的加密货币市场处于早期阶段,与之前的周期相比,我们还未到达市场的高峰。市场调整是不可避免的,尤其在经历了前几轮周期中的深度调整后。过去的周期中,市场调整幅度在 -25% 到 -63% 之间。现在,虽然流动性与2021年相同,但代币数量增加了50倍,找到百倍币的难度加大。市场调整不可避免市场总是会经历调整,这是不可避免的。2016-2017年期间,市场调整幅度在 -25% 到 -35% 之间,而

  • 2 Bybit瞄准阿根廷推出新借记卡

    加密货币交易所Bybit已在阿根廷推出其万事达借记卡,承诺通过新产品提供便利和奖励。根据该公司今天(周二)的一份声明,这项服务将把数字资产与日常交易相结合,并促进金融包容性。 数字资产的快速增长 Bybit销售和营销总监Joan Han表示:“Bybit卡在阿根廷的推出对Bybit和当地社区来说都是一个重要的里程碑。阿根廷数字资产的快速增长产生了对创新解决方案的需求,这些解决方案可以增强金融包容性

  • 3 Ripple:XRP Bent Fork Dev公布3.5美元和17美元目标,分析显示

    尽管XRP在整个季节都采取了缓慢的价格步伐,但几位分析师认为Ripple可能很快就会升至新高。著名的加密货币分析师Egrag Crypto再次提出了一个新的预测,这是一个新颖的分析,揭示了XRP有可能达到3.5美元的价格大关。除此之外,如果XRP以最大的纪律遵循其预定的价格路径,该代币还具有达到17美元价格大关的勇气。 另请阅读:BNB绿色趋势:本周币安币交易能达到多高? Ripple XRP 3

  • 4 以太坊:购买ETH信号?价格图上的双底显示…

    以太坊在4小时内出现了牛市双底价格走势。卖空者预计ETH不会达到3250美元的水平,如果它真的达到这个水平,价值16.5亿美元的空头头寸将被清算。 在美国最近更新了以太坊ETF(交易所交易基金)后,全球第二大加密货币以太坊(ETH)的价格飙升了5.5%以上。 此次ETF更新后,加密货币市场整体转为绿色,投资者情绪发生积极转变。 凭借过去24小时内令人印象深刻的价格势头,ETH刚刚达到200指数移动

  • 5 Bullish和Gold-i交易的目标是每天16亿美元的加密货币市场

    受监管的数字资产交易所Bullish和交易技术提供商Gold-i宣布整合其平台,旨在改善机构加密货币交易。 专用外汇云解决方案,具有稳定快速的跨境连接,能够满足高需求场景。阿里云帮助外汇交易员在全球范围内安全运营。点击了解更多! Bullish Exchange和Gold-i建立合作伙伴关系以加强机构加密货币交易 该合作使共同客户能够通过Gold-i的MatrixNET平台访问Bullish的主

  • 6 比特币大跌6%,虚拟货币市场剧震,是何原因?

    虚拟货币市场7月8日早间再度闪崩。Coinglass数据显示,比特币一度跌至55000美元关口下方,最低触及54320.76美元,日内最大跌幅超6%。截至7月9日16时51分,比特币报价为57710.5美元/枚,24小时内爆仓总金额为8510万美元。比特币的闪崩迅速波及整个虚拟货币市场,其他虚拟货币价格也出现大幅跳水。市值排名前十的加密货币几乎无一幸免,跌幅集中在6%至9%之间。那么,此次价格跳水

  • 7 随着比特币牛市重要趋势线重新出现 BTC 价格触及 58000 美元

    比特币不受德国政府最新一轮链上交易的影响,但 BTC 价格阻力趋势线仍遥不可及。随着德国政府转移更多比特币持有量,比特币在 7 月 9 日华尔街开盘时重新回到 58,000 美元左右。德国政府继续采取行动,比特币价格未受影响Cointelegraph Markets Pro和TradingView的数据显示,比特币价格势头强劲,在 Bitstamp 上达到每日高点 58,102 美元。该交易所是最

  • 8 MetaMask的委派工具包如何改变我们使用区块链的方式

    流行的MetaMask钱包背后的区块链软件公司ConsensSys公布了引入新的“MetaMask委派工具包”的计划,旨在增强和简化用户与区块链应用程序的交互。 ETH软件开发商在比利时布鲁塞尔举行的以太坊社区会议(EthCC)上宣布了这一消息,并指出开发者的入职正在进行中。该工具旨在提供“细粒度的安全级别”,更好地满足用户需求。 ConsensSys表示,该工具包将与以太坊虚拟机支持的任何链兼容

  • 9 融资8500万美元丨开源AI项目Sentient将与SET合作引领Polygon走向更深邃的未来

    开源人工智能开发平台 Sentient 宣布完成 8500 万美元的种子轮融资,旨在打破集中式 AI 模型开发在行业中的主导地位,这一巨额融资吸引了众多市场目光。据披露,该轮融资由 Fetch.AI  Peter Thiel 的 Founders Fund、Pantera Capital 和 Framework Ventures 共同领投,其他投资者包括 Ethereal Ventures、Rob

  • 10 币安鲸进一步打压altcoin:BNB会复苏吗?

    在过去的24小时里,一头鲸鱼移动了大量的BNB。因此,围绕代币的社会情绪显著下降。 币安币是受近期市场下跌影响的众多代币之一。7月8日,一头鲸鱼似乎受到了这种突然波动的影响,撤回了价值1.03亿美元的BNB代币。 这一运动是否影响了BNB的发展轨迹? BNB怎么了 自7月7日以来,BNB的价格大幅下跌。在此期间,BNB的价格出现了多个较低的低点和较低的高点,表明了看跌趋势。 该代币在461.3美元