从阿里巴巴到挑战Meta、OpenAI的Qwen2AI新模式

时间:2024-09-24 编辑: 浏览:(176)

中国电子商务巨头阿里巴巴是中国人工智能领域的主要参与者。今天,该公司宣布发布其最新的人工智能模型Qwen2,从某些方面来看,这是目前最好的开源选择。

Qwen2由阿里云开发,是该公司的下一代同易倩雯(Qwen)模型系列,包括同易倩雯LLM(也称为just Qwen)、视觉AI模型Qwen VL和Qwen Audio。

Qwen模型系列是针对涵盖各个行业和领域的多语言数据进行预训练的,其中Qwen-78B是该系列中最强大的模型。它是在令人印象深刻的3万亿个数据令牌上训练的。相比之下,Meta最强大的Llama-2变体基于2万亿代币。然而,Llama-3正在消化15万亿代币。

根据Qwen团队最近的一篇博客文章,Qwen2可以处理128K个上下文令牌,与OpenAI的GPT-4o相当。同时,该团队断言,Qwen2在基本上所有最重要的合成基准测试中都优于Meta的LLama3,使其成为目前可用的最佳开源模型。

然而,值得注意的是,独立的Elo Arena将Qwen2-72B-Instruct的排名略好于GPT-4.00314,但低于Llama3 70B和GPT-4.0125-preview,使其成为迄今为止人类测试人员中第二受欢迎的开源LLM。

在合成基准中,Qwen2的性能优于Llama3、Mixtral和Qwen1.5。图片:阿里云

Qwen2有五种不同的尺寸,参数从5亿到720亿不等,该版本在不同的专业领域提供了显著的改进。此外,模型使用的数据比上一版本多了27种语言,包括德语、法语、西班牙语、意大利语和俄语,以及英语和汉语。

Qwen团队在HuggingFace上的模型官方页面上声称:“与最先进的开源语言模型(包括之前发布的Qwen1.5)相比,Qwen2总体上超过了大多数开源模型,并在一系列针对语言理解、语言生成、多语言能力、编码、数学和推理的基准测试中表现出了与专有模型的竞争力。”。

Qwen2模型还显示出对长上下文的深刻理解。Qwen2-72B-Instruct可以在其庞大的环境中无错误地处理任何地方的信息提取任务,并且几乎完美地通过了“大海捞针”测试。这一点很重要,因为传统上,我们与模型的交互越多,模型性能就会开始下降。

Qwen2在“大海捞针”测试中表现突出。图片:阿里云

随着这次发布,Qwen团队也更改了其型号的许可证。虽然Qwen2-72B及其指令调优模型继续使用原来的Qianwen许可证,但所有其他模型都采用了Apache 2.0,这是开源软件世界的标准。

“在不久的将来,我们将继续开源新模式,以加速开源人工智能,”阿里云在一篇官方博客文章中表示。

Decrypt测试了该模型,发现它非常能够理解多种语言的任务。该模式也受到审查,尤其是在中国被认为敏感的主题上。这似乎与阿里巴巴的说法一致,即Qwen2是最不可能提供不安全结果的模式——无论是非法活动、欺诈、色情和隐私暴力——无论是用哪种语言提示。

此外,它对系统提示有很好的理解,这意味着所应用的条件将对其答案产生更强的影响。例如,当被告知要扮演一个有法律知识的乐于助人的助理,而不是扮演一个总是根据法律做出回应的知识渊博的律师时,对的回答显示出很大的差异。它提供的建议与GPT-4o提供的建议类似,但更为简洁。

Qwen2的回复是:“一个邻居侮辱了我” ChatGPT回复:“一个邻居侮辱了我”

该团队表示,下一次型号升级将为Qwen2 LLM带来多模态,可能将所有家族合并为一个强大的型号。他们补充道:“此外,我们将Qwen2语言模型扩展到多模式,能够理解视觉和音频信息。”。

Qwen可以通过HuggingFace Spaces进行在线测试。那些有足够计算能力在本地运行的人可以免费下载重量,也可以通过HuggingFace下载。

对于那些愿意押注开源人工智能的人来说,Qwen2模型是一个很好的选择。它比大多数其他模型有更大的代币上下文窗口,使其比Meta的LLama 3更有能力。此外,由于其许可证,其他人共享的微调版本可能会对其进行改进,从而进一步提高其分数并克服偏见。

由Ryan Ozawa编辑。

最新 更多 >
  • 1 CNBC的BrianKelly表示,Solana可能是下一个接受ETF治疗的交易所

    CNBC Fast Money 交易员兼撰稿人 Brian Kelly 表示,作为“三巨头”代币之一的 Solana 很可能成为下一个获得 ETF(交易所交易基金)待遇的加密货币,这引发了加密货币社区的争论。

  • 2 5月23日九只美国比特币ETF总计增持2511枚比特币

    Lookonchain 监测 5 月 23 日美国现货比特币 ETF 数据显示:1、灰度 GBTC 增持 12 枚比特币,价值约合 80.4 万美元;2、灰度当前总计持有 289,500 枚比特币,价值约合 196.3 亿美元;3、贝莱德增持 1321 枚比特币,价值约合 8955 万美元,当前总计持有 283,205 枚比特币,价值约合 192 亿美元;4、9 只比特币 ETF 总计增持 251

  • 3 DavidCohen在MaëlleGavet卸任后重返Techstars首席执行官

    David Cohen重新担任Techstars首席执行官,此前Maëlle Gavet因健康问题离职。Gavet在LinkedIn上表示,她患有甲状腺癌并需要接受治疗。Cohen感谢Gavet在过去三年半中的领导,并表示有信心继续推动Techstars的成功。科技之星成立于2006年,致力于建立创业社区和为初创公司提供支持。截至2023年,该公司已投资了超过2000家创业公司,其中469家筹集了

  • 4 英国法院驳回克雷格·赖特自称是比特币创造者的说法

    经过漫长的法律斗争,英国法院终于有条不紊地驳斥了克雷格·赖特关于其真实身份的大量伪造证据和断言。

  • 5 以太坊短暂下跌至3,523美元后回升至3,710美元

    以太坊一度跌至 3523 美元,目前已回升至 3700 美元以上。根据 OKX 5 月 24 日的市场数据,以太坊价格经历了下跌,但随后反弹至 3710 美元。BlockBeats 新闻提醒投资者注意市场的波动性,并建议谨慎操作。

  • 6 由于大量代币转移,XRP在近期上涨后遭遇挫折

    XRP 近期的反弹遭遇重大挫折,未能维持其势头,再次跌入亏损状态。该加密货币昨日上涨 6%,但今日下跌 2%。Ripple Labs Inc. 向一个未知钱包大量转移 5000 万枚 XRP 代币,价值约 2570 万美元,被认为是拖累 XRP 下跌的关键因素。此前,上周又发生了另一笔大额交易,超过 1 亿枚 XRP 被发送到一个外部钱包。这种大规模的波动通常会通过增加 XRP 的市场供应量对其价

  • 7 比特币现货ETF连续9天净流入,录得1.08亿美元

    5月23日,比特币现货ETF共净流入1.08亿美元,连续9天净流入。灰度旗下GBTC净流出1372.09万美元,贝莱德旗下iBit以8895.16万美元的单日净流入量位居第一,富达旗下FBTC以1912.24万美元的净流入量紧随其后。截至最新数据,比特币现货ETF总资产净值为572.92亿美元,ETF资产净率为4.29%,历史累计净流入134.35亿美元。

  • 8 消息人士:白宫不会对FIT21加密法案发出“否决威胁””

    据消息认识@10ktier 在 X 平台透露,白宫不会对 FIT21 加密法案发出“否决威胁”。此前消息,美 SEC 主席 Gary Gensler 周三表示,《21 世纪金融创新与技术法案》(FIT 21)将损害投资者利益并妨碍 SEC 的工作,众议院预计将于周三晚些时候对该法案进行投票。

  • 9 过去30天CoinbasePro比特币钱包余额减少15176.64枚

    Coinglass 数据显示,当前币安比特币钱包余额为 540,971.16 枚,在 CEX 中位居第一;过去 24 小时流出 2960.15 枚,过去 7 天流入 720.48 枚,过去 30 天流入 4361.91 枚。Bitfinex 比特币钱包余额为 385,180.73 枚,过去 24 小时流入 2396.57 枚,过去 7 天流入 4159.66 枚,过去 30 天流入 13532.7

  • 10 “地狱已经冻结:”美国政治和唐纳德·特朗普如何在以太坊ETF批准中为加密货币带来历史性突破

    本周对美国加密货币来说是一个地震般的一周,行业取得了两次巨大胜利: 以太坊现货ETF的快速批准和旨在提供明确监管框架的法案进展。这些变化似乎是因为特朗普在即将到来的总统选举中支持加密货币而发生的。美国证券交易委员会开始为申请推出以太坊 ETF 的基金经理铺上红地毯, 并迅速获得批准 接下来可能更广泛的主流采用,更清晰的监管以及重振美国的加密货币行业