从阿里巴巴到挑战Meta、OpenAI的Qwen2AI新模式

时间:2024-10-01 编辑: 浏览:(491)

中国电子商务巨头阿里巴巴是中国人工智能领域的主要参与者。今天,该公司宣布发布其最新的人工智能模型Qwen2,从某些方面来看,这是目前最好的开源选择。

Qwen2由阿里云开发,是该公司的下一代同易倩雯(Qwen)模型系列,包括同易倩雯LLM(也称为just Qwen)、视觉AI模型Qwen VL和Qwen Audio。

Qwen模型系列是针对涵盖各个行业和领域的多语言数据进行预训练的,其中Qwen-78B是该系列中最强大的模型。它是在令人印象深刻的3万亿个数据令牌上训练的。相比之下,Meta最强大的Llama-2变体基于2万亿代币。然而,Llama-3正在消化15万亿代币。

根据Qwen团队最近的一篇博客文章,Qwen2可以处理128K个上下文令牌,与OpenAI的GPT-4o相当。同时,该团队断言,Qwen2在基本上所有最重要的合成基准测试中都优于Meta的LLama3,使其成为目前可用的最佳开源模型。

然而,值得注意的是,独立的Elo Arena将Qwen2-72B-Instruct的排名略好于GPT-4.00314,但低于Llama3 70B和GPT-4.0125-preview,使其成为迄今为止人类测试人员中第二受欢迎的开源LLM。

在合成基准中,Qwen2的性能优于Llama3、Mixtral和Qwen1.5。图片:阿里云

Qwen2有五种不同的尺寸,参数从5亿到720亿不等,该版本在不同的专业领域提供了显著的改进。此外,模型使用的数据比上一版本多了27种语言,包括德语、法语、西班牙语、意大利语和俄语,以及英语和汉语。

Qwen团队在HuggingFace上的模型官方页面上声称:“与最先进的开源语言模型(包括之前发布的Qwen1.5)相比,Qwen2总体上超过了大多数开源模型,并在一系列针对语言理解、语言生成、多语言能力、编码、数学和推理的基准测试中表现出了与专有模型的竞争力。”。

Qwen2模型还显示出对长上下文的深刻理解。Qwen2-72B-Instruct可以在其庞大的环境中无错误地处理任何地方的信息提取任务,并且几乎完美地通过了“大海捞针”测试。这一点很重要,因为传统上,我们与模型的交互越多,模型性能就会开始下降。

Qwen2在“大海捞针”测试中表现突出。图片:阿里云

随着这次发布,Qwen团队也更改了其型号的许可证。虽然Qwen2-72B及其指令调优模型继续使用原来的Qianwen许可证,但所有其他模型都采用了Apache 2.0,这是开源软件世界的标准。

“在不久的将来,我们将继续开源新模式,以加速开源人工智能,”阿里云在一篇官方博客文章中表示。

Decrypt测试了该模型,发现它非常能够理解多种语言的任务。该模式也受到审查,尤其是在中国被认为敏感的主题上。这似乎与阿里巴巴的说法一致,即Qwen2是最不可能提供不安全结果的模式——无论是非法活动、欺诈、色情和隐私暴力——无论是用哪种语言提示。

此外,它对系统提示有很好的理解,这意味着所应用的条件将对其答案产生更强的影响。例如,当被告知要扮演一个有法律知识的乐于助人的助理,而不是扮演一个总是根据法律做出回应的知识渊博的律师时,对的回答显示出很大的差异。它提供的建议与GPT-4o提供的建议类似,但更为简洁。

Qwen2的回复是:“一个邻居侮辱了我” ChatGPT回复:“一个邻居侮辱了我”

该团队表示,下一次型号升级将为Qwen2 LLM带来多模态,可能将所有家族合并为一个强大的型号。他们补充道:“此外,我们将Qwen2语言模型扩展到多模式,能够理解视觉和音频信息。”。

Qwen可以通过HuggingFace Spaces进行在线测试。那些有足够计算能力在本地运行的人可以免费下载重量,也可以通过HuggingFace下载。

对于那些愿意押注开源人工智能的人来说,Qwen2模型是一个很好的选择。它比大多数其他模型有更大的代币上下文窗口,使其比Meta的LLama 3更有能力。此外,由于其许可证,其他人共享的微调版本可能会对其进行改进,从而进一步提高其分数并克服偏见。

由Ryan Ozawa编辑。

最新 更多 >
  • 1 最新行情晚报:PEOPLE价格达0.07004美元/枚,日内跌幅-3.10%

    ConstitutionDAO最新价格消息,PEOPLE实时价格下跌-3.10%至$0.07004,交易量$4.27亿从k线图的解析结果来看,现在属于上涨趋势。相比10:00较大幅上涨,比09:00有所回升,突破11:00的高点。市场冷清,价格上行。威廉指标指出,现在是没有超买和超卖的状态。最近交易量有所减少,交易量比前几小时减少,价格上升,交易量下降:上涨动能减弱。市场冷清,价格上行后下跌,上涨

  • 2 LI.FI发现4个新安全漏洞,用户资金面临风险

    Foresight News报道,LI.FI宣布发现了4个新的安全漏洞,这些漏洞影响所有与LI.FI协议交互的用户资金。公司已敦促所有用户立即撤销与LI.FI协议的权限,以防止可能的资金损失。

  • 3 Poloniex上线新“川普系”代币并推出8000美元空投活动

    Poloniex已于今日上线FIGHT(Fight to Maga)、EAR(THE EAR STAYS ON)两种新的“川普系”代币,并推出了一项交易赛活动,参与者有机会赢取总额为8000美元的空投奖励。这些新币种分别属于SOL和ETH区块链。活动包括交易、充值和邀请新用户三个部分,将从7月15日开始,持续至7月25日。

  • 4 LI.FI官方确认遭遇攻击,提醒用户取消合约授权

    跨链聚合器 LI.FI 官方确认其协议遭遇攻击,并提醒设置过无限批准的用户立即取消合约授权。

  • 5 特朗普:加密行业现在还是个婴儿,不想让其他国家接管这个领域

    7月17日消息,据彭博社商业周刊对特朗普专访,唐纳德·特朗普透露,加密货币不会消失,这很了不起。美国的加密行业有一个良好的基础。它现在还是个婴儿。但我不想让其他国家接管这个领域。特朗普表示在政治捐款募款活动中「认识了很多」来自加密行业的顶尖人物。特朗普已转向拥抱加密货币行业,他表示,如果我们不做,中国就会接手,或者其他国家,但很可能是中国。中国非常重视这一点。 据联邦选举委员会(FEC)的新数据显

  • 6 谷歌推出AI视频工具GoogleVids

    谷歌周一在其面向企业的Workspace应用套件的精选用户中推出了其新型生成式AI视频创作工具Google Vids测试版。Google Vids利用谷歌的Gemini AI和Vertex AI技术,根据包含文本、音频和视频的用户提示创建可定制的演示文稿。该公司表示,Google Vids将首先在Google Workspace Labs中提供给“一小部分值得信赖的测试者”。

  • 7 最新行情晚报:WLD价格达2.746美元/枚,日内跌幅-3.17%

    Worldcoin实时价格行情,WLD今日最新价格达$2.746,跌幅高达-3.17%,交易量$2.95亿经过对k线图的研究,现在是震荡趋势。相比15:00大幅下跌,比08:00有所回升,比13:00有所下降。价格和交易量同步上升,市场情绪高涨。 通过威廉指标判断,现在是超买的状态。最近交易量有所增加,交易量比前几小时增加,价格和交易量同时上升:交易活跃,上涨动能强劲。市场波动较大,建议观望,待趋

  • 8 特朗普将出席2024年比特币大会,圆桌会议费用高达84.46万美元

    美国前总统特朗普将于2024年7月27日在田纳西州纳什维尔的比特币大会上出席并发表演讲。与会者有机会与特朗普进行对话互动并参与圆桌会议。此活动的参与费用为每人844,600美元,包括VIP接待、圆桌会议及与特朗普的合影。另外,还提供每人60,000美元或每两人100,000美元的票价,包括VIP接待和合影。活动也接受加密货币支付。

  • 9 火币HTX举办11周年庆典活动,设20万USDT奖池

    火币HTX为庆祝其成立11周年,推出名为“11周年KOL荣耀之战”的活动,活动时间从7月16日至9月5日,总奖池高达20万USDT。活动分为报名期和比赛期,参与者包括KOL和普通用户,可以通过内容创作、合约交易或用户投票等方式参与。最终将在9月11日通过火币直播公示获奖者,奖项包括最受欢迎KOL、合约开拓先锋KOL、最佳图文创作KOL和人气主播KOL等,各奖项奖金不等。

  • 10 Pantera将重新开始参与链上治理,将从Arbitrum逐渐扩展至更多项目

    Pantera Capital 普通合伙人 Franklin Bi 于 X 发文宣布,Pantera Capital 将重新参与链上治理,将从 Arbitrum 开始,逐渐扩展至更多项目。之所以选择 Arbitrum,是因为 Pantera Capital 曾在 2018 年领投了该项目的开发团队 Offchain Labs。