从阿里巴巴到挑战Meta、OpenAI的Qwen2AI新模式

时间:2024-09-22 编辑: 浏览:(401)

中国电子商务巨头阿里巴巴是中国人工智能领域的主要参与者。今天,该公司宣布发布其最新的人工智能模型Qwen2,从某些方面来看,这是目前最好的开源选择。

Qwen2由阿里云开发,是该公司的下一代同易倩雯(Qwen)模型系列,包括同易倩雯LLM(也称为just Qwen)、视觉AI模型Qwen VL和Qwen Audio。

Qwen模型系列是针对涵盖各个行业和领域的多语言数据进行预训练的,其中Qwen-78B是该系列中最强大的模型。它是在令人印象深刻的3万亿个数据令牌上训练的。相比之下,Meta最强大的Llama-2变体基于2万亿代币。然而,Llama-3正在消化15万亿代币。

根据Qwen团队最近的一篇博客文章,Qwen2可以处理128K个上下文令牌,与OpenAI的GPT-4o相当。同时,该团队断言,Qwen2在基本上所有最重要的合成基准测试中都优于Meta的LLama3,使其成为目前可用的最佳开源模型。

然而,值得注意的是,独立的Elo Arena将Qwen2-72B-Instruct的排名略好于GPT-4.00314,但低于Llama3 70B和GPT-4.0125-preview,使其成为迄今为止人类测试人员中第二受欢迎的开源LLM。

在合成基准中,Qwen2的性能优于Llama3、Mixtral和Qwen1.5。图片:阿里云

Qwen2有五种不同的尺寸,参数从5亿到720亿不等,该版本在不同的专业领域提供了显著的改进。此外,模型使用的数据比上一版本多了27种语言,包括德语、法语、西班牙语、意大利语和俄语,以及英语和汉语。

Qwen团队在HuggingFace上的模型官方页面上声称:“与最先进的开源语言模型(包括之前发布的Qwen1.5)相比,Qwen2总体上超过了大多数开源模型,并在一系列针对语言理解、语言生成、多语言能力、编码、数学和推理的基准测试中表现出了与专有模型的竞争力。”。

Qwen2模型还显示出对长上下文的深刻理解。Qwen2-72B-Instruct可以在其庞大的环境中无错误地处理任何地方的信息提取任务,并且几乎完美地通过了“大海捞针”测试。这一点很重要,因为传统上,我们与模型的交互越多,模型性能就会开始下降。

Qwen2在“大海捞针”测试中表现突出。图片:阿里云

随着这次发布,Qwen团队也更改了其型号的许可证。虽然Qwen2-72B及其指令调优模型继续使用原来的Qianwen许可证,但所有其他模型都采用了Apache 2.0,这是开源软件世界的标准。

“在不久的将来,我们将继续开源新模式,以加速开源人工智能,”阿里云在一篇官方博客文章中表示。

Decrypt测试了该模型,发现它非常能够理解多种语言的任务。该模式也受到审查,尤其是在中国被认为敏感的主题上。这似乎与阿里巴巴的说法一致,即Qwen2是最不可能提供不安全结果的模式——无论是非法活动、欺诈、色情和隐私暴力——无论是用哪种语言提示。

此外,它对系统提示有很好的理解,这意味着所应用的条件将对其答案产生更强的影响。例如,当被告知要扮演一个有法律知识的乐于助人的助理,而不是扮演一个总是根据法律做出回应的知识渊博的律师时,对的回答显示出很大的差异。它提供的建议与GPT-4o提供的建议类似,但更为简洁。

Qwen2的回复是:“一个邻居侮辱了我” ChatGPT回复:“一个邻居侮辱了我”

该团队表示,下一次型号升级将为Qwen2 LLM带来多模态,可能将所有家族合并为一个强大的型号。他们补充道:“此外,我们将Qwen2语言模型扩展到多模式,能够理解视觉和音频信息。”。

Qwen可以通过HuggingFace Spaces进行在线测试。那些有足够计算能力在本地运行的人可以免费下载重量,也可以通过HuggingFace下载。

对于那些愿意押注开源人工智能的人来说,Qwen2模型是一个很好的选择。它比大多数其他模型有更大的代币上下文窗口,使其比Meta的LLama 3更有能力。此外,由于其许可证,其他人共享的微调版本可能会对其进行改进,从而进一步提高其分数并克服偏见。

由Ryan Ozawa编辑。

最新 更多 >
  • 1 2023房贷最新贷款利率

    本篇文章给大家谈谈2023房贷最新贷款利率,以及2023房贷最新贷款利率首套房对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 本文目录一览: 1、2023年房贷利率 2、2023年房贷利率多少 3、房贷2023年利率是多少 4、2023年买房贷款利率是多少 5、2023年房贷利率是多少 2023年房贷利率 年,中国人民银行公布的贷款基准利率为:一年内(含一年)贷款利率35%,一至五年(含