从阿里巴巴到挑战Meta、OpenAI的Qwen2AI新模式

时间:2024-09-21 编辑: 浏览:(769)

中国电子商务巨头阿里巴巴是中国人工智能领域的主要参与者。今天,该公司宣布发布其最新的人工智能模型Qwen2,从某些方面来看,这是目前最好的开源选择。

Qwen2由阿里云开发,是该公司的下一代同易倩雯(Qwen)模型系列,包括同易倩雯LLM(也称为just Qwen)、视觉AI模型Qwen VL和Qwen Audio。

Qwen模型系列是针对涵盖各个行业和领域的多语言数据进行预训练的,其中Qwen-78B是该系列中最强大的模型。它是在令人印象深刻的3万亿个数据令牌上训练的。相比之下,Meta最强大的Llama-2变体基于2万亿代币。然而,Llama-3正在消化15万亿代币。

根据Qwen团队最近的一篇博客文章,Qwen2可以处理128K个上下文令牌,与OpenAI的GPT-4o相当。同时,该团队断言,Qwen2在基本上所有最重要的合成基准测试中都优于Meta的LLama3,使其成为目前可用的最佳开源模型。

然而,值得注意的是,独立的Elo Arena将Qwen2-72B-Instruct的排名略好于GPT-4.00314,但低于Llama3 70B和GPT-4.0125-preview,使其成为迄今为止人类测试人员中第二受欢迎的开源LLM。

在合成基准中,Qwen2的性能优于Llama3、Mixtral和Qwen1.5。图片:阿里云

Qwen2有五种不同的尺寸,参数从5亿到720亿不等,该版本在不同的专业领域提供了显著的改进。此外,模型使用的数据比上一版本多了27种语言,包括德语、法语、西班牙语、意大利语和俄语,以及英语和汉语。

Qwen团队在HuggingFace上的模型官方页面上声称:“与最先进的开源语言模型(包括之前发布的Qwen1.5)相比,Qwen2总体上超过了大多数开源模型,并在一系列针对语言理解、语言生成、多语言能力、编码、数学和推理的基准测试中表现出了与专有模型的竞争力。”。

Qwen2模型还显示出对长上下文的深刻理解。Qwen2-72B-Instruct可以在其庞大的环境中无错误地处理任何地方的信息提取任务,并且几乎完美地通过了“大海捞针”测试。这一点很重要,因为传统上,我们与模型的交互越多,模型性能就会开始下降。

Qwen2在“大海捞针”测试中表现突出。图片:阿里云

随着这次发布,Qwen团队也更改了其型号的许可证。虽然Qwen2-72B及其指令调优模型继续使用原来的Qianwen许可证,但所有其他模型都采用了Apache 2.0,这是开源软件世界的标准。

“在不久的将来,我们将继续开源新模式,以加速开源人工智能,”阿里云在一篇官方博客文章中表示。

Decrypt测试了该模型,发现它非常能够理解多种语言的任务。该模式也受到审查,尤其是在中国被认为敏感的主题上。这似乎与阿里巴巴的说法一致,即Qwen2是最不可能提供不安全结果的模式——无论是非法活动、欺诈、色情和隐私暴力——无论是用哪种语言提示。

此外,它对系统提示有很好的理解,这意味着所应用的条件将对其答案产生更强的影响。例如,当被告知要扮演一个有法律知识的乐于助人的助理,而不是扮演一个总是根据法律做出回应的知识渊博的律师时,对的回答显示出很大的差异。它提供的建议与GPT-4o提供的建议类似,但更为简洁。

Qwen2的回复是:“一个邻居侮辱了我” ChatGPT回复:“一个邻居侮辱了我”

该团队表示,下一次型号升级将为Qwen2 LLM带来多模态,可能将所有家族合并为一个强大的型号。他们补充道:“此外,我们将Qwen2语言模型扩展到多模式,能够理解视觉和音频信息。”。

Qwen可以通过HuggingFace Spaces进行在线测试。那些有足够计算能力在本地运行的人可以免费下载重量,也可以通过HuggingFace下载。

对于那些愿意押注开源人工智能的人来说,Qwen2模型是一个很好的选择。它比大多数其他模型有更大的代币上下文窗口,使其比Meta的LLama 3更有能力。此外,由于其许可证,其他人共享的微调版本可能会对其进行改进,从而进一步提高其分数并克服偏见。

由Ryan Ozawa编辑。

最新 更多 >
  • 1 IOST 进展双周报|2024.8.6–2024.8.19

  • 2 Toncoin (TON) 预计将达到 10 美元 具体时间如下

    Toncoin (TON) 成为过去 24 小时内涨幅最大的货币之一。该资产在上涨 12% 后引起了市场的关注。根据 CoinMarketCap 的数据,TON 从 6.67 美元的低点一路上涨至 7.07 美元的高点。然而,截至发稿时,该资产遭遇小幅挫折,TON 交易价格为 6.81 美元。此外,该资产在过去一个月内下跌了 6%。基于 IntoTheBlock 数据的全球资金流入和流出指标表明,

  • 3 狗狗币活跃用户增长32%,狗狗币价格会随之上涨吗?

    由于整个加密货币市场处于看跌状态,狗狗币本月的价格一直停滞不前。然而,DOGE的活跃用户仍然很高,最近增长了32%。随着模因币活动的增加,随着本月结束,其价格是否也会上涨? 根据IntoTheBlock的数据,狗狗币的每日活跃地址在过去24小时内激增了32%。DOGE附近的交易活动在缓慢的一年里保持稳定。多位加密货币专家一直困惑于为什么领先的模因币没有像竞争对手SHIB和FLOKI那样有如此大的增

  • 4 加密货币分析师表示,比特币正接近市场周期的“抛物线阶段”——这是他的时间表

    一位加密货币分析师和交易员认为,比特币(BTC)即将进入其市场周期中最具爆炸性的阶段。 这位化名Rekt Capital的分析师告诉他的81900名YouTube用户,比特币可能只需要几周时间就可以根据历史先后顺序进行为期一个月的大规模反弹。 “如果历史重演,那么在(4月15日)减半后的160天,我们将看到比特币价格从这个再积累区间突破。因此,在爆发抛物线反弹方面,已经没有多少等待的了。” 来源

  • 5 13年,13个交易技巧:分享Octa的经验——第三部分

    对于拥有全球认可许可证的金融经纪商Octa来说,13岁生日是一个激励,可以整理其在金融市场悠久而成功的历史中收集到的最有价值的知识。在一系列三篇文章中,Octa的专家为您提供了13条建议:五个一般概念、五个实用技巧和三个成功案例。以下是该系列的第三部分,也是最后一部分:Octa客户的三个真实故事,他们通过成功应用前两篇文章中描述的理论方法,在交易过程中取得了重大进展。 故事1-奥尼尼 33岁的On

  • 6 购买Render的警报?链上数据暗示反弹,但风险潜伏

    近三个月来,Render一直处于下降趋势。由于需求不足,短期买入机会可能存在风险。 Render[Render]于7月从RNDR更名,并在2023年社区投票后切换到Solana[SOL]网络。链上指标为长期投资者带来了令人痛心的消息。 交易员可以为短期价格反弹做好准备。鉴于代币背后的需求不足和整个市场的恐慌情绪,卖空可能比现在买入获得更多的利润。 悲惨的发展活动和在线参与 RENDER背后的发展活

  • 7 尽管比特币产量很高,但华尔街最大的比特币矿工面临20%的降价

    投资银行Jefferies最近的一份报告显示,与上月相比,7月份比特币(BTC)挖矿盈利能力略有下降。 分析指出,比特币价格下跌是影响矿工利润率的主要因素。因此,该机构决定将华尔街最大的比特币矿商Marathon Digital Holdings(纳斯达克股票代码:MARA)的目标价格下调20%以上。 Jefferies报告,7月份比特币矿业盈利能力下降 7月份,加密货币的价值下降了6%以上,而该

  • 8 Tether将在Aptos网络上推出USDT,承诺超低天然气费用和全球可访问性

    稳定币发行商Tether透露,计划在Aptos Network上推出与美元挂钩的Tether代币(USDT)。 根据与CryptoPotato分享的官方新闻稿,此举与Tether的更广泛战略相一致,即通过利用Aptos的生态系统,使数字货币在全球范围内更容易获得和使用。 USDT将在Aptos上首次亮相 将USDT集成到Aptos区块链上预计将带来极低的天然气费用,只需花费一分钱的一小部分。除了大

  • 9 先行者美洲:XRP表现优于数字资产开始亏损一周

    这篇文章最初发表在CoinDesk的每日通讯《First Mover》上,将加密货币市场的最新动向置于背景中。订阅以每天将其放入收件箱。 最新价格 CoinDesk 20指数:1875−2.0% 比特币(BTC):58088美元-2.9%

  • 10 Jackson Hole经济研讨会或将引发加密市场新震动

    每年夏末,全球经济界的目光都会聚焦于一个重要的盛会——杰克逊霍尔经济研讨会。这一年度盛会由堪萨斯城联邦银行主办,吸引了来自世界各地的央行官员、经济学家、金融市场参与者及媒体代表,共同探讨经济政策和市场趋势。今年的研讨会将于8月22日至24日举行,主题为“重新评估货币政策的有效性和传导性”。在经历了多年的低利率环境后,美国经济在加息超过5个百分点的背景下表现出惊人的韧性,这一现象引发了广泛的关注和讨