从阿里巴巴到挑战Meta、OpenAI的Qwen2AI新模式

时间:2024-09-21 编辑: 浏览:(401)

中国电子商务巨头阿里巴巴是中国人工智能领域的主要参与者。今天,该公司宣布发布其最新的人工智能模型Qwen2,从某些方面来看,这是目前最好的开源选择。

Qwen2由阿里云开发,是该公司的下一代同易倩雯(Qwen)模型系列,包括同易倩雯LLM(也称为just Qwen)、视觉AI模型Qwen VL和Qwen Audio。

Qwen模型系列是针对涵盖各个行业和领域的多语言数据进行预训练的,其中Qwen-78B是该系列中最强大的模型。它是在令人印象深刻的3万亿个数据令牌上训练的。相比之下,Meta最强大的Llama-2变体基于2万亿代币。然而,Llama-3正在消化15万亿代币。

根据Qwen团队最近的一篇博客文章,Qwen2可以处理128K个上下文令牌,与OpenAI的GPT-4o相当。同时,该团队断言,Qwen2在基本上所有最重要的合成基准测试中都优于Meta的LLama3,使其成为目前可用的最佳开源模型。

然而,值得注意的是,独立的Elo Arena将Qwen2-72B-Instruct的排名略好于GPT-4.00314,但低于Llama3 70B和GPT-4.0125-preview,使其成为迄今为止人类测试人员中第二受欢迎的开源LLM。

在合成基准中,Qwen2的性能优于Llama3、Mixtral和Qwen1.5。图片:阿里云

Qwen2有五种不同的尺寸,参数从5亿到720亿不等,该版本在不同的专业领域提供了显著的改进。此外,模型使用的数据比上一版本多了27种语言,包括德语、法语、西班牙语、意大利语和俄语,以及英语和汉语。

Qwen团队在HuggingFace上的模型官方页面上声称:“与最先进的开源语言模型(包括之前发布的Qwen1.5)相比,Qwen2总体上超过了大多数开源模型,并在一系列针对语言理解、语言生成、多语言能力、编码、数学和推理的基准测试中表现出了与专有模型的竞争力。”。

Qwen2模型还显示出对长上下文的深刻理解。Qwen2-72B-Instruct可以在其庞大的环境中无错误地处理任何地方的信息提取任务,并且几乎完美地通过了“大海捞针”测试。这一点很重要,因为传统上,我们与模型的交互越多,模型性能就会开始下降。

Qwen2在“大海捞针”测试中表现突出。图片:阿里云

随着这次发布,Qwen团队也更改了其型号的许可证。虽然Qwen2-72B及其指令调优模型继续使用原来的Qianwen许可证,但所有其他模型都采用了Apache 2.0,这是开源软件世界的标准。

“在不久的将来,我们将继续开源新模式,以加速开源人工智能,”阿里云在一篇官方博客文章中表示。

Decrypt测试了该模型,发现它非常能够理解多种语言的任务。该模式也受到审查,尤其是在中国被认为敏感的主题上。这似乎与阿里巴巴的说法一致,即Qwen2是最不可能提供不安全结果的模式——无论是非法活动、欺诈、色情和隐私暴力——无论是用哪种语言提示。

此外,它对系统提示有很好的理解,这意味着所应用的条件将对其答案产生更强的影响。例如,当被告知要扮演一个有法律知识的乐于助人的助理,而不是扮演一个总是根据法律做出回应的知识渊博的律师时,对的回答显示出很大的差异。它提供的建议与GPT-4o提供的建议类似,但更为简洁。

Qwen2的回复是:“一个邻居侮辱了我” ChatGPT回复:“一个邻居侮辱了我”

该团队表示,下一次型号升级将为Qwen2 LLM带来多模态,可能将所有家族合并为一个强大的型号。他们补充道:“此外,我们将Qwen2语言模型扩展到多模式,能够理解视觉和音频信息。”。

Qwen可以通过HuggingFace Spaces进行在线测试。那些有足够计算能力在本地运行的人可以免费下载重量,也可以通过HuggingFace下载。

对于那些愿意押注开源人工智能的人来说,Qwen2模型是一个很好的选择。它比大多数其他模型有更大的代币上下文窗口,使其比Meta的LLama 3更有能力。此外,由于其许可证,其他人共享的微调版本可能会对其进行改进,从而进一步提高其分数并克服偏见。

由Ryan Ozawa编辑。

最新 更多 >
  • 1 FTX创始人SBF家族涉嫌非法用公司资金进行政治捐款

    FTX 创始人 SBF 的家族涉嫌将公司资产非法转用于政治捐款,涉及金额高达 1 亿美元。根据《华尔街日报》披露的电子邮件,SBF 的父亲 Joe Bankman 直接参与了与政治捐款相关的财务策略,母亲 Barbara Fried 和弟弟 Gabriel Bankman-Fried 也分别将资金引向进步团体和疫情防控项目。前联邦选举委员会主席 David Mason 指出,Joe Bankman

  • 2 币安将暂停AMB/BTC、IOST/BTC和LINA/BTC现货交易

    币安将于 UTC 时间 7 月 6 日 3:00 删除并停止以下现货交易对的交易:AMB/BTC、IOST/BTC、LINA/BTC。

  • 3 美股区块链股盘前暴跌MicroStrategy跌近10%

    美股盘前,区块链股大幅下挫,MicroStrategy(MSTR.O)跌近10%、CleanSpark、Riot Platforms(RIOT.O)跌超7%、Coinbase(COIN.O)跌超6%。

  • 4 某鲸鱼在Compound上的12734枚ETH借贷头寸濒临请算

    据Lookonchain监测,随着ETH价格下跌,某鲸鱼在Compound上的健康率已降至1.02。他的12,734枚ETH(3877万美元)面临清算。

  • 5 区块链金融科技公司FreeBnk完成300万美元融资,Founderheads领投

    立陶宛区块链金融科技公司 FreeBnk 宣布完成 300 万美元融资,Founderheads 领投,ChaiTech Ventures、LVT Capital、Lavender Capital 等参投。新融资将用于增强其用户界面和应用程序体验,特别是针对新用户。该公司专注于代币化 RWA 和加密金融服务,其技术以其多方计算(MPC)安全性为基础,确保对用户数字资产的保护。(Arctic Sta

  • 6 实时行情早报:SOL索拉纳价格突破136.78美元/枚,日内涨2.01%

    索拉纳SOL今日行情消息,SOL索拉纳最新价格:$136.78,24小时涨1.83%,交易量$32.34亿从k线图的解析结果来看,现在属于震荡趋势。相比05:00大幅下跌,穿破06:00的低点,比22:00有所下降。价格和交易量同时下降,表明市场活跃度减弱,买卖双方都不活跃。市场可能在等待新的驱动因素。在这种情况下,未来价格可能会继续低迷或横盘整理,直到出现新的市场消息或事件。投资者应关注市场变化

  • 7 比特币矿工在两年内向CEX转入1662亿美元,仅提取480亿美元

    CryptoQuant 分析师 joaowedson 报告称,2023 至 2024 年间,比特币矿工向中心化交易所(CEX)转入了总计 1662 亿美元的比特币,但仅提取了 480 亿美元。这一大规模的转入行为是历史上前所未有的,使得矿工成为市场上最大的比特币卖家之一。这种行为导致了市场供应过剩和需求疲软,进而对比特币价格产生了负面影响。特别是在 2024 年,大量比特币的流入可能加剧了价格的下

  • 8 RootData:三箭资本从OKX提出1593.89枚ETH,价值527.4万美元

    7月5日消息,据Web3资产数据平台RootData监测,北京时间今日11:13,三箭资本(Three Arrows Capital)从OKX提出1593.89枚ETH,价值527.4万美元。

  • 9 一地址向Mt.Gox冷钱包转入2702枚比特币,价值约合1.5479亿美元

    据Arkham监测,大约1小时前,一1L7Xbx开头地址向Mt.Gox冷钱包转入2702美枚比特币,价值约合1.5479亿美元。

  • 10 尼日利亚监狱官员确认被拘留的Binance高管健康状况良好

    尼日利亚监狱官员表示,被拘留的Binance高管Tigran Gambaryan健康状况良好。此前,Gambaryan因健康问题在法庭上晕倒,其健康状况成为Binance与尼日利亚当局法律纠纷的焦点。尽管法院有多项命令,监狱未公布Gambaryan一个月前的医疗记录,家人担忧其健康恶化。