零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新

时间:2024-10-01 编辑: 浏览:(521)

文章来源:机器之心

图片来源:由无界AI生成

在 OpenAI 发布会的前一天,来自中国的大模型公司零一万物,让开源大模型社区活跃了起来:Yi 大模型家族新成员「Yi-1.5」模型正式开源。

在项目主页可以看到,Yi-1.5 包括一系列预训练和微调模型,分为 6B、9B、34B 三个版本,采用 Apache 2.0 许可证。

GitHub 地址:https://github.com/01-ai/Yi-1.5Hugging Face 模型下载地址:https://huggingface.co/01-ai

据了解,Yi-1.5 是 Yi-1.0 的持续预训练版本,使用 500B 个 token 来提高编码、推理和指令执行能力,并在 300 万个指令调优样本上进行了精细调整。

刚一发布,就已经有开发者跃跃欲试:

并收获了好评:

与前序模型相比,Yi-1.5 系列模型进一步提升了编码、数学、推理和指令遵循能力。从下方多个基准测试结果可以看出,Yi-1.5 34B 型号的一些指标超过了 Qwen 的 72B,几乎与 Meta Llama 3 的 70B 相当。6B 和 9B 型号也成功超越了 Mistral 的 7B v0.2 版和 Gemma 的 7B 型号。

重磅消息当然不止这一个。

在成立一周年之际,零一万物宣布面向国内市场一次性发布了包含 Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark 等多款模型 API 接口,保证客户能够在不同场景下都能找到最佳性能、最具性价比的方案,Yi API Platform 英文站同步对全球开发者开放试用申请。

Yi 大模型 API 开放平台 (https://platform.lingyiwanwu.com/)

其中,千亿参数规模的 Yi-Large API 具备超强文本生成及推理性能,适用于复杂推理、预测,深度内容创作等场景,每百万 token 的价格是 20 元,是 GPT-4-turbo 的三分之一。

Yi-Large-Turbo API 则根据性能和推理速度、成本,进行了平衡性高精度调优,适用于全场景、高品质的推理及文本生成等场景。Yi-Medium API 优势在于指令遵循能力,适用于常规场景下的聊天、对话、翻译等场景;如果需要超长内容文档相关应用,也可以选用 Yi-Medium-200K API,一次性解读 20 万字不在话下;Yi-Vision API 具备高性能图片理解、分析能力,可服务基于图片的聊天、分析等场景;Yi-Spark API 则聚焦轻量化极速响应,适用于轻量化数学分析、代码生成、文本聊天等场景。

其中特别要提到的是发布会现场正式亮相的千亿参数 Yi-Large 闭源大模型。Yi-Large 面世的同时即正式进军全球 SOTA 顶级大模型之首。可以看到,与 GPT-4、Claude3 Sonnet、Gemini 1.5 Pro 以及 Llama 3-70B-Instruct 等当前顶级模型的较量中,Yi-Large 在绝大多数情况下取得了优势。

同时,在斯坦福大模型排行榜 AlpacaEval 的英语评测中,Yi-Large 达到全球大模型 Win Rate 第一。在中文通用大模型综合性基准 SuperCLUE 的中文语言理解排名中,Yi-Large 一跃成为国产大模型 No. 1。

中文能力方面,SuperCLUE 更新的四月基准表现中,Yi-Large 也位列国产大模型之首,Yi-Large 的综合中英双语能力皆展现了卓越的性能。

在发布会上,李开复还宣布,零一万物已启动下一代 Yi-XLarge MoE 模型训练,将冲击 GPT-5 的性能与创新性。从 MMLU、GPQA、HumanEval、MATH 等权威评测集中,仍在初期训练中的 Yi-XLarge MoE 已经与 Claude-3-Opus、GPT4-0409 等国际厂商的最新旗舰模型互有胜负。

Yi-XLarge 初期训练中评测(2024 年 5 月 12 日)。

至此,零一万物已经建立了「双轨模型策略」。

近期上线的一站式 AI 工作站「万知」(wanzhi.com/ 微信小程序「万知 AI」)则是零一万物基于世界领先的闭源模型 Yi-Large 所做出的「模应一体」生产力应用。

而对于大众和行业最关心的「大模型落地如何产生价值」的命题,李开复指出,国内大模型赛道的竞跑从狂奔到长跑,终局发展将取决于各个选手如何有效达到「TC-PMF」(Product-Market-Technology-Cost Fit,技术成本 X 产品市场契合度)。大模型从训练到服务都很昂贵,算力紧缺是赛道的集体挑战,行业应当共同避免陷入不理性的 ofo 式流血烧钱打法,让大模型能够用健康良性的 ROI 蓄能长跑。

在李开复博士看来,自研 AI Infra 是零一万物必然要走的路,零一万物也自成立起便将 AI Infra 设立为重要方向,着力于实现计算效率的优化。AI Infra(AI Infrastructure  人工智能基础架构技术)主要涵盖大模型训练和部署提供各种底层技术设施。这也基于一个既定事实,很多大模型公司没有美国大厂的 GPU 数量,因此要采取更务实的战术和战略。

零一万物着力于实现计算效率的优化,经过多方面优化后,零一万物千亿参数模型的训练成本同比降幅达一倍之多。

最新 更多 >
  • 1 grs币价值

    GRS币是一种加密货币,也被称为Groestlcoin。它是一种分散的数字货币,具有快速的交易速度和低廉的手续费。GRS币的价值取决于市场供求关系,也受到市场情绪和整体加密货币市场的影响。投资者可以通过交易所购买或交易GRS币,或者通过挖矿来获取这种数字资产。总的来说,GRS币的价值受多方面因素影响,而投资者应该谨慎评估这些因素以及风险。

  • 2 nft币发行数量

    NFT币发行数量是指特定的非同质化代币在市场上的总体供应量。与普通加密货币不同,NFT代币的数量通常是固定的,这意味着每种NFT代币都具有独特性和稀缺性。NFT币的发行数量在一定程度上影响着其市场价值和稀缺性,因此,发行数量通常是项目评估和投资考虑的重要因素之一。在选择NFT项目进行投资时,投资者常常会关注其发行数量并考虑这一因素对未来价值的影响。

  • 3 nexo币发行价

    Nexo币是一种加密货币,它是基于以太坊平台发行的。其发行价取决于市场供需关系,受市场情绪和投资者预期等因素影响。通常,发行价会在ICO(首次公开募集)或其他发行活动中确定,并可能会随着时间的推移而波动。在购买或投资Nexo币时,投资者应该注意市场动态,并做好风险评估。

  • 4 papel币

    Papel币是葡萄牙和巴西的一种货币,用于支付货物和服务。它是一种纸币,通常显示国家的标志和颜色。Papel币的价值取决于面值,可以用来购买各种商品和服务。它在经济交易中扮演重要角色,并在日常生活中广泛使用。

  • 5 opa币发行价

    OPA币发行价是指该数字货币在首次公开发行时的价格。它通常由团队根据市场需求、项目资金需求以及其他因素确定。发行价的高低会直接影响到项目的估值和投资者的购买欲望。在选择投资数字货币时,投资者需要考虑发行价是否合理,并结合项目背景、技术实力等因素进行综合评估。

  • 6 orbs币价格

    orbs币是一种加密货币,它是以太坊平台上的一个代币。目前的价格波动较大,受市场需求和供应影响。投资者应该密切关注市场动态,并根据自身风险承受能力做出合理的投资决策。

  • 7 gog是什么币

    GOG是一种加密货币,类似于比特币和以太坊。它是一种用于数字货币交易和区块链技术的数字资产。GOG币的发行量是有限的,具有去中心化、匿名性和安全性等特点。它可以用于在线购物、投资和交易等多种用途。GOG币的价值取决于市场需求和供应情况。

  • 8 musk币发行价

    Musk币的发行价是指其在市场上首次发行时的价格。这个价格一般由项目方或市场参与者确定,并可能受到多种因素的影响,比如项目的热度、团队的实力、市场的预期等等。Musk币的发行价一般会在项目白皮书中公布,并且可能会在开售时有所浮动。作为投资者,了解和关注Musk币的发行价可以帮助我们更好地评估其潜在价值和风险,从而做出明智的投资决策。

  • 9 olny币

    olny币是一个基于区块链技术的加密数字货币,旨在为用户提供安全、快速、低成本的交易方式。olny币的区块链技术保证了交易的透明性和不可篡改性,同时也确保了用户个人信息的隐私和安全。使用olny币可以方便地进行跨境交易、支付和转账,而且不受汇率和地域限制。olny币的发行总量有限,具有稀缺性和保值潜力。总的来说,olny币是一种安全、快速、便捷的数字货币,为用户提供了新的支付和投资选择。

  • 10 musk币发行价

    Musk币是由一位自称为“马斯克”的匿名人士发行的加密货币,其发行价是在私人交易市场上以未公开的价格进行的。这个项目的目标是建立一个与伊隆·马斯克相关的数字资产,以利用他在科技和商业领域的影响力和知名度。尽管这个项目备受争议,但Musk币的发行价仍在持续波动,并吸引了一些投资者的关注。