苹果重磅开源 OpenELM模型引领AI新纪元 搭载智能引擎的iPhone即将问世

时间:2024-09-21 编辑: 浏览:(804)

来源:元宇宙之心

就在谷歌、三星和微软继续在个人电脑和移动设备上大力推广人工智能生成技术的同时,苹果也加入了这一行列,推出了OpenELM。

这是一个全新的开源大型语言模型(LLM)系列,可以完全在单个设备上运行,而无需连接云服务器。

01.模型特点与性能

当地时间周三,OpenELM在人工智能代码社区Hugging Face上发布,它由一系列小型模型组成,旨在高效执行文本生成任务。

OpenELM共有八个模型:四个预训练模型和四个指令调整模型,涵盖从2.7亿到30亿个不同参数(参数指LLM中人工神经元之间的连接数,通常参数越多表示性能越强、功能越多)。

虽然预训练是让LLM生成连贯且可能有帮助的文本的方法,但它主要是一种预测性练习,而指令调整则是让LLM对用户的特定请求做出更相关输出的方法。

预训练可能导致模型只是用简单的文本来完成提示,例如,面对用户的提示“教我如何烤面包”,模型可能会作出“用家里的烤箱”的类似回应,而不是实际的分步指导。

苹果公司在其所谓的“示例代码许可”下提供了OpenELM模型的权重,以及不同的训练检查点、模型性能统计、预训练、评估、指令调整和参数微调等说明。

“示例代码许可证”并不禁止商业使用或修改,只是规定“如果不加修改地重新发布苹果软件的全部内容,必须在文本中保留本通知”。

苹果公司进一步指出,这些模型“没有任何安全保证”。因此,这些模型在响应用户提示时有可能产生“不准确、有害、有偏见或令人反感的输出结果”。

苹果是一家出了名的神秘和典型的“封闭”科技公司,除了在网上发布这些模型和论文之外,还没有公开宣布过其在这一领域的研究过程。

此外,早在去年的10月份,苹果公司就悄然发布了具有多模态功能的开源语言模型Ferret,成为头条新闻。

OpenELM是开源高效语言模型“Open-source Efficient Language Models”的缩写,虽然刚刚发布,尚未进行公开测试,但苹果公司在HuggingFace上的列表表明,它正将目标锁定在模型的设备应用上,就像竞争对手谷歌、三星和微软一样。

值得注意的是,微软本周刚刚发布了可完全在智能手机上运行的Phi-3 Mini模型。

02.技术细节与训练过程

苹果公司在一篇介绍该模型系列的论文中指出:OpenELM的开发“由Sachin Mehta领导,Mohammad Rastegari和Peter Zatloukal也是主要贡献者”,该模型系列“旨在授权和加强开放研究社区,促进未来的研究工作”。

OpenELM模型共有四种参数规模:2.7亿、4.5亿、11亿和30亿,每种规模都小于许多高性能模型(它们通常有大约70亿个参数),每种模型都有一个预训练和指导版本。

这些模型是在来自Reddit、维基百科、arXiv.org等网站的1.8万亿个token的公共数据集上预先训练的。

这些模型适合在商用笔记本电脑甚至某些智能手机上运行,基准测试则是在“英特尔i9-13900KF CPU、英伟达RTX 4090 GPU、Ubuntu 22.04工作站、macOS 14.4.1的MacBook Pro”上运行的。

有趣的是,新系列中的所有机型都采用了分层缩放策略,在变压器模型的每一层中分配参数。

据苹果公司称,这使它们能够在提高计算效率的同时提供更高的精度结果。同时,苹果使用新的CoreNet库对模型进行了预训练。

苹果公司在HuggingFace上指出:“我们的预训练数据集包含RefinedWeb、重复的PILE、RedPajama的一个子集和Dolma v1.6的一个子集,总计约1.8万亿个token。”

在性能方面,苹果公司分享的OpenLLM结果表明,这些模型的性能相当不错,尤其是4.5亿个参数的指示变体。

此外,拥有11亿个参数的“OpenELM变体”比拥有12亿个参数的“OLMo”高出2.36%,同时所需的预训练token减少了2倍。

OLMo是Allen人工智能研究所(AI2)最近发布的“真正开源、最先进的大型语言模型”。

03.性能测试与社区反馈

在旨在测试知识和推理能力的ARC-C基准测试中,预训练的OpenELM-3B变体的准确率为42.24%。同时,在MMLU和HellaSwag上,它的准确率分别为26.76%和73.28%。

一位已经开始测试OpenELM模型的用户指出:该模型似乎是一个“可靠的模型,但非常统一”,这意味着它的回复既没有广泛的创造性,也不可能涉足NSFW领域。

竞争对手微软最近推出的Phi-3 Mini,拥有38亿个参数和4k上下文长度,目前在这一领域处于领先地位。

根据最近分享的统计数据,OpenELM在10次ARC-C基准测试中的得分率为84.9%,在5次MMLU测试中的得分率为68.8%,在5次HellaSwag测试中的得分率为76.7%。

从长远来看,OpenELM的性能有望得到提升。

但苹果公司的开源举措已经让社区兴奋不已,我们将拭目以待社区如何在不同环境中使用OpenELM。

04.苹果的人工智能愿景

苹果公司一直对其生成式人工智能计划保持沉默,但随着新人工智能模型的发布,该公司近期的雄心似乎坚定地落在了“让人工智能在苹果设备上本地运行”的领域。

苹果公司首席执行官Tim Cook曾预告说:“人工智能生成功能将出现在苹果设备上”。并在今年2月表示,苹果公司正在该领域花费“大量的时间和精力”。不过,苹果公司尚未透露人工智能应用的具体细节。

该公司之前发布过其他人工智能模型,不过还没有像竞争对手那样发布任何用于商业用途的人工智能基础模型。

除了OpenELM,去年12月,苹果曾推出了机器学习框架MLX,该框架的理想状态是让人工智能模型更容易在苹果硅上运行。此外,还发布了一个名为MGIE的图像编辑模型,让人们通过提示来修复照片。以及一个名为Ferret-UI的模型可用于智能手机导航。

不过,即使苹果发布了这么多模型,据说该公司还是与谷歌和OpenAI进行了联系,希望将它们的模型引入苹果产品。

最新 更多 >
  • 1 马思克和狗狗币哪个好

    马思克与狗狗币:哪个更好?近年来,加密货币市场越来越受到人们的关注。马思克(MuskCoin)和狗狗币(Dogecoin)作为其中的两个热门币种,备受投资者们的追捧。那么,它们之间究竟哪个更好呢?本文将比较这两个币种的优劣,以帮助读者做出更明智的投资决策。市值与知名度马思克作为以马斯克(Elon Musk)为名的加密货币,一经推出便引起了巨大的关注和热议。而狗狗币则是由一个互联网梗而来,其将可爱的

  • 2 fil币和狗狗币哪个好最近

    Fil币和狗狗币哪个好?在加密货币市场上,有许多不同的数字货币可以选择。而Fil币(Filecoin)和狗狗币(Dogecoin)是近期备受关注的两个。那么,在这两者之间,哪一个更加优秀呢?本文将会从技术、应用和市场前景等方面进行分析比较。技术和性能Fil币是一个去中心化存储和分发系统,旨在为全球用户提供安全、高效的数据存储和检索服务。它采用了一种名为IPFS(InterPlanetary Fil

  • 3 柚子币和狗狗币哪个有前景

    柚子币和狗狗币哪个有前景近年来,数字货币市场发展迅猛,各种新的币种层出不穷。其中,柚子币(Ethereum)和狗狗币(Dogecoin)是两个备受关注的币种。它们各自都有其独特的特点和前景。接下来,我们将就柚子币和狗狗币进行比较,探讨它们的发展前景。柚子币(Ethereum)柚子币(Ethereum)是一个去中心化平台,可以在其上运行智能合约。它的目标是成为一种全球性的计算机,通过去中心化的方式实

  • 4 hmq币是什么?hmq币最近行情如何?

    什么是HMQ币?HMQ币(Humaniq Coin)是一种基于以太坊区块链技术的加密货币。Humaniq是一个旨在通过区块链技术改善全球未银行化人口的金融状况的项目,而HMQ币是Humaniq项目的内部代币。该项目旨在为全球未银行化人口提供金融服务,让他们拥有可扩展的银行服务、身份验证和借贷能力,以在全球范围内获得更好的金融自由和帮助。HMQ币的最近行情由于加密货币市场的波动性,HMQ币的价格也会

  • 5 zuc币是什么?zuc币最近行情如何?

    什么是ZUC币?ZUC币是一种虚拟货币,简称ZUC。它基于区块链技术,由中国人民政治协商会议浙江大学委员会发行和管理。ZUC币起初是为了满足浙江大学校内交易和奖励系统的需求而创建的。然而,随着数字货币市场的发展,ZUC币逐渐引起了广泛关注,并被投资者作为一种潜在投资资产。ZUC币最近行情如何?近期,ZUC币的价格经历了一些波动。根据币界网APP的数据,截至最新报告,ZUC币的价格为X美元。在过去一

  • 6 FIL币和狗狗币哪个更值得买

    比特币和狗狗币:哪个更值得买?当提到加密货币时,比特币(FIL币)和狗狗币可能是最为人熟知的两个数字货币之一。虽然它们都有自己的优势和特点,但是在购买之前我们需要明确它们的差异和投资潜力。比特币(FIL币):力争成为数字黄金比特币是最早被认可的加密货币之一,自2009年面世以来,比特币一直以其安全性和无国界的交易特性而备受关注。比特币的总供应量有限,这使得它在市场上的价格一直有所增长,从而使得它成

  • 7 mnj币是什么?mnj币最近行情如何?

    MNJ币是什么?MNJ币是一种加密数字货币,于近年来迅速崛起。作为区块链技术的一种应用,MNJ币在数字货币领域中扮演着重要角色。MNJ币的出现让人们有了更多投资和交易的选择,并为区块链技术的发展提供了新的机会。MNJ币的特点MNJ币具有以下特点: 去中心化:MNJ币由区块链技术支持,没有集中的管理机构,所有的交易都被保存在区块链上,可公开查阅。 匿名性:MNJ币的交易记录只显示币的地址,不会直

  • 8 fil币和狗狗币哪个好合法

    FIL币和狗狗币哪个更好合法?在加密货币市场中,有很多种数字货币供投资者选择。其中,FIL币和狗狗币是两个备受关注的币种。然而,投资者在选择时往往关心的是哪个更好合法。在本文中,我们将对这两种币进行对比,以帮助投资者做出明智的决策。FIL币的合法性FIL币,全名为Filecoin,是一个去中心化的存储和分发系统。它的目标是为全球用户提供安全、高效的文件存储和共享服务。Filecoin的开发团队拥有

  • 9 ICP币是什么?ICP币最近行情如何?

    ICP币是什么?ICP币全称为Internet Computer Protocol,是一种基于互联网计算机协议的加密货币。它是互联网计算机项目的核心代币,旨在构建一个分布式的计算网络,提供去中心化的互联网基础架构。ICP币的目标是将互联网作为一个整体操作系统,实现去中心化的应用程序和服务。它通过将计算资源和存储分布在全球各地的节点上,实现了更高级别、更高效的互联网应用程序的开发和部署。ICP币最近

  • 10 yho币是什么?yho币最近行情如何?

    什么是YHO币?YHO币是一种虚拟货币,是由YHO基金会发行的。与传统货币不同,YHO币是基于区块链技术的加密数字货币,可以实现快速、安全和匿名的交易。YHO币的发行总量有限,采用了去中心化的原则,使得YHO币的价值相对稳定。此外,YHO币还支持智能合约技术,可以用于构建去中心化应用程序和平台。YHO币最近的行情如何?YHO币在最近的时间里,呈现了较为稳定的上涨趋势。根据数据显示,最近一周YHO币