苹果终于也开源了 重磅发布OpenELM模型 搭载AI的iPhone就要来了

时间:2024-09-26 编辑: 浏览:(652)

就在谷歌、三星和微软继续在个人电脑和移动设备上大力推广人工智能生成技术的同时,苹果也加入了这一行列,推出了OpenELM。

这是一个全新的开源大型语言模型(LLM)系列,可以完全在单个设备上运行,而无需连接云服务器。

01.模型特点与性能

当地时间周三,OpenELM在人工智能代码社区Hugging Face上发布,它由一系列小型模型组成,旨在高效执行文本生成任务。

OpenELM共有八个模型:四个预训练模型和四个指令调整模型,涵盖从2.7亿到30亿个不同参数(参数指LLM中人工神经元之间的连接数,通常参数越多表示性能越强、功能越多)。

虽然预训练是让LLM生成连贯且可能有帮助的文本的方法,但它主要是一种预测性练习,而指令调整则是让LLM对用户的特定请求做出更相关输出的方法。

预训练可能导致模型只是用简单的文本来完成提示,例如,面对用户的提示“教我如何烤面包”,模型可能会作出“用家里的烤箱”的类似回应,而不是实际的分步指导。

苹果公司在其所谓的“示例代码许可”下提供了OpenELM模型的权重,以及不同的训练检查点、模型性能统计、预训练、评估、指令调整和参数微调等说明。

“示例代码许可证”并不禁止商业使用或修改,只是规定“如果不加修改地重新发布苹果软件的全部内容,必须在文本中保留本通知”。

苹果公司进一步指出,这些模型“没有任何安全保证”。因此,这些模型在响应用户提示时有可能产生“不准确、有害、有偏见或令人反感的输出结果”。

苹果是一家出了名的神秘和典型的“封闭”科技公司,除了在网上发布这些模型和论文之外,还没有公开宣布过其在这一领域的研究过程。

此外,早在去年的10月份,苹果公司就悄然发布了具有多模态功能的开源语言模型Ferret,成为头条新闻。

OpenELM是开源高效语言模型“Open-source Efficient Language Models”的缩写,虽然刚刚发布,尚未进行公开测试,但苹果公司在HuggingFace上的列表表明,它正将目标锁定在模型的设备应用上,就像竞争对手谷歌、三星和微软一样。

值得注意的是,微软本周刚刚发布了可完全在智能手机上运行的Phi-3 Mini模型。

02.技术细节与训练过程

苹果公司在一篇介绍该模型系列的论文中指出:OpenELM的开发“由Sachin Mehta领导,Mohammad Rastegari和Peter Zatloukal也是主要贡献者”,该模型系列“旨在授权和加强开放研究社区,促进未来的研究工作”。

OpenELM模型共有四种参数规模:2.7亿、4.5亿、11亿和30亿,每种规模都小于许多高性能模型(它们通常有大约70亿个参数),每种模型都有一个预训练和指导版本。

这些模型是在来自Reddit、维基百科、arXiv.org等网站的1.8万亿个token的公共数据集上预先训练的。

这些模型适合在商用笔记本电脑甚至某些智能手机上运行,基准测试则是在“英特尔i9-13900KF CPU、英伟达RTX 4090 GPU、Ubuntu 22.04工作站、macOS 14.4.1的MacBook Pro”上运行的。

有趣的是,新系列中的所有机型都采用了分层缩放策略,在变压器模型的每一层中分配参数。

据苹果公司称,这使它们能够在提高计算效率的同时提供更高的精度结果。同时,苹果使用新的CoreNet库对模型进行了预训练。

苹果公司在HuggingFace上指出:“我们的预训练数据集包含RefinedWeb、重复的PILE、RedPajama的一个子集和Dolma v1.6的一个子集,总计约1.8万亿个token。”

在性能方面,苹果公司分享的OpenLLM结果表明,这些模型的性能相当不错,尤其是4.5亿个参数的指示变体。

此外,拥有11亿个参数的“OpenELM变体”比拥有12亿个参数的“OLMo”高出2.36%,同时所需的预训练token减少了2倍。

OLMo是Allen人工智能研究所(AI2)最近发布的“真正开源、最先进的大型语言模型”。

03.性能测试与社区反馈

在旨在测试知识和推理能力的ARC-C基准测试中,预训练的OpenELM-3B变体的准确率为42.24%。同时,在MMLU和HellaSwag上,它的准确率分别为26.76%和73.28%。

一位已经开始测试OpenELM模型的用户指出:该模型似乎是一个“可靠的模型,但非常统一”,这意味着它的回复既没有广泛的创造性,也不可能涉足NSFW领域。

竞争对手微软最近推出的Phi-3 Mini,拥有38亿个参数和4k上下文长度,目前在这一领域处于领先地位。

根据最近分享的统计数据,OpenELM在10次ARC-C基准测试中的得分率为84.9%,在5次MMLU测试中的得分率为68.8%,在5次HellaSwag测试中的得分率为76.7%。

从长远来看,OpenELM的性能有望得到提升。

但苹果公司的开源举措已经让社区兴奋不已,我们将拭目以待社区如何在不同环境中使用OpenELM。

04.苹果的人工智能愿景

苹果公司一直对其生成式人工智能计划保持沉默,但随着新人工智能模型的发布,该公司近期的雄心似乎坚定地落在了“让人工智能在苹果设备上本地运行”的领域。

苹果公司首席执行官Tim Cook曾预告说:“人工智能生成功能将出现在苹果设备上”。并在今年2月表示,苹果公司正在该领域花费“大量的时间和精力”。不过,苹果公司尚未透露人工智能应用的具体细节。

该公司之前发布过其他人工智能模型,不过还没有像竞争对手那样发布任何用于商业用途的人工智能基础模型。

除了OpenELM,去年12月,苹果曾推出了机器学习框架MLX,该框架的理想状态是让人工智能模型更容易在苹果硅上运行。此外,还发布了一个名为MGIE的图像编辑模型,让人们通过提示来修复照片。以及一个名为Ferret-UI的模型可用于智能手机导航。

不过,即使苹果发布了这么多模型,据说该公司还是与谷歌和OpenAI进行了联系,希望将它们的模型引入苹果产品。

原文来源于:

1.https://venturebeat.com/ai/apple-releases-openelm-small-open-source-ai-models-designed-to-run-on-device/

2.https://www.theverge.com/2024/4/24/24139266/apple-ai-model-openelm-iphone-laptops-strategy

中文内容由元宇宙之心(MetaverseHub)团队编译,如需转载请联系我们。

最新 更多 >
  • 1 Shiba Inu发布关键Shibarium公告:SHIB能否在5月达到0.0001美元?

    受模因启发的流行加密货币Shiba Inu(SHIB)即将对其Shibarium平台进行重大升级。在最近的一份公告中,Shiba Inu团队透露,一把硬叉子计划于5月2日上线。 升级将引入一系列新功能。这些功能旨在增强用户体验,增强创新者和开发人员社区的能力。 硬分叉也被认为是解锁Shibarium网络下一级功能的必要更新。它还旨在提供新的价值并简化与平台的互动。 另请阅读:Dogwifhat:W

  • 2 Shiba Inu:Robinhood在纽约启用SHIB交易

    Robinhood,最受欢迎的加密货币交易所之一,终于将Shiba Inu(SHIB)添加到了其纽约客户可用的资产列表中。除了SHIB,该交易所还为其纽约客户提供了Compound(COMP)和Avalanche(AVAX)。 SHIB最初于2022年在Robinhoon上市,大约两年前。然而,由于监管问题,所有客户都无法获得该资产。尽管纽约是一个全球金融中心,但它就是这样一个客户无法交易SHI

  • 3 为什么比特币价格达到7万美元取决于ETF等

    随着ETF交易量创下新高,人们对比特币ETF的兴趣也在增长。鲸鱼的兴趣也激增,然而,BTC的价格仍然停滞不前。 比特币(BTC)在过去几天里暴跌,价格在相当长的一段时间内一直保持在64000美元左右。 机构利益 根据Santiment的数据,BTC在未来有一些积极的动向。比特币交易所买卖基金的总日交易量最近达到四周来的最高点,达到36.2亿美元。 这一活动激增包括GBTC、IBIT、FBTC、AR

  • 4 cmDeFi:由 Ethena 发起的稳定币市场纵深渗透作战

    作者:陈默 cmDeFi;来源:作者推特@cmdefi核心观点:一种加密原生的合成美元稳定币,介于中心化与去中心化之间的结构化被动收益产品,在链上保管资产并通过Delta中性保持稳定性同时赚取收益。1.诞生背景是以中心化稳定币为代表的 USDT&USDC 统治稳定币市场,去中心化稳定币DAI的抵押品逐渐趋于中心化,算法稳定币 LUNA&UST 在巨量增长至稳定币市值前五名后崩盘。Ethena的诞生

  • 5 柴犬价格暴跌 9%ETH 暴跌 5%

    截至美国东部时间上午 7:15,柴犬价格在过去 24 小时内暴跌 9%,交易价格为 0.0000248 美元,交易量猛增 19.9%,达到 8.3 亿美元。柴犬价格准备迎接另一个看涨势头 在强劲飙升至长期盘整通道上方之后,柴犬价格仍处于看涨三角旗模式内。该三角旗表明柴犬价格的看涨趋势可能会持续下去。多头已成功将 SHIB 推至三角旗形上限,表明从较低趋势线反弹。SHIBUSDT 分析。资料来源:T

  • 6 SPF META获A16z、OKx战略投资5000万美金

     SPF META是美国银河集团旗下代表性力作,是全球首条元宇宙聚合自治公链,旨在打造区块链元宇宙领域的最强聚合基础设施。SPF META是一家区块链游戏开发商,致力于推动区块链技术在游戏领域的创新应用。通过与A16z、OKx、币安实验室、火星基金、比特学院、MetaMCN、夜话Web3等多家知名加密投资机构达成深度合作。SPF META宣布成功完成5000万美元的A轮融资,由全球知名投资公司An

  • 7 探索比特币和以太坊的市场动态和鲸鱼运动-最新加密货币新闻

    在加密货币市场最近的活动激增中,大规模投资者(通常被称为“鲸鱼”)的显著波动标志着重大交易行为,尤其是在以太坊(ETH)中。链上分析师的观察表明,这些鲸鱼进行了一系列大规模收购,这表明其战略定位可能暗示了市场对当前价格点和未来估值的基本看法。 内容隐藏1以太坊吸引鲸鱼关注2以太坊价格在波动中的预测3点需要考虑 以太坊吸引了鲸鱼的注意 链上数据显示,一头以钱包标识符0x3d4命名的

  • 8 以下是自熊市底部以来比特币(BTC)价格回落的列表

    自2022年熊市以来,比特币(BTC)出现了大幅回调,在某些情况下损失了高达23%的价值。了解这些下跌的深度可以帮助投资者最大限度地提高回报,因为从下跌中反弹通常会带来可观的收益。 根据加密货币交易员兼分析师Rekt Capital的推文,随着加密货币资产恢复上升轨道,在回调约20%后积累BTC可能会为投资者带来好钱。 比特币在这个周期中的回落 2022年对BTC来说是艰难的一年,因为该资产遭受了

  • 9 曾经的“以太坊杀手”EOS大涨后大跌 为何大涨?未来走势如何?​

    (文章来源公众号:加密鱼)EOS网络是一个开源区块链平台,专注于高性能、灵活性、安全性和开发者体验。作为第三代区块链平台,EOS拥有可扩展的WebAssembly引擎,用于执行几乎免费的交易。EOS采用委托权益证明(DPoS)网络,让利益相关者选择节点运营商,确保去中心化。EOS吸引人的地方在于其技术和社区,允许开发人员构建其他区块链无法支持的项目。EOS价格昨天已上涨至0.877799美元,涨幅

  • 10 星耀共创联合坚决维护商业名誉和法定权益

                                     公开声明近日,星耀共创联合(以下简称“我司”)发现有未经授权的个体或组织冒用我司的公司名称及团队信息,声称我司团队调研考察并参与了某项目。我司郑重声明,自2023年起,星耀共创联合已全力布局人工智能领域并进行垂直投资,目前及未来一段时间内,不会参与任何人工智能领域以外的投资、合作或孵化活动。星耀共创联合及任何关联团队与非人工智能领域