苹果终于也开源了 重磅发布OpenELM模型 搭载AI的iPhone就要来了

时间:2024-09-22 编辑: 浏览:(498)

就在谷歌、三星和微软继续在个人电脑和移动设备上大力推广人工智能生成技术的同时,苹果也加入了这一行列,推出了OpenELM。

这是一个全新的开源大型语言模型(LLM)系列,可以完全在单个设备上运行,而无需连接云服务器。

01.模型特点与性能

当地时间周三,OpenELM在人工智能代码社区Hugging Face上发布,它由一系列小型模型组成,旨在高效执行文本生成任务。

OpenELM共有八个模型:四个预训练模型和四个指令调整模型,涵盖从2.7亿到30亿个不同参数(参数指LLM中人工神经元之间的连接数,通常参数越多表示性能越强、功能越多)。

虽然预训练是让LLM生成连贯且可能有帮助的文本的方法,但它主要是一种预测性练习,而指令调整则是让LLM对用户的特定请求做出更相关输出的方法。

预训练可能导致模型只是用简单的文本来完成提示,例如,面对用户的提示“教我如何烤面包”,模型可能会作出“用家里的烤箱”的类似回应,而不是实际的分步指导。

苹果公司在其所谓的“示例代码许可”下提供了OpenELM模型的权重,以及不同的训练检查点、模型性能统计、预训练、评估、指令调整和参数微调等说明。

“示例代码许可证”并不禁止商业使用或修改,只是规定“如果不加修改地重新发布苹果软件的全部内容,必须在文本中保留本通知”。

苹果公司进一步指出,这些模型“没有任何安全保证”。因此,这些模型在响应用户提示时有可能产生“不准确、有害、有偏见或令人反感的输出结果”。

苹果是一家出了名的神秘和典型的“封闭”科技公司,除了在网上发布这些模型和论文之外,还没有公开宣布过其在这一领域的研究过程。

此外,早在去年的10月份,苹果公司就悄然发布了具有多模态功能的开源语言模型Ferret,成为头条新闻。

OpenELM是开源高效语言模型“Open-source Efficient Language Models”的缩写,虽然刚刚发布,尚未进行公开测试,但苹果公司在HuggingFace上的列表表明,它正将目标锁定在模型的设备应用上,就像竞争对手谷歌、三星和微软一样。

值得注意的是,微软本周刚刚发布了可完全在智能手机上运行的Phi-3 Mini模型。

02.技术细节与训练过程

苹果公司在一篇介绍该模型系列的论文中指出:OpenELM的开发“由Sachin Mehta领导,Mohammad Rastegari和Peter Zatloukal也是主要贡献者”,该模型系列“旨在授权和加强开放研究社区,促进未来的研究工作”。

OpenELM模型共有四种参数规模:2.7亿、4.5亿、11亿和30亿,每种规模都小于许多高性能模型(它们通常有大约70亿个参数),每种模型都有一个预训练和指导版本。

这些模型是在来自Reddit、维基百科、arXiv.org等网站的1.8万亿个token的公共数据集上预先训练的。

这些模型适合在商用笔记本电脑甚至某些智能手机上运行,基准测试则是在“英特尔i9-13900KF CPU、英伟达RTX 4090 GPU、Ubuntu 22.04工作站、macOS 14.4.1的MacBook Pro”上运行的。

有趣的是,新系列中的所有机型都采用了分层缩放策略,在变压器模型的每一层中分配参数。

据苹果公司称,这使它们能够在提高计算效率的同时提供更高的精度结果。同时,苹果使用新的CoreNet库对模型进行了预训练。

苹果公司在HuggingFace上指出:“我们的预训练数据集包含RefinedWeb、重复的PILE、RedPajama的一个子集和Dolma v1.6的一个子集,总计约1.8万亿个token。”

在性能方面,苹果公司分享的OpenLLM结果表明,这些模型的性能相当不错,尤其是4.5亿个参数的指示变体。

此外,拥有11亿个参数的“OpenELM变体”比拥有12亿个参数的“OLMo”高出2.36%,同时所需的预训练token减少了2倍。

OLMo是Allen人工智能研究所(AI2)最近发布的“真正开源、最先进的大型语言模型”。

03.性能测试与社区反馈

在旨在测试知识和推理能力的ARC-C基准测试中,预训练的OpenELM-3B变体的准确率为42.24%。同时,在MMLU和HellaSwag上,它的准确率分别为26.76%和73.28%。

一位已经开始测试OpenELM模型的用户指出:该模型似乎是一个“可靠的模型,但非常统一”,这意味着它的回复既没有广泛的创造性,也不可能涉足NSFW领域。

竞争对手微软最近推出的Phi-3 Mini,拥有38亿个参数和4k上下文长度,目前在这一领域处于领先地位。

根据最近分享的统计数据,OpenELM在10次ARC-C基准测试中的得分率为84.9%,在5次MMLU测试中的得分率为68.8%,在5次HellaSwag测试中的得分率为76.7%。

从长远来看,OpenELM的性能有望得到提升。

但苹果公司的开源举措已经让社区兴奋不已,我们将拭目以待社区如何在不同环境中使用OpenELM。

04.苹果的人工智能愿景

苹果公司一直对其生成式人工智能计划保持沉默,但随着新人工智能模型的发布,该公司近期的雄心似乎坚定地落在了“让人工智能在苹果设备上本地运行”的领域。

苹果公司首席执行官Tim Cook曾预告说:“人工智能生成功能将出现在苹果设备上”。并在今年2月表示,苹果公司正在该领域花费“大量的时间和精力”。不过,苹果公司尚未透露人工智能应用的具体细节。

该公司之前发布过其他人工智能模型,不过还没有像竞争对手那样发布任何用于商业用途的人工智能基础模型。

除了OpenELM,去年12月,苹果曾推出了机器学习框架MLX,该框架的理想状态是让人工智能模型更容易在苹果硅上运行。此外,还发布了一个名为MGIE的图像编辑模型,让人们通过提示来修复照片。以及一个名为Ferret-UI的模型可用于智能手机导航。

不过,即使苹果发布了这么多模型,据说该公司还是与谷歌和OpenAI进行了联系,希望将它们的模型引入苹果产品。

原文来源于:

1.https://venturebeat.com/ai/apple-releases-openelm-small-open-source-ai-models-designed-to-run-on-device/

2.https://www.theverge.com/2024/4/24/24139266/apple-ai-model-openelm-iphone-laptops-strategy

中文内容由元宇宙之心(MetaverseHub)团队编译,如需转载请联系我们。

最新 更多 >
  • 1 晚间必读5篇 | “三链合一” 被低估的Babylon

    1.TON会成为第一个10亿级用户的区块链吗?我们将在本文深入探讨一下TON。对于一个当前排名前十的代币,我仍然觉得大多数人都不了解这个区块链都发生了什么。加密货币领域最老牌基金Pantera最近宣布,他们对TON进行了其有史以来最大规模的投资。点击阅读2.为什么比特币需要Layer 2?L2发展现状如何?Ordinals、Runes 和 BRC-20 等新原语正在占据中心舞台。 这标志着比特币生

  • 2 分析师:100倍回报的日子一去不返 山寨币季节还会出现吗?

    作者:Ciaran Lyons,CoinTelegraph;编译:邓通,加密货币分析师表示,山寨币的高风险、高回报理论可能会倾向于前者,因为推动加密货币市场的薄弱叙述,现在不太可能获得大幅收益。10xResearch 研究主管 Markus Thielen 指出:“虽然存在战术机会,但 100 倍回报的时代可能已经过去了。”他警告说,市场预计今年山寨币牛市,“散户参与仍然低迷,而且几乎没有出现能够

  • 3 美国失业索赔报告发布后加密货币市场下跌

    美国最新失业救济申请报告发布后,加密货币市场周四上午小幅下跌。 劳工部报告称,与前一周相比,失业救济申请人数有所减少,5月12日当周达到22.2万人,略高于道琼斯预测的22万人。 比特币(BTC)的交易价格为65600美元,在过去24小时内上涨了1%。根据CoinGecko的数据,以太币(ETH)跌至3000美元以下,而索拉纳币(SOL)飙升了近5%。 BTC价格 失业申请人数减少通常被视为经济

  • 4 Arweave与AR.IO: AO 背后的两个 DePINs

    来源:PermaDAOAO 计算机是建立在 Arweave 之上的超级计算机。它通过将 Erlang 式的并发性与去中心化存储相结合,创造了可以扩展的并行计算。在 AO 中,水平扩展的新世界等待着我们去探索,但如果没有支撑 AO 的一对 DePIN(去中心化物理基础设施网络)项目,这一切都不可能实现。探索 Arweave 和 AR.IO。Arweave 的永久数据协议构建在一个由去中心化节点组成的

  • 5 Vitalik:改善以太坊网络的免许可性和去中心化的未来

    作者:Vitalik;编译:邓通,特别感谢 Dankrad Feist、Caspar Schwarz-Schilling 和 Francesco 的快速反馈和审查。我坐在这里写这篇文章是在肯尼亚以太坊开发者互操作的最后一天,我们在实施和解决即将到来的重要以太坊改进的技术细节方面取得了很大进展,最引人注目的是 PeerDAS、Verkle 树过渡和去中心化方法在 EIP 4444 的背景下存储历史记

  • 6 香港试用中国e-CNY

    香港作为充满活力的亚洲金融中心,在数字货币的未来迈出了一大步。中国推出了电子人民币(e-CNY)试点计划,让香港居民能够试用这种新型金融工具。这不仅仅是一种新的支付方式;这是中国将人民币推向全球舞台的雄心的战略发射台。 对于香港居民来说,打开e-CNY钱包非常简单。他们只需要一个本地电话号码。为这些钱包充值同样无缝,反映了人们熟悉的向数字钱包应用程序添加资金的过程。这种用户友好性可能是采用的关键驱

  • 7 进入 Evermore Knights,开启全新 Play and Earn 冒险

    Evermore Knights (永恒骑士)是一款回合制的 JRPG 游戏,玩家需要在游戏中的 Temeris 大陆中进行充满未知和刺激的冒险,完成至关重要的特殊任务,带领团队探寻终极答案。EvermoreKnights 在 Google Play 的下载次数已经突破28万次,拥有大量的忠实玩家。下载链接:详见官网 丰富的角色,有趣的故事,个性化定制 丰富角色:遇到Grana、Mammon、Cu

  • 8 Irgang Group宣布在Union Lake Crossing新租赁46000 S/F,将新泽西州米尔维尔电力中心的租赁率推高至98%

    最新签约包括Old Navy、Skechers、Inspira Health、Rally House、Five Guys、Poke Bros.和Crumbl 新泽西州米尔维尔,2024年5月17日/PRNewswire/-Irgang集团在联合湖交叉口签署了一系列总计46000平方英尺的新租约。此前,Irgang签署了6.1万平方英尺的新租约,使393000平方英尺电力中心的租赁空间比例达到约98

  • 9 OpenOS:灵活且高度可定制可扩展的开源开放共识操作系统

    在信息互联网,我们都了解Windows、linux、MacOS、Android等单机操作系统。在价值互联网世界里,同样需要各种操作系统,比如BitcoinCore、Geth、Solana。区别于传统单机操作系统,Web3操作系统的特征是网络化、去中心化、数据透明、公共治理。开放实验室,Open Laboratry,秉承开放的精神,基于当前的区块链技术、代码、产品,组合和创新出新的web3操作系统,

  • 10 Andrew Tate计划对比特币进行重大投资-COINTURK NEWS

    比特币(BTC)piyasada kabul edilebilecek olan tek para ve yatırım seçeneği olduğunu belirtmesinden kısa bir süre sonra,sosyal medyanınönemli isimlerinden,eski professiones yonel kick boksçu Andrew Tate,iti