苹果终于也开源了 重磅发布OpenELM模型 搭载AI的iPhone就要来了

时间:2024-09-25 编辑: 浏览:(286)

就在谷歌、三星和微软继续在个人电脑和移动设备上大力推广人工智能生成技术的同时,苹果也加入了这一行列,推出了OpenELM。

这是一个全新的开源大型语言模型(LLM)系列,可以完全在单个设备上运行,而无需连接云服务器。

01.模型特点与性能

当地时间周三,OpenELM在人工智能代码社区Hugging Face上发布,它由一系列小型模型组成,旨在高效执行文本生成任务。

OpenELM共有八个模型:四个预训练模型和四个指令调整模型,涵盖从2.7亿到30亿个不同参数(参数指LLM中人工神经元之间的连接数,通常参数越多表示性能越强、功能越多)。

虽然预训练是让LLM生成连贯且可能有帮助的文本的方法,但它主要是一种预测性练习,而指令调整则是让LLM对用户的特定请求做出更相关输出的方法。

预训练可能导致模型只是用简单的文本来完成提示,例如,面对用户的提示“教我如何烤面包”,模型可能会作出“用家里的烤箱”的类似回应,而不是实际的分步指导。

苹果公司在其所谓的“示例代码许可”下提供了OpenELM模型的权重,以及不同的训练检查点、模型性能统计、预训练、评估、指令调整和参数微调等说明。

“示例代码许可证”并不禁止商业使用或修改,只是规定“如果不加修改地重新发布苹果软件的全部内容,必须在文本中保留本通知”。

苹果公司进一步指出,这些模型“没有任何安全保证”。因此,这些模型在响应用户提示时有可能产生“不准确、有害、有偏见或令人反感的输出结果”。

苹果是一家出了名的神秘和典型的“封闭”科技公司,除了在网上发布这些模型和论文之外,还没有公开宣布过其在这一领域的研究过程。

此外,早在去年的10月份,苹果公司就悄然发布了具有多模态功能的开源语言模型Ferret,成为头条新闻。

OpenELM是开源高效语言模型“Open-source Efficient Language Models”的缩写,虽然刚刚发布,尚未进行公开测试,但苹果公司在HuggingFace上的列表表明,它正将目标锁定在模型的设备应用上,就像竞争对手谷歌、三星和微软一样。

值得注意的是,微软本周刚刚发布了可完全在智能手机上运行的Phi-3 Mini模型。

02.技术细节与训练过程

苹果公司在一篇介绍该模型系列的论文中指出:OpenELM的开发“由Sachin Mehta领导,Mohammad Rastegari和Peter Zatloukal也是主要贡献者”,该模型系列“旨在授权和加强开放研究社区,促进未来的研究工作”。

OpenELM模型共有四种参数规模:2.7亿、4.5亿、11亿和30亿,每种规模都小于许多高性能模型(它们通常有大约70亿个参数),每种模型都有一个预训练和指导版本。

这些模型是在来自Reddit、维基百科、arXiv.org等网站的1.8万亿个token的公共数据集上预先训练的。

这些模型适合在商用笔记本电脑甚至某些智能手机上运行,基准测试则是在“英特尔i9-13900KF CPU、英伟达RTX 4090 GPU、Ubuntu 22.04工作站、macOS 14.4.1的MacBook Pro”上运行的。

有趣的是,新系列中的所有机型都采用了分层缩放策略,在变压器模型的每一层中分配参数。

据苹果公司称,这使它们能够在提高计算效率的同时提供更高的精度结果。同时,苹果使用新的CoreNet库对模型进行了预训练。

苹果公司在HuggingFace上指出:“我们的预训练数据集包含RefinedWeb、重复的PILE、RedPajama的一个子集和Dolma v1.6的一个子集,总计约1.8万亿个token。”

在性能方面,苹果公司分享的OpenLLM结果表明,这些模型的性能相当不错,尤其是4.5亿个参数的指示变体。

此外,拥有11亿个参数的“OpenELM变体”比拥有12亿个参数的“OLMo”高出2.36%,同时所需的预训练token减少了2倍。

OLMo是Allen人工智能研究所(AI2)最近发布的“真正开源、最先进的大型语言模型”。

03.性能测试与社区反馈

在旨在测试知识和推理能力的ARC-C基准测试中,预训练的OpenELM-3B变体的准确率为42.24%。同时,在MMLU和HellaSwag上,它的准确率分别为26.76%和73.28%。

一位已经开始测试OpenELM模型的用户指出:该模型似乎是一个“可靠的模型,但非常统一”,这意味着它的回复既没有广泛的创造性,也不可能涉足NSFW领域。

竞争对手微软最近推出的Phi-3 Mini,拥有38亿个参数和4k上下文长度,目前在这一领域处于领先地位。

根据最近分享的统计数据,OpenELM在10次ARC-C基准测试中的得分率为84.9%,在5次MMLU测试中的得分率为68.8%,在5次HellaSwag测试中的得分率为76.7%。

从长远来看,OpenELM的性能有望得到提升。

但苹果公司的开源举措已经让社区兴奋不已,我们将拭目以待社区如何在不同环境中使用OpenELM。

04.苹果的人工智能愿景

苹果公司一直对其生成式人工智能计划保持沉默,但随着新人工智能模型的发布,该公司近期的雄心似乎坚定地落在了“让人工智能在苹果设备上本地运行”的领域。

苹果公司首席执行官Tim Cook曾预告说:“人工智能生成功能将出现在苹果设备上”。并在今年2月表示,苹果公司正在该领域花费“大量的时间和精力”。不过,苹果公司尚未透露人工智能应用的具体细节。

该公司之前发布过其他人工智能模型,不过还没有像竞争对手那样发布任何用于商业用途的人工智能基础模型。

除了OpenELM,去年12月,苹果曾推出了机器学习框架MLX,该框架的理想状态是让人工智能模型更容易在苹果硅上运行。此外,还发布了一个名为MGIE的图像编辑模型,让人们通过提示来修复照片。以及一个名为Ferret-UI的模型可用于智能手机导航。

不过,即使苹果发布了这么多模型,据说该公司还是与谷歌和OpenAI进行了联系,希望将它们的模型引入苹果产品。

原文来源于:

1.https://venturebeat.com/ai/apple-releases-openelm-small-open-source-ai-models-designed-to-run-on-device/

2.https://www.theverge.com/2024/4/24/24139266/apple-ai-model-openelm-iphone-laptops-strategy

中文内容由元宇宙之心(MetaverseHub)团队编译,如需转载请联系我们。

最新 更多 >
  • 1 另一个与Deltec和Tether有关的中国洗钱计划

    根据司法部周五的一份公告,两名中国公民李达仁和张毅成被控利用Tether和加密货币友好型银行Deltec进行洗钱和电信诈骗,金额达7300万美元。根据一份宣誓书,这两人于4月在洛杉矶和亚特兰大被捕,他们参与了杀猪和诈骗活动,通过“汇款员、没有合法商业目的的金融交易和空壳账户”转移资产。具体而言,李和张利用一家名为CMD进出口的空壳公司将现金转移到对加密货币友好的巴哈马Deltec银行和信托。然后在

  • 2 Creality的人道主义努力在巴西洪灾救援中大放异彩

    巴西卡诺斯,2024年5月20日/PRNewswire/-在巴西南里奥格兰德州努力应对毁灭性洪水的后果之际,3D打印技术的全球领导者Creality与受影响的社区站在一起,在他们需要的时候伸出援手。 巴西政府报告称,这场灾难的规模令人清醒:107人丧生,134人失踪,754人需要医疗护理,396000人流离失所,68000人在公共避难所避难。总共有170万人深受这场灾难的影响。 为了应对形势的

  • 3 破产加密货币贷款人Genesis同意20亿美元和解以偿还用户

    纽约州总检察长办公室周一宣布,已与数字货币集团(DCG)旗下的加密货币贷款机构Genesis达成20亿美元的和解,以偿还受其2023年破产申请影响的用户。 据《华尔街日报》报道,该计划于周五晚些时候获得批准,显然将向用户偿还他们为公司提供的约77%的加密资金,以换取收益。 纽约州总检察长Letitia James表示:“当投资者因欺诈和操纵而遭受损失时,他们应该得到补偿。”。“这一历史性的和解是朝

  • 4 帕吉特总统罗杰·哈里斯在国会作证

    呼吁改变《小企业透明度法》的实施方式 华盛顿,2024年5月20日/PRNewswire/-北美税务和会计特许经营公司Padgett的总裁罗杰·哈里斯本月在众议院小企业委员会作证。哈里斯被要求在题为“显微镜下:审查FinCEN对《企业透明度法》的实施”的全体委员会听证会上就小企业的观点发表讲话 哈里斯代表帕吉特的公司所有者和小企业客户出席此次听证会的目的是帮助澄清当前根据2021年《企业透明度

  • 5 Fibank推出全新专属万事达白金第一夫人卡

    保加利亚索菲亚,2024年5月20日/PRNewswire/-Fibank与万事达®合作,在保加利亚推出了新的万事达®白金第一夫人信用卡。这张专属卡是一款新一代产品,采用个性化的方法开发,并理解现代女士的需求:充满活力、雄心勃勃、随时待命。 来自Fibank的Mastercard®白金第一夫人将尖端技术与信用卡的便利性和安全性完美结合。 持有新卡的女士将享有多项特权,包括: 第一年不收取年费

  • 6 Raptive聘请备受尊敬的文化营销主管Dana Storm Santiago领导Raptive代表

    Santiago将在Raptive排名第一的多元化内容中将品牌与创作者联系起来 纽约,2024年5月20日/PRNewswire/-Raptive今天宣布任命Dana Storm Santiago为包容性伙伴关系副总裁。在这一新职位上,Santiago将领导Raptive Representations,这是该公司通过与BOMESI和MAVEN的战略合作伙伴关系,将Raptive的多元化创作者和出

  • 7 GameStop价格预测:在Keith Gill回归后,GME以85%的抽成率强势回归,这款AI Meme币的价格飙升至300万美元

    截至美国东部时间凌晨04:20,GameStop的价格在过去24小时内飙升58%,达到0.007611美元,交易量飙升74%,达到8300万美元。这一进展是在2021年GameStop传奇的名义领袖Keith Gill于5月13日在互联网上露面之后发生的。Gill化名“Roaring Kitty”,三年来首次在X上发布了几段视频,在其冷却之前引发了GME的飙升。根据GeckoTerminal的数据

  • 8 三亚纪念海南FTP成立六周年,承诺提升全球旅游影响力

    中国三亚,2024年5月20日/PRNewswire/-在三亚纪念海南自由贸易港六周年之际,这座城市正在反思其显著的增长,并承诺继续转型。三亚着眼于成为一流的国际旅游目的地和具有全球影响力的旅游消费中心,是海南FTP发展战略愿景的核心。在过去的六年里,三亚的旅游业取得了令人瞩目的增长。其旅游收入从2018年的514.73亿元飙升至2023年的896.64亿元,而过夜游客人数从1831万激增至250

  • 9 狗狗下蛋,鲸鱼投资!WIF价格的下一步是什么?

    WIF的价值增长了2%以上。到目前为止,一头鲸鱼已经积累了20多万头。 dogwifhat是过去一周最大的输家之一,价格大幅下跌。尽管出现了这种低迷,但特定钱包的积累还是显著的,这表明投资者在下跌中有一定的信心或战略购买。 鲸鱼积聚狗粪 根据Lookonchain的数据,一个新创建的钱包最近从Coinbase提取了价值180万美元的USDC。该钱包随后使用606000美元购买了227896只dog

  • 10 妇女商业合作组织宣布2024年获得首席执行官性别平等和多样性卓越奖和性别公平和多样性开拓者奖

    2024年9月24日影响力行动年度峰会表彰的获奖者 华盛顿,2024年5月20日/PRNewswire/-妇女商业合作组织(WBC),一个由组织、公司和个人共同努力实现所有女性在商业中地位、薪酬和权力平等的领先联盟,今天宣布了2024年首席执行官性别公平和多样性卓越奖和2024年性别公平和多样化开拓者奖的获奖者。获奖者将在2024年9月25日举行的WBC影响力行动年度峰会上获得表彰。 WBC首席执