谷歌表示,新的人工智能训练技术速度惊人

时间:2024-10-01 编辑: 浏览:(192)

谷歌的DeepMind研究人员公布了一种加速人工智能训练的新方法,大大减少了完成这项工作所需的计算资源和时间。根据最近的一篇研究论文,这种典型的能源密集型过程的新方法可以使人工智能开发更快、更便宜,这对环境来说可能是个好消息。

该研究称:“我们的方法——带联合示例选择的多模式对比学习(JEST)——比最先进的模型少了13倍的迭代和10倍的计算。”。

人工智能行业以其高能耗而闻名。像ChatGPT这样的大规模人工智能系统需要大量的处理能力,而这反过来又需要大量的能量和水来冷却这些系统。例如,据报道,由于人工智能计算需求的增加,微软的用水量从2021年到2022年激增了34%,ChatGPT被指控每5到50次提示就消耗近半升水。

国际能源署(IEA)预计,从2022年到2026年,数据中心的用电量将翻一番,将人工智能的电力需求与加密货币采矿业经常受到批评的能源状况进行比较。

然而,像JEST这样的方法可以提供一个解决方案。谷歌表示,通过优化人工智能训练的数据选择,JEST可以显著减少迭代次数和所需的计算能力,从而降低总体能耗。这种方法与提高人工智能技术效率和减轻其对环境影响的努力相一致。

如果这项技术在规模上被证明是有效的,人工智能训练师将只需要训练其模型所需功率的一小部分。这意味着他们可以用目前使用的资源创建更强大的人工智能工具,也可以消耗更少的资源来开发新的模型。

JEST的工作原理

JEST通过选择互补的数据批次来最大限度地提高人工智能模型的可学习性。与选择单个示例的传统方法不同,该算法考虑了整个集合的组成。

例如,假设你正在学习多种语言。与其分别学习英语、德语和挪威语,也许按照难度的顺序,你可能会发现以一种知识支持另一种知识的方式一起学习更有效。

谷歌也采取了类似的方法,并取得了成功。

研究人员在论文中表示:“我们证明,联合选择一批数据比独立选择示例更有效。”。

为此,谷歌研究人员使用了“多模式对比学习”,即JEST过程识别数据点之间的依赖关系。这种方法提高了人工智能训练的速度和效率,同时需要更少的计算能力。

谷歌指出,这种方法的关键是从预先训练的参考模型开始,以指导数据选择过程。这项技术使模型能够专注于高质量、精心策划的数据集,从而进一步优化训练效率。

该论文解释道:“除了独立考虑的数据点的总质量外,批次的质量也是其组成的函数。”。

该研究的实验表明,在各种基准测试中,性能都有了稳步提升。例如,使用JEST在通用WebLI数据集上进行的训练显示出学习速度和资源效率的显著提高。

研究人员还发现,该算法很快发现了高度可学习的子批次,通过关注“匹配”在一起的特定数据片段来加速训练过程。这种被称为“数据质量自举”的技术重视质量而非数量,事实证明它更适合人工智能训练。

该论文称:“在一个小的策划数据集上训练的参考模型可以有效地指导一个大得多的数据集的策划,允许在许多下游任务上训练一个大大超过参考模型质量的模型。”。

由Ryan Ozawa编辑。

最新 更多 >
  • 1 狗狗币以 27B 美元的市值继续引领MEMECOIN市场,表现强劲

    狗狗币保持着顶级加密货币memecoin的主导地位,市值超过 270 亿美元,令人印象深刻。在这种强劲的表现中,狗狗币有望创下年度新高。在过去的 30 天里,狗狗币表现出了惊人的韧性,其价值增长了 10% 以上。然而,为了维持这种积极势头并达到新的高度,狗狗币必须果断突破 0.20 美元的水平。这一水平至关重要,因为目前有 32,000 个地址亏损 37.8 亿枚狗狗币,表明存在潜在阻力。人们对

  • 2 硬币局的Guy Turner表示,以太坊第三层Altcoins具有“巨大的100倍潜力”——以下是他的最佳选择

    币局频道主持人Guy Turner对以太坊(ETH)第三层扩展解决方案表示乐观。 Turner告诉Coin Bureau YouTube频道的246万订户,第三层的原生代币(建立在第二层之上的扩展解决方案)未来有巨大的上升潜力。 “问题是,第三层也非常高效,非常适合游戏、去中心化金融(DeFi)等领域。因此,第三级链及其上推出的加密货币具有100倍的巨大潜力。” 特纳的第三层首选包括Degen B

  • 3 Bankless:值得关注的热门加密货币游戏汇总

    作者:William M. Peaster,Bankless;编译:白水,游戏、加密货币和 NFT 的交叉点潜力巨大。 目前在这个十字路口建设的项目数量也很大。越来越多的加密货币新手和老手都在关注这一领域,并渴望投入其中。我收集了我认为的最佳加密游戏。 这些是我的主观选择,但它们是很好的切入点。让我们回顾一下吧!最好的游戏Parallel, Axie Infinity, Nifty Island,

  • 4 矿工减半后恐「抛售50亿镁比特币」 BTC看半年横盘?

    加密研究公司10x Research 分析师Markus Thielen 昨日在报告中对减半后的走势发出警告,预测矿工可能会在减半后清算价值50 亿美元的BTC,导致比特币可能会在未来几个月内横盘整理。比特币预计在本月20 日左右迎来第四次的减半事件,给予矿工的区块奖励将从6.25 枚BTC 折半至3.125 枚BTC。市场对减半后的比特币走势看法不一。从历史上看,在过去比特币减半的周期中,减半往

  • 5 GRT: Web3谷歌

    一、The Graph项目是做啥的&特别之处?定位:Graph 是一种用于索引和查询区块链数据的去中心化协议。需求:区块链无时无刻在各个链的各个合约中产生数据,对于区块链中数据获取以及数据加工整理等非常困难,需求巨大的基建。运作原理:The Graph 就是web3 的索引和查询层,子图是 The Graph 上的开放 API,用于组织区块链数据并将其提供给应用程序。使用子图,开发人员和数据消费者

  • 6 Coinlist上线TeleportDAO 看懂TeleportDAO

    作者:TeleportDAO团队,翻译:xiaozou按:CoinList宣布将于UTC时间4月11日17:00-4月18日17:00进行TeleportDAO社区公售。TeleportDAO 是一个提供从比特币到 EVM 链的跨链应用程序基础设施的互操作性协议。TeleportDAO 也是Coinlist 2022 年秋季种子批次项目。1、前言TeleportDAO通过轻客户端桥接实现从比特币到

  • 7 TON新生:The Open Network的技术进步与未来展望

    作者:cynicsong.eth 来源:mirrorTON往事2018年,Telegram创始人Durov 兄弟开始探索适用于Telegram的区块链解决方案。当时没有区块链能够支持Telegram的亿级用户群,因此他们决定设计自己的Layer 1 链,起名Telegram Open Network,简称TON。数月后,通过对TON原生代币$Grams的ICO,TON募集到超17亿美金。2019年

  • 8 全球首个NFT铸造智能硬件面世

    据NFT中文咨询,全球首个NFT铸造智能硬件(Uha Crypto Pass)将于于2024年4月下旬上市,这是全球首个在非手机端PC端实现NFT铸造的智能硬件,铸造支持多种公链协议,该硬件还兼有冷钱包的功能。

  • 9 互联网计算机(Internet Computer):从负数到无穷大

    2024 年 4 月 6 日,万众期待的 Web3 嘉年华在香港会展中心开幕,DFINITY 作为大会排名第一的赞助商,其创始人兼首席科学家 Dominic Williams 发表了「AI that is a smart contract: why and how」的演讲,探讨了 AI 在区块链网络上的运行方式,也把 DFINITY 主导的互联网计算机(Internet Computer,IC)再

  • 10 Move-to-earn协议StepN宣布为用户空投3000万美元

    作者:Zhiyuan Sun,CoinTelegraph;编译:白水,基于 Solana 区块链构建的 Move-to-earn 生活方式应用程序 StepN 正在向其用户空投 1 亿个 FSL 积分,价值约 3000 万美元。根据 4 月 10 日的公告,FSL 积分可以按 1:1 的比例兑换 StepN 的 GMT 代币,也可以用于即将推出的 StepN 非同质代币 (NFT) 铸币,同时获得