算力不足,小模型成AI模型发展下个方向?

时间:2024-09-25 编辑: 浏览:(114)

作者:一号

编辑:美美

大模型不是AI的唯一出路,把模型做小也是本事。

这段时间,AI模型界是真的热闹,新的模型不断涌现,不管是开源还是闭源,都在刷新成绩。就在前几天,Meta就上演了一出“重夺开源铁王座”的好戏。发布了Llama 3 8B和70B两个版本,在多项指标上都超越了此前开源的Grok-1和DBRX,成为了新的开源大模型王者。

并且Meta还透露,之后还将推出400B版本的Llama 3,它的测试成绩可是在很多方面上都追上了OpenAI闭源的GPT-4,让很多人都直呼,开源版的GPT-4就要来了。尽管在参数量上来看,相比Llama 2,Llama 3并没有特别大的提升,但是在某些表现上,Llama 3最小的8B版本都比Llama 2 70B要好。可见,模型性能的提升,并非只有堆参数这一种做法。

Llama 3重回开源之王

当地时间4月18日,“真·OpenAI”——Meta跑出了目前最强的开源大模型Llama 3。本次Meta共发布了两款开源的Llama 3 8B和Llama 3 70B模型。根据Meta的说法,这两个版本的Llama 3是目前同体量下,性能最好的开源模型。并且在某些数据集上,Llama 3 8B的性能比Llama 2 70B还要强,要知道,这两者的参数可是相差了一个数量级。

能够做到这点,可能是因为Llama 3的训练效率要高3倍,它基于超过15T token训练,这比Llama 2数据集的7倍还多。在MMLU、ARC、DROP等基准测试中,Llama 3 8B在九项测试中领先于同行,Llama 3 70B也同样击败了Gemini 1.5 Pro和Claude 3 Sonnet。

尽管在参数量上并没有特别大的提升,但毫无疑问,Llama 3的性能已经得到了很大的进步,可以说是用相近的参数量获得了更好的性能,这可能是在算力资源短期内无法满足更大规模运算的情况下所作出的选择,但这体现了AI模型的研发并非只有堆砌参数这一条“大力出奇迹”的道路。

把大模型做小正成业内共识

实际上,在Llama 3之间的两位开源王者,Grok-1和DBRX也致力于把模型做小。和以往的大模型,使用一个模型解决一切问题的方式不同,Grok-1和DBRX都采用了MoE架构(专家模型架构),在面对不同问题的时候,调用不同的小模型来解决,实现在节省算力的情况下,保证回答的质量。

而微软也在Llama 3发布后没几天,就出手截胡,展示了Phi-3系列小模型的技术报告。在这份报告中,仅3.8B参数的Phi-3-mini在多项基准测试中都超过了Llama 3 8B,并且为了方便开源社区使用,还特意把它设计成了与Llama系列兼容的结构。更夸张的是,微软的这个模型,在手机上也能直接跑,经4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的苹果A16芯片上能够跑到每秒12 token,这也就意味着,现在手机上能本地运行的最佳开源模型,已经做到了ChatGPT水平。

而除了mini杯外,微软也一并发布了小杯和中杯,7B参数的Phi-3-small和14B参数的Phi-3-medium。在技术报告中,微软也说了,去年研究团队就发现,单纯堆砌参数量并非提升模型性能的唯一路径,反而是精心设计训练的数据,尤其是利用大模型本身去生成合成数据,并配合严格过滤的高质量数据,能够让中小模型的能力大幅跃升,所以他们也说,Textbooks are all you need,教科书级别的高质量数据才是重要的。

AI模型发展正着力于摆脱限制

自英伟达乘着AI的东风,成为行业内说一不二,当之无愧的“卖铲子的人”,各家AI公司都将英伟达的GPU视为“硬通货”,以致于谁囤有更多的英伟达的GPU,谁的AI实力就强。但英伟达的GPU的交付并未能始终跟上市场的需求。

因此,很多AI公司开始另谋出路,要么找其他的GPU生产商,要么决定自己研发AI芯片。即使你囤够了英伟达的GPU,也还有其他限制,OpenAI在前段时间就被爆出,因为训练GPT-6,差点把微软的电网搞瘫痪。马斯克也曾说过,当前限制AI发展的主要因素是算力资源,但在未来,电力会成为限制AI发展的另一阻碍。

显然,如果持续“大力出奇迹”,通过堆砌参数量来实现AI性能的提升,那么以上这些问题迟早会遇到,但是如果把大模型做小,使用较小的参数量,实现同样或者更好的性能,那么将可以显著减少对算力资源的需求,进而减少对电力资源的消耗,从而让AI在有限资源的情况下,得到更好的发展。

因此,接下来,谁能在将模型做小的同时,还能实现性能的增长,也是实力的体现。

最新 更多 >
  • 1 萨尔瓦多提议建立私人比特币投资银行以提振经济

    萨尔瓦多正在加倍下注比特币,提出了一项新的提议,建立一家面向加密货币投资者的私人投资银行。 萨尔瓦多驻美国大使Milena Mayorga在推特上宣布了这一计划,并表示私人投资银行(BPI)将“使向潜在投资者提供的美元和比特币融资选择多样化” 就在两周前,比特币的坚定支持者纳伊卜·布克莱总统宣誓就任第二任期。Bukele的高级比特币顾问Max Keiser表示,总统正在“着手”这项新立法。 如果获

  • 2 为什么现在山寨币依然是高风险的?

    近期加密货币市场发生了重大变化,许多分析师对投资山寨币发出了警告。传统上,在牛市中,比特币和以太坊先行上涨,随后山寨币跟涨。然而,当前的市场形势显示,这一模式正在改变。加密对冲基金创始人 Quinn Thompson 建议,目前不宜投资山寨币。他指出市场不稳定的几个指标,包括高杠杆和未平仓头寸、缺乏恐慌性购买,以及稳定币供应的停滞。他认为市场正面临越来越大的抛售压力,尤其是来自需要筹集资金的风险投

  • 3 比特币面临抛售压力-最新加密货币新闻

    领先的加密货币比特币在价格显著下跌后,遭遇了巨大的抛售压力。在4月份减半期间达到历史最高点后,比特币的价值在很大程度上受到矿工行为的影响而下跌。这一下跌使价格降至6.5万美元,导致其市值降至1.3万亿美元以下。 内容隐藏1比特币ETF经历了什么?2比特币何时会重新获得势头?投资者的3大收获 比特币交易所买卖基金正在经历什么? 比特币价格跌至一个月低点,50天移动平均线表明比特币价

  • 4 加密货币成美国大选重要议题,特朗普力挺比特币美国制造,加密货币迎来新机遇?

    2024年美国总统大选即将拉开帷幕,加密货币第一次成为了选举讨论的重要议题,其重要性和影响力达到了前所未有的高度。无论是特朗普还是拜登,两位主要候选人都不得不面对这个迅速崛起的新兴市场,并将对加密货币的态度和政策主张纳入竞选策略,这也对加密货币市场的发展产生了影响。特朗普重申支持加密货币立场近日,美国前总统唐纳德·特朗普在社交媒体平台Truth Social上再次就加密货币问题发声,他明确表示将致

  • 5 在Bitbot和KangaMoon苦苦挣扎的同时,MoonBag的顶级加密预售能否根据预测达到1美元?

    你听说过MoonBag的预售和它提供的难以置信的机会吗?当Bitbot与潜在的高估值和投机风险作斗争,Kangamoon与市场波动作斗争时,MoonBag正在以顶级加密货币预售为加密货币世界树立新标准。到目前为止,此次预售筹集了惊人的200万美元,向投资者承诺将获得高达15000%的令人印象深刻的投资回报率。MoonBag拥有免税的交易环境和强大的安全措施,包括SCRL的彻底审计和锁定的团队代币。

  • 6 从6600美元到127000美元:比特币的看涨信号暗示着巨大的收益

    比特币的价格在过去七天里下跌了近5%。大多数指标和市场指标都暗示价格将继续下跌。 比特币(BTC)牛市一直在努力控制市场,因为加密货币之王的周图继续保持红色。 然而,BTC可能有诀窍。如果考虑到最新数据,那么BTC正在一个牛市模式中默默移动,这可能会将其推至新高。 比特币的目标是127k美元 CoinMarketCap的数据显示,BTC的价格在过去七天里下跌了近5%。在撰写本文时,BTC的交易价格

  • 7 随着投资者竞相争夺MoonBag成为2024年Meme Coin预售冠军,Fantom和Cosmos落后了

    大型交易所上市是否有助于表情包硬币达到备受追捧的1美元里程碑?投资者正在密切寻找具有快速潜在增长的硬币,专注于那些提供有吸引力的赌注激励的硬币。 MoonBag加密货币超越了Fantom和Cosmos等竞争对手,吸引了人们对2024年最热门的模因币预售的兴趣。MoonBag的创造性赌注奖励使其在投资者争夺权威的竞争中脱颖而出。 Fantom的麻烦凸显MoonBag的承诺 曾经以其快速和可扩展的区

  • 8 专家预测DTX价格将上涨2500%,投资者在Dogwifhat(WIF)和BONK回调中仍持乐观态度

    处于预售阶段的项目为精明的投资者提供了有利可图的机会。DTX交易所(DTX)是一种预售代币,已成为加密货币市场的有力竞争者。 现在,专家预测DTX的价格将飙升2500%,投资者对此议论纷纷。DTX预测的飙升会成真吗?投资者应该如何定位? 与此同时,尽管Dogwifhat(WIF)和BONK投资者经历了回调,但他们仍然看好。分析师预测WIF和BONK分别为227%和219%。让我们来探索DTX、WI

  • 9 MoonBag领跑2024年最佳预售,BitBot和BlastUP未能紧随其后

    模因币市场通常呈现出混乱的景象,但会有复兴吗?在加密货币银河系,创新与炒作作斗争,财富可能在一夜之间产生或失去。像BitBot(BitBot)和BlastUP(BLP)这样的竞争对手最初对它们的功能产生了兴趣。然而,随着土星五号火箭开始探险,事情发生了令人兴奋的转折。 以目前的势头,MoonBag(MBAG)在2024年实现了最好的预售。MoonBag的预售在目前阶段已经筹集了200多万美元。关

  • 10 币圈再临“519”Titan逆势突围

    在过去的几天里,加密货币市场经历了一次严重的震荡,类似于传统金融市场中的“519”事件。大多数加密货币如BTC、ETH等都出现了显著的下跌,加密货币的总市值也出现了下跌,不少投资者信心受挫。 本轮下跌可能与6月中旬某知名加密货币交易所遭遇了黑客攻击和安全漏洞事件有关。这引发了市场恐慌,投资者纷纷将加密货币交易所中的资产进行转移,或者直接变现,这直接导致加密货币的总市值下跌,而币价的下跌加剧了这一行