算力不足,小模型成AI模型发展下个方向?

时间:2024-09-29 编辑: 浏览:(46)

作者:一号

编辑:美美

大模型不是AI的唯一出路,把模型做小也是本事。

这段时间,AI模型界是真的热闹,新的模型不断涌现,不管是开源还是闭源,都在刷新成绩。就在前几天,Meta就上演了一出“重夺开源铁王座”的好戏。发布了Llama 3 8B和70B两个版本,在多项指标上都超越了此前开源的Grok-1和DBRX,成为了新的开源大模型王者。

并且Meta还透露,之后还将推出400B版本的Llama 3,它的测试成绩可是在很多方面上都追上了OpenAI闭源的GPT-4,让很多人都直呼,开源版的GPT-4就要来了。尽管在参数量上来看,相比Llama 2,Llama 3并没有特别大的提升,但是在某些表现上,Llama 3最小的8B版本都比Llama 2 70B要好。可见,模型性能的提升,并非只有堆参数这一种做法。

Llama 3重回开源之王

当地时间4月18日,“真·OpenAI”——Meta跑出了目前最强的开源大模型Llama 3。本次Meta共发布了两款开源的Llama 3 8B和Llama 3 70B模型。根据Meta的说法,这两个版本的Llama 3是目前同体量下,性能最好的开源模型。并且在某些数据集上,Llama 3 8B的性能比Llama 2 70B还要强,要知道,这两者的参数可是相差了一个数量级。

能够做到这点,可能是因为Llama 3的训练效率要高3倍,它基于超过15T token训练,这比Llama 2数据集的7倍还多。在MMLU、ARC、DROP等基准测试中,Llama 3 8B在九项测试中领先于同行,Llama 3 70B也同样击败了Gemini 1.5 Pro和Claude 3 Sonnet。

尽管在参数量上并没有特别大的提升,但毫无疑问,Llama 3的性能已经得到了很大的进步,可以说是用相近的参数量获得了更好的性能,这可能是在算力资源短期内无法满足更大规模运算的情况下所作出的选择,但这体现了AI模型的研发并非只有堆砌参数这一条“大力出奇迹”的道路。

把大模型做小正成业内共识

实际上,在Llama 3之间的两位开源王者,Grok-1和DBRX也致力于把模型做小。和以往的大模型,使用一个模型解决一切问题的方式不同,Grok-1和DBRX都采用了MoE架构(专家模型架构),在面对不同问题的时候,调用不同的小模型来解决,实现在节省算力的情况下,保证回答的质量。

而微软也在Llama 3发布后没几天,就出手截胡,展示了Phi-3系列小模型的技术报告。在这份报告中,仅3.8B参数的Phi-3-mini在多项基准测试中都超过了Llama 3 8B,并且为了方便开源社区使用,还特意把它设计成了与Llama系列兼容的结构。更夸张的是,微软的这个模型,在手机上也能直接跑,经4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的苹果A16芯片上能够跑到每秒12 token,这也就意味着,现在手机上能本地运行的最佳开源模型,已经做到了ChatGPT水平。

而除了mini杯外,微软也一并发布了小杯和中杯,7B参数的Phi-3-small和14B参数的Phi-3-medium。在技术报告中,微软也说了,去年研究团队就发现,单纯堆砌参数量并非提升模型性能的唯一路径,反而是精心设计训练的数据,尤其是利用大模型本身去生成合成数据,并配合严格过滤的高质量数据,能够让中小模型的能力大幅跃升,所以他们也说,Textbooks are all you need,教科书级别的高质量数据才是重要的。

AI模型发展正着力于摆脱限制

自英伟达乘着AI的东风,成为行业内说一不二,当之无愧的“卖铲子的人”,各家AI公司都将英伟达的GPU视为“硬通货”,以致于谁囤有更多的英伟达的GPU,谁的AI实力就强。但英伟达的GPU的交付并未能始终跟上市场的需求。

因此,很多AI公司开始另谋出路,要么找其他的GPU生产商,要么决定自己研发AI芯片。即使你囤够了英伟达的GPU,也还有其他限制,OpenAI在前段时间就被爆出,因为训练GPT-6,差点把微软的电网搞瘫痪。马斯克也曾说过,当前限制AI发展的主要因素是算力资源,但在未来,电力会成为限制AI发展的另一阻碍。

显然,如果持续“大力出奇迹”,通过堆砌参数量来实现AI性能的提升,那么以上这些问题迟早会遇到,但是如果把大模型做小,使用较小的参数量,实现同样或者更好的性能,那么将可以显著减少对算力资源的需求,进而减少对电力资源的消耗,从而让AI在有限资源的情况下,得到更好的发展。

因此,接下来,谁能在将模型做小的同时,还能实现性能的增长,也是实力的体现。

最新 更多 >
  • 1 随着期权的消失,咆哮的小猫现在拥有2.62亿美元的GameStop股票

    周四盘后交易中,GameStop股价先涨后跌,网上更为人熟知的名字是Roaring Kitty的Keith Gill在Reddit上再次展示了他在这家视频游戏零售商的持股情况。 然而,这一次,这位迷因股票影响者显示,与周一的“YOLO更新”相比,他又持有了500万股GameStop股票。看起来,Gill可能已经出售或行使了他在GameStop中备受赞誉的20美元看涨期权,此前价值8200万美元。

  • 2 涉嫌资金上亿美元 127名嫌疑人被拘留 土耳其加密庞氏骗局解析

    来源:Beosin此前我们曾报道过土耳其在追求加密货币自由的道路上,一些问题也日益显现。最为人诟病的,是当地一些加密项目违法行为,给投资者带来了巨大损失。2024年5月30日,土耳其内政部长透露,当局在Ankara对某个加密货币诈骗项目进行了一次大规模行动,有127名嫌疑人被拘留,查获大量资产以及数个枪支。涉及的项目名为Smart Trade Coin。从2021年开始,土耳其的投资者就一直对该项

  • 3 比特币价格预测,MicroStrategy计划筹集5亿美元购买更多比特币,99BTC ICO突破200万美元

    比特币价格在过去24小时内小幅上涨,截至美国东部时间上午7:55,交易价格为67728.33美元,因为一些投资者认为加密货币的当前水平是一个买入机会。 MicroStrategy宣布拟非公开发行5亿美元可转换优先票据$MSTRhttps://t.co/5K8TqAi1D7——迈克尔·塞勒⚡️ (@saylor)2024年6月13日 在MicroStrategy宣布打算向合格的机构投资者提供5亿

  • 4 索拉纳(SOL)与EMA100、以太坊(ETH)的3500美元之战以及Furrever代币(FURR)的首次亮相作斗争

    在不断发展的加密货币市场中,索拉纳(SOL)正努力保持其在EMA100上方的位置,这标志着投资者关注这一关键支撑水平的关键时刻。与此同时,以太坊(ETH)在市场波动中努力保持在3500美元大关以上,也面临着一系列挑战。Furrever Token(FURR)以一个利润丰厚的10%推荐计划脱颖而出,成为一个迷人的新人。这种以猫为主题的代币不仅以其独特的方式吸引人,还提供了诱人的被动收入机会,有望在模

  • 5 Gensler预测以太坊ETF将在“夏末”获得批准

    加密货币市场周四下跌,尽管美国证券交易委员会主席加里·根斯勒在周四向参议院拨款委员会的一个小组委员会作证时表示,以太坊ETF可能会在“夏末”获得批准。 根据CoinGecko的数据,比特币和以太坊的交易价格下跌了约4%,而索拉纳下跌了7%。ETH价格 美国证券交易委员会已经初步批准了包括VanEck和贝莱德在内的几家以太坊ETF发行人。一旦它们的待决S-1表格获得批准,这些新的ETF就可以开始交易

  • 6 微战略股票成为焦点,因为它关注更多的BTC购买——下一步怎么办?

    MicroStrategy打算通过最近的可转换债券收购更多BTC。MSTR仍然是对BTC不可抗拒的短期赌注。 6月13日,MicroStrategy[MSTR]宣布计划从其5亿美元可转换票据的私人发行收益中增加更多比特币[BTC]。优先票据是一种债务策略,将于2032年到期。部分更新已读取, “MicroStrategy打算将出售票据的净收益用于购买额外的比特币和一般企业用途。” MicroSt

  • 7 索拉纳是2024年的好投资吗?

    您的指南:索拉纳是2024年的好投资吗? 你是一个狂热的加密货币投资者吗?也许你对这一切都是新手,想拓展你的视野。试图弄清楚投资哪些货币和资产可能是一项艰巨的任务。也许你一直想探索一个叫索拉纳的网络。 好吧,今天我们将介绍区块链的一些基础知识,并回答主要问题,“索拉纳在2024年是一项好投资吗?”。 继续阅读以了解更多信息。 另请阅读:金砖国家:20个国家出席联盟会议讨论扩大 了

  • 8 MarketAxess推出免税市政债券组合交易工具

    MarketAxess Holdings首次推出免税市政债券投资组合交易。本月早些时候,一家主要银行和一家知名资产管理公司之间执行了这一免税市政债券投资组合交易工具,允许客户交易多元化的免税市政债券。 市政债券交易的效率 根据新闻稿,客户可以根据新产品向多个交易对手或单个经销商发送名单,在单个交易中协商价格改进。该工具支持手动加载投资组合交易,并通过其订单管理系统进行直接处理。 加载后,客户可以即

  • 9 SEC主席Gary Gensler:以太交易所买卖基金应在9月前获得批准

    SEC主席Gary Gensler表示,SEC应在9月前全面批准现货以太交易所交易基金。美国证券交易委员会主席在一次预算听证会上告诉参议员,以太现货交易所买卖基金的申请应该在夏末完成。 第一轮现货以太坊ETF于2024年5月底获得批准。ETH ETF的批准令整个数字资产市场感到意外。尽管现货比特币ETF在1月份获得批准后取得了成功,但美国证券交易委员会长期以来一直拒绝批准这种基于加密货币的交易所交

  • 10 MicroStrategy宣布新的5亿美元比特币赌注:战略举措

    MicroStrategy宣布了一项新计划,将于2032年发行5亿美元的可转换优先票据,为额外的比特币收购提供资金。此举反映出该公司继续致力于将比特币作为其财政储备的核心资产。 发售详情 根据1933年《证券法》第144A条的规定,这些票据将私下提供给合格的机构买家,每半年支付一次利息。除非提前回购、赎回或转换,否则它们将于2032年6月15日到期。 根据MicroStrategy的说法,出售的