生成式AI:三块短板、两道难题、一个悖论

时间:2024-09-22 编辑: 浏览:(114)

文章来源:腾讯研究院

闫德利 腾讯研究院资深专家

图片来源:由无界AI生成

炼大模型,大炼模型

近年是全球风险投资的低潮,生成式AI(GenAI)却逆市而起,去年的融资笔数和融资额分别增长66%和400%(来源:CB Insight,如下图所示),融资额高居所有细分领域第一位(来源:Dealroom.co)。去年美国前5大风险投资中,OpenAI、Anthropic(2笔)和Inflection AI三家GenAI公司占据了4个,融资额分别高达100亿美元、40亿美元、20亿美元和13亿美元,主要投资者是微软、亚马逊、谷歌和英伟达等巨头(来源:Crunchbase)。

2019-2023年全球GenAI的融资笔数和融资额

当下的GenAI热潮起源于美国产业界,实际上美国政府也高度重视,提出了“确保继续保持领导地位”的战略目标。在奥巴马时期,美国白宫发布《国家人工智能研发战略计划》(2016),特朗普时期(2019)和拜登时期(2023)分别对其进行了更新,从而形成了9大战略——长期投资、人和AI协作、伦理、安全、数据集、评估标准、人才、公私合作、国际合作。为推进战略执行和落地,美国白宫科技政策办公室(OSTP)相继设置了人工智能特别委员会(2018)和国家人工智能倡议办公室(2021)。

我国也炼大模型、大炼模型。今年一季度,全球前三大GenAI风险投资中,我国占其二——月之暗面10亿美元A轮融资和MiniMax 6亿美元融资。电信运营商、手机厂商、家电厂商、汽车公司、软件公司、AI公司、互联网公司、电商等各类型的企业纷纷涉足,已有117个大模型通过国家生成式人工智能服务备案。大模型成为大厂标配。不过并没有短兵相接的“百模大战”,反而颇有井水不犯河水之意。

三块短板

我国人工智能位居世界前列。但也存在尚待补齐的短板,集中体现在算力、数据集和人才三个方面。一是算力。GenAI以算力堆积实现智能涌现,其成功依赖暴力美学。根据Jaime Sevilla等人的研究(2022),在前深度学习时代(1952-2009),算力需求每21.3个月翻一番,符合摩尔定律;在深度学习时代(2010-2022),算力需求加快到每5.6个月翻一番。如下图所示。根据THE DECODER披露(2023),GPT-4的每秒浮点运算次数(FLOPs)达到2.15×10^25,一次训练成本6300万美元。

里程碑机器学习系统的训练算力需求

来源:Sevilla J, Heim L, Ho A, et al. Compute trends across three eras of machine learning. 2022.在机器学习图形处理器领域,英伟达占有95%的市场份额(来源:New Street Research,2023)。英伟达的A100和H100芯片是训练大模型的“金刚钻”,具有不可替代性。由于美国对华GPU限令,我国面临卡脖子现实。

二是数据集。我国数据规模大。根据国家互联网信息办公室《数字中国发展报告(2022年)》,2022年我国数据产量8.1ZB,全球占比10.5%,位居世界第二。这被看作发展相关产业的优势。然而,规模优势不足以弥补质量欠缺。不管把多大数量的马车连续相加,也决不能得到一条铁路(熊彼特,1934)。数据质量至少同等重要。在Hugging Face的高质量数据集中,英语以37.7%的比重位居第一位,中文仅占3.2%,和波兰语并列第九(来源:OECD,2023)。如下图所示。我国数据集的质量仍有待进一步提升。当然,这非一日之功,需要历经岁月的积累。

三是人才。自1966年以来,全世界共有77人获得图灵奖。其中只有一名华人——姚期智(2000)。我国计算机科学的历史积淀尚有不足,所幸近年进步很大,成为美国最大的竞争对手。根据MacroPolo数据(2024),全球最顶级(前2%)AI研究人员的原籍国中,我国以26%的比例逼近美国(28%),位居第二位。在顶级(前20%)AI研究人员的原籍国中,我国有47%,远超美国(18%)。但仍有隐忧,在最顶级(前2%)AI研究人员的就业国家中,我国仍位居第二,但仅有12%,远落后于美国(57%)。如下表所示。GenAI高度依赖人们的创新能力。如何吸引全球顶尖人才来华创业、就业,是需要努力的方向。

【全球AI人才的分布比例】 来源:根据MacroPolo(2024)数据整理

两道难题

每次创新都不是轻而易举的,都需要破除很多困难,遭受人们的质疑。当前的GenAI面临以下两个比较突出的问题。当然,只有发展才能解决问题。

一是缺乏杀手级应用,面临商业化困难。伟大的时代,必有杀手级应用。例如PC时代的Office,桌面互联网时代的搜索,移动互联网时代的手机支付。GenAI是世界潮流,然而还处于应用推广的早期,美国企业的AI采用率仅有5.4%(来源:人口普查局,2024)。大模型燃烧的是美元,产出是更少的美元。作为全球最性感的GenAI公司, OpenAI 有会员订阅付费、开发者付费和微软分成三种盈利模式,自成立以来的收入累计不足20亿美元(来源:Finbold),却耗费了113亿美元融资。微软的GitHub Copilot也采用会员订阅模式,用户需支付10美元月费或100美元年费。但因计算成本高,微软平均每月在每个用户上的亏损超过20美元,重度用户高达 80 美元(来源:华尔街日报,2023.10)。GenAI尚不具备传统软件的规模经济,需要通过给用户巨额补贴来培育市场。国内用户则更喜欢免费,为优质内容和知识付费的习惯尚未形成,会员订阅不成主流。GenAI的商业模式仍处于探索的初期。

二是未能显著提振平台企业业绩,云和芯片是最大受益者。GenAI的兴起为我国平台经济注入了一线生机,各大平台纷纷下场推出大模型。然而,GenAI的火爆未能显著提振平台企业的业绩,我国互联网平台仍处于萎靡期。自ChatGPT发布以来,尽管叠加了疫情结束、国家支持等利好因素,我国互联网公司的市值仍有涨有跌,相当大比例的企业跌幅较大,如下图所示。

【自ChatGPT发布以来我国十大互联网公司的市值涨跌情况】 来源:根据雪球财经数据整理,数据截止2024年4月11日

大模型训练需要耗费大量算力,云和芯片公司是直接受益者。根据A16Z(2023)数据,GenAI总收入的10-20%将流向云服务提供商。其中,创业公司 80%-90%的早期融资都用于向云计算平台购买算力。微软、亚马逊和谷歌是全球三大云基础设施服务商,也是最活跃的GenAI投资者,就不足为奇了。自ChatGPT发布以来,英伟达市值增长457%,成为全球市值第三高的公司,是最大获益者。

第四次工业革命的悖论

自1956年达特茅斯会议提出“人工智能”术语以来,人工智能的发展起起伏伏,经历了多次炒作周期。这次似乎不一样,即使对怀疑论者来说,ChatGPT的发布也意味着人工智能技术的重大突破。人们兴奋大呼:人工智能驱动的第四次工业革命正在到来!

工业革命的影响是全面的、深刻的、长远的,“综观世界经济史,工业革命是唯一一件大事”(Irad Kimhi,2006)。第四次工业革命如果到来,人们必会踌躇满志,经济必会生机蓬勃,生活必会欣欣向荣。然而,好像并不是。这是一个悖论。对此,时间可以给出答案,我们不必争论。有四个事实予以说明。

第一,人们对“智能”怀有与生俱来的痴迷,人工智能的发展充斥着乐观思潮。谢耘(2023)对其评价是:“志存高远,盲目乐观。”达特茅斯会议的主要参与者就曾作出大胆预言:

1958年,艾伦·纽厄尔和赫伯特·西蒙(两人共同获得1975图灵奖):“十年之内,数字计算机将成为国际象棋世界冠军” “十年之内,数字计算机将发现并证明一个重要的数学定理”。

1965年,赫伯特·西蒙(1978年诺贝尔经济学奖获得者):“二十年内,机器将能完成人能做到的一切工作。”1970年,马文·闵斯基(1969图灵奖获得者):“在三到八年的时间里,我们将得到一台具有人类平均智能的机器。”

第二,自2009年以来我们时刻在“经历”第四次工业革命(也有人说是第三次工业革命)。在中国知网上,以“第四次工业革命”和“第四次产业革命”为题名的文章分别有386篇和48篇(不计入2024年),如下图所示。微电子(1984)、云计算(2012)、物联网(2016)、大数据(2016)、区块链(2017)、工业互联网(2017)、新基建(2020)等,都曾被赋以“第四次工业革命”的使命。现在轮到GenAI了。这意味着,GenAI需要达到与蒸汽机、发电机、内燃机、计算机和互联网一样的高度。

中国知网以“第四次工业(产业)革命”为题名的文章分布

第三,国外一般把GenAI(或AI)比作智能手机、云计算、互联网等特定技术,且通常使用“可能”“之一”等词汇。例如:

黄仁勋(2023.2):ChatGPT是“the iPhone moment of AI”, OpenAI 所做工作是“one of the greatest things that have ever been done for computing”。

比尔·盖茨在《The Age of AI has begun》(2023.3)中表示,图形用户界面和GPT是他一生中见证过的两次革命性技术展示,并指出:“人工智能的发展与微处理器、个人电脑、互联网和移动电话的诞生一样重要。”

亚马逊CEO贾西致股东信(2024.4):“Generative AI may be the largest technology transformation since the cloud (which itself, is still in the early stages), and perhaps since the Internet.”

第四,历次工业革命都不是预测的结果,而是后人的总结。第一次工业革命(1760—1840)结束40年后,术语“Industrial Revolution”才在阿诺德·汤因比的推动下为大众所知;第二次工业革命(1870—1914)结束40年后,经济学家才开始使用“Second Industrial Revolution”,到1969年戴维·兰德斯《不受束缚的普罗米修斯》才标准化了其学术定义;第三次工业革命尚无统一认识,暂且不表。这颇有“伟大不能被计划”的味道,让我们期待第四次工业革命不同。

本文写作中,得到马骏、马源、石光、王明辉、李勇坚、白惠天等人的支持和帮助,在此一并感谢。

最新 更多 >
  • 1 比特币面临潜在价格下跌-最新加密货币新闻

    比特币(BTC)价格最近的波动引起了投资者的担忧。Glassnode的数据显示,短期持有者(STH)的变现价格定为64372美元,略高于比特币目前的64066美元。STH实现价格代表过去155天内购买的比特币的平均成本,用于评估BTC的短期市场健康状况。 内容隐藏了BTC2分析师对BTC3的看法中的1个关键阈值投资者能得出什么结论? BTC中的临界阈值 突破STH实现的价格水平往

  • 2 随着Cardano交易激增,评估ADA的未来之路

    Cardano网络上发生的交易激增。新的发展可能有助于该网络在未来的发展。 Cardano[ADA]在过去几天见证了整体活动的大规模涌入。值得注意的是,该网络在过去24小时内成功完成了250000笔付款。其每日交易量也大幅飙升。 日常活动呈上升趋势 然而,网络上的每日活跃地址下降了,这意味着只有少数用户对大量交易负责。 交易激增的原因之一是Cardano网络上的DEX(去中心化交易所)交易量。 需

  • 3 Bankless:值得关注的五大再质押代币

    作者:Jack Inabinet,Bankless;编译:邓通,重新买入的多头想知道接下来会发生什么。在 Bankless Airdrop Hunter 中,我们的分析师一直在研究有望大获成功的无代币再质押协议,重点关注围绕 EigenLayer 构建的流动性再质押代币项目以及试图直接推翻 EigenLayer 核心地位的更雄心勃勃的竞争对手。EigenLayer 的 EIGEN 并未受到加密货币

  • 4 Shiba Inu上涨2564%至0.00045美元,顶级分析师重新调整SHIB波动数

    市场分析师Captain Parabolic Toblerone调整了Shiba Inu波动数,以反映当前市场现实,最终目标为0.00045美元。 Shiba Inu一直受制于更广泛的市场,尤其是领先的加密资产比特币(BTC)。随着比特币在本月暴跌7%的情况下跌破63000美元大关,SHIB也出现了类似的下跌,在6月份暴跌了32.72%,跌至0.000017美元的较低水平。 这一看跌趋势影响了投资

  • 5 从链上数据分析 本轮牛市BTC价格回撤的极限值是多少?

    从链上行为分析,看牛市中的 BTC 在极端情况下可能会跌到什么程度?总体逻辑就是依据链上行为分析和历史数据为参考,从两个方面来评估。方法一、从 STH-MVRV(短期持有者)的角度短期持有者是牛熊转换的重要参与者,因此 STH-MVRV 的表现在牛市周期中具有极其重要的参考价值。众所周知,在上一轮周期中出现过 2 个令人生畏的黑天鹅事件,也引发了 BTC 价格的暴跌。通过下图我们可以看到,3.12

  • 6 MoonBag预售:投资者蜂拥而至,而Floki Inu和Hedera仍在挣扎

    欢迎来到加密货币领域,在这里可以获得无尽的收益和革命性的技术。正是由于这种不可预测性,投资者在世界各地寻找下一个大事件。在这个市场上,获得一枚同时具有这两个特征的硬币,同时确保惊人的利润,可能会彻底改变你的投资策略。 让我们欢迎MoonBag,他是加密货币领域的一位聪明新人,拥有惊人的赌注激励和惊人的功能。MoonBag凭借其战略性的流动性方法、强大的安全措施和交易免税政策,将自己视为一项可靠且

  • 7 你为何在牛市赔上身家?

    来源:胡飞瞳大家都有一个感觉 ,这个市场怎么现在不涨了,BTC连续3月在6到7万刀上下浮动,AltCoin 前期有一些 冲动,现在也没有后劲了,争相下探。新上的币种也坚持不住,上线即巅峰。整个市场就是一锅温吞水,不温不火。可能对很多人来说,“不温不火”这个词有一点太平和了。因为最近就有不少人骂娘。骂撸空头被反撸者大有人在;骂币安上币太多、让市场丧失 流动性的也成一种流行;骂KOL 乱带节奏导致损失

  • 8 PEPE激增11%,但还有更多工作要做

    PEPE在72小时内激增11.60%。尽管存在短期看跌倾向,但牛市势头仍在积聚。 Pepe[PPE]在不到72小时内以11.60%的惊人涨幅席卷加密货币市场。尽管有一些短期看跌指标,但这一快速增长表明了强劲的牛市势头。 让我们深入了解推动这一业绩的关键市场趋势和链上数据。 根据CoinMarketCap的数据,PEPE的价格为0.0000116美元,在过去24小时内上涨了2.56%。PEPE的价格

  • 9 呼唤所有有远见的人:Qubetics白名单开启预售之门,吸引比特币和AAVE投资者

    你有没有想过比特币和以太坊等项目的早期投资者一定赚了多少疯狂的钱?加密货币市场出现了一个稳定的趋势,即越早投资硬币,他们赚的钱就越多。如果你正在寻找财富倍增的机会,那么你需要注册Qubetics白名单。 比特币(BTC)和AAVE(AAVE)都曾备受瞩目,但现在是Qubetics(TICS)推出新白名单的时候了。 比特币跌破6.5万美元 正如我们所知,发起加密货币运动的硬币已经失去了曾经使其成为

  • 10 Ripple诉美国证券交易委员会诉讼更新6月24日

    不用说,美国证券交易委员会和Ripple实验室之间关于XRP是否应被视为证券的争议可能会对整个行业产生影响。 这起案件已经进行了很多年,目前正处于审判阶段。 以下是最近最重要的事态发展。 证券交易委员会有麻烦吗? 正如CryptoPotato最近报道的那样,委员会加密资产和网络部门负责人David Hirsch最近辞职。 赫什在领英上宣布辞职。他在美国证券交易委员会工作了九年多。他还否认了有关他