游戏里的智能革命:AI如何与游戏共创未来?

时间:2024-10-02 编辑: 浏览:(909)

作者:王枢腾讯研究院博士后

早在2001年,就有研究指出游戏人工智能领域,有极大的潜力实现或创造类人级别的人工智能(human-level AI)[1]。游戏作为人工智能研究的起点,以其任务场景的复杂性和多样性,为人工智能在广度、深度和灵活性等方面接近人类智能提供了保障。

当前,伴随着生成式AI和决策AI技术的迅猛发展,游戏与人工智能共振共生的发展态势更加明显。在全球游戏顶会GDC2024(全球游戏者开发大会2024)上,AI成为大会关注焦点,以AI为主题的演讲达64场,占比达8%。在生成式AI领域,62%的游戏业受访者正在使用AI工具制作游戏内容[2]。在决策AI领域,Google DeepMind团队继Alphastar后再次推出通用游戏智能体SIMA(Scalable Instructable Multiworld Agent),可根据人类自然语言指令在各类3D游戏世界中执行超过600多种任务。

技术试验场:

基于游戏环境的通用AIAgent实践

游戏为决策AI提供清晰测量标准,用游戏中清晰、可量化的规则评估决策AI的能力,能够解决人工智能科研场景缺失问题,大幅提升技术迭代与测试效率。当前,包括OpenAI、DeepMind等在内的大部分决策AI研究团队都选取游戏作为训练场景,致力于在不同类型的游戏场景中的打造通用智能体,并以此为基础构建通用人工智能。

2024年3月13日,Google DeepMind团队发布名为SIMA(Scalable Instructable Multiworld Agent)的AI智能体,它可以理解广泛的3D游戏世界,并能够像人类一样遵循自然语言指令在各类3D游戏世界中执行超过600多种任务。强大的自然语言理解和迁移学习的能力,让不不少研究人员将SIMA的出现视为“智能体的ChatGPT时刻”。

DeepMind在技术报告中详细阐释了SIMA的基本原理及技术路径,将其定义为一种在多重3D虚拟世界中可扩展、可指导的通用游戏智能体。DeepMind团队选取了9款当下流行的3D网络游戏和4个基于Unity引擎制作的3D场景作为SIMA智能体的训练环境,并从游戏中收集了大量人类玩家的行为和操作数据,用以训练智能体。在具体训练的过程中,智能体会不断观察学习屏幕中的游戏图像信息,并将其与玩家在游戏中的各类操作指令结合起来,随后实现通过键盘和鼠标输出,来控制游戏中的角色执行各种操作[3]。

图1SIMA智能体项目概述

SIMA项目是DeepMind团队在通用人工智能(AGI)研究领域的一个重要里程碑,从围棋人工智能AlphaGO和AlphaZero,到基于游戏《星际争霸2》的AlphaStar,再到如今基于大语言模型的SIMA,DeepMind团队一直在基于游戏环境进行通用智能体的测试和研究,在DeepMind看来,智能体在游戏环境中训练出的决策和行动能力,有望能够迁移到现实世界的场景中,为孵化通用人工智能提供新思路和新实践。

早在SIMA发布之前,业内已经存在着多个通用游戏智能体研究项目,其中比较有代表性的工作有两个,分别是由DeepMind发布的Gato,以及由英伟达发布的Minedojo。

Gato由DeepMind团队于2022年11月发布,可游玩雅达利系列游戏(Atari Games),并可操控真实的机器人手臂堆叠积木。Gato使用了类GPT的大语言模型架构,其训练材料包括图像、文本、机械臂关节数据以及其他多模态数据集(multimodal dataset)[4]。微软在2023年3月的一篇研究中指出,Gato这类融合了多模态信息的大模型,极有可能诞生出初期的智能[5]。

图2DeepMind打造的Gato

与Gato类似的还有英伟达、加州理工学院(Caltech)和斯坦福(Stanford)等研究机构基于《我的世界》游戏共同打造的智能体MineDojo。Minedojo将《我的世界》游戏的玩家视频(YouTube)、百科(Wiki)和用户社区(Reddit)的资讯作为训练材料,训练出一个能够在《我的世界》游戏中根据文字提示信息,完成各种不同任务的通用智能体。Minedojo不仅能够完成一些简单的程序化任务(programmatic tasks),还可以根据简单描述完成一系列创造任务(creative tasks),例如根据描述建造一个图书馆等[6]。

图3Minedojo能力模型

Gato和Minedojo这两项工作分别对应着人工智能研究中的两类不同思路:解决足够多的任务或解决一个足够复杂的任务。但上述两项研究也存在一定局限,比如Minedojo只是针对特定游戏类的专用智能,只能在单一游戏中完成各类任务,并不具备迁移学习的能力;Gato虽然具备一定迁移学习能力,但其主要应用环境都是一些2D游戏,而非3D游戏环境,与现实世界场景差距较大。

当前,基于游戏环境训练通用AI Agent已经成为业内共识。在TEDAI2023演讲上,英伟达高级科学家JimFan提出了基础模型(FoundationAgent)概念,认为AI研究的下一个前沿将是塑造一个可以在虚拟世界和现实世界里泛化,掌握广泛技能,控制许多身体,并能够泛化到多个环境中“基础模型”,而这个模型的训练,同样离不开游戏环境[7]。在国内,腾讯也牵头构建起AI多智能体与复杂决策开放研究平台——开悟,依托腾讯AI Lab和《王者荣耀》在算法、算力、实验场景方面的核心优势,为学术研究人员和算法开发者提供国内领先的应用探索平台。

能力新突破:

SIMA实现大语言模型

与AI Agent训练的有效融合

SIMA的出现,将大语言模型与智能体训练进行结合,实现了AI智能体决策能力和泛化的突破。SIMA不仅能较好地理解各种3D游戏环境,而且还能像人类一样按照自然语言指令在各种3D游戏世界中执行各类任务,并且在决策效率与能力上远超其他智能体,具备了与人类相近的决策能力[8]。DeepMind 创始人及CEO德米斯·哈萨比斯(Demis Hassabis)在采访中更是直言,“将大语言模型、AI智能体训练与游戏环境相结合的这个领域,有着巨大的发展前景,DeepMind未来将持续加大对该领域的研究投入[9]。”总体来看,与其他SIMA的特征和突破主要体现在以下几个方面:

第一,SIMA使用游戏环境进行训练,但更加关注智能体行为与接收指令的一致性。在DeepMind团队看来,“游戏是人工智能(AI)系统的重要试验场,与现实世界一样,游戏也是一种丰富的学习环境,具有反应灵敏的实时设置和不断变化的目标。” SIMA与DeepMind团队之前发布的游戏智能体相比,相同之处在于其训练过程中也观察学习了大量人类玩家的行为数据,不同之处在于SIMA训练的目的不在于击败人类玩家或在游戏内取得高分,而是为了学会在各种游戏环境中遵从人类发出的自然语言指令,并在游戏环境中作出与指令一致的行为。

第二,SIMA将大语言模型与智能体训练进行结合,并采用统一且人性化的交互界面。“语言和环境的学习是相辅相成的,通过学习自然语言,能够提升智能体对于通用表征和抽象概念的理解能力,提高学习效率。”相较于之前各种基于游戏环境的智能体,SIMA在训练中引入了大语言模型,整个训练过程都遵循语言优先的规则,所有的训练行为都由自然语言直接驱动。也就是说,SIMA 既不需要访问游戏的源代码,也不需要定制的 API。它只需要两个输入:屏幕上的图像信息,以及用户提供的自然语言指令,即可使用键盘和鼠标控制游戏中的角色执行这些指令。在具体交互方式上,SIMA采用了统一且人性化的交互界面,人类可以直接调用该交互界面向SIMA发出自然语言指令(如下图4)。

图4SIMA智能体架构

第三,SIMA拥有良好的泛化能力,能够在不同虚拟场景中保持较高能力水平。据DeepMind团队目前公布数据,SIMA已经通过600项基础技能进行评估,涵盖导航(例如左转)、对象交互(爬梯子)和菜单使用(打开地图)等,并且在多个游戏环境中都表现出了高于同类智能体的性能水平。DeepMind研究人员评估了 SIMA 按照指令完成近 1500个具体游戏内(in-game)任务的能力,其中部分采用了人类评估,结果显示无论在哪种游戏环境中,SIMA的表现都远超同类型智能体(如图5)。

图5多个智能体在不同环境下的性能对比

应用新场景:

AI助力游戏创作

提升内容创作效能

游戏已经成为打造通用AI Agent的试验场和孵化器,不断推动决策AI 技术的更新迭代。与此同时,伴随着以Stable Diffusion、Transformer等生成式AI技术的成熟,AI技术也开始反向助力游戏以及更广泛的文化行业的内容创作,越来越多的从业者能够以更低成本生成图片、文字、音视频、NPC等数字资产,提升产品研发效能,进一步降低交互内容的制作门槛。

在应用层面,生成式AI模型已经成为游戏开发者的有力助手。《2024 Unity 游戏业报告》数据显示,在使用AI技术之后,有71%游戏工作室表示其研发和运营效能得到了提升,这种效率的提升不仅体现在赋能单个内容创作者方面,还体现在能够有效降低不同环节工作者的沟通成本方面。

在游戏内容的生产侧,生成式AI已经被广泛应用于文本生成、2D美术创作、代码生成与检测、关卡设计生成等环节。在AI工具介入游戏美术工作流程之前,游戏美术工作者完成一张高质量的插画图的时间大概在一周左右,在使用Stable Diffusion等生成式AI工具后,能将一张高质量插画图的生成时间缩短至1天。

图6基于AIGC工具的插画人物绘制过程

在降低不同类型工作者沟通成本方面,生成式AI也有着巨大的应用空间。例如在游戏制作过程中,尤其是在对游戏美术风格进行定调和选型时,游戏策划和美术工作者之间的沟通往往需要耗费大量的时间成本。生成式AI工具的介入,能够帮助策划者快速将创意落地并呈现,极大降低沟通成本。

在工具层面,随着生成式AI对游戏研发效能的提升,各类游戏公司也开始将其融入各自内容制作工具中。游戏芯片公司英伟达于2023年6月发布了面向游戏开发者的AI工具平台NVIDIA ACE for Games,让游戏开发者可以在游戏中构建和部署定制化的语音、对话和动画等AI模型,极大提升游戏内容生产和制作效率;在GDC 2024上,NVIDIA和Inworld 联合公布了一项全新的数字人技术 Covert Protocol,基于该技术塑造的游戏NPC能够与玩家进行实时交互,并且能够能够基于互动内容,实时生成游戏玩法[10]。

图7NVIDIA发布的CovertProtocol技术demo

游戏引擎公司Unity和Unreal也相继发布基于生成式AI的新产品。Unity于2023年7月发布两款基于人工智能技术的新产品:Sentis 和Muse,据悉两款产品可将传统内容创作的效率提升十倍;Unreal也在自身引擎中集成了大量应用了AIGC工具,如数字人制作工具Metahuman creator,尝试以人工智能技术加速创作高质量的角色及大规模场景生成效率。

游戏制作公司也全面拥抱AI技术,用AI赋能内容制作工具,不断提升内容研发效率。以腾讯为例,腾讯AI Lab 在GDC 2024 重磅发布了自研游戏全生命周期AI引擎“GiiNEX”,该引擎借助腾讯自研生成式AI和决策AI模型,面向AI驱动的NPC、场景制作、内容生成等领域,可提供包括3D图形、动画、城市及音乐等多种AIGC能力。在GiiNEX引擎助力下,原本需要5天才能完成的城市建模任务,现在只需要25分钟即可完成,效率提升达百倍[11]。

图8腾讯游戏AI引擎GiiNEX架构图

结语

自1956年达特茅斯会议开始,在人工智能领域,早期的计算机科学家们将AI定义为“使一部机器的反应方式像一个人在行动时所依据的智能”[12],后来几乎所有的人工智能研究都循着“模拟”人类智能的路径,试图打造出能听、能看、能说、能思考、能学习、能行动的人工智能,提升其感知、认知现实世界与遂行决策行动的能力。

时至今日,人工智能研究依旧遵循着模拟人类的路径和目标。如果说以ChatGPT、Sora等为代表的生成式AI大模型,提升了人工智能对事物的“感知”与“认知”能力,完成了迈向通用人工智能的第一步。那么能够让人工智能在复杂、多样的游戏环境中通过机器学习做出合适的“选择”的决策AI模型,则让人工智能具备了“行动”能力,能够根据自身和环境信息进行自主决策,实现了迈向通用人工智能至关重要的一步。

尽管当下的人工智能研究距离实现AGI还有相当长的路要走,但生成式AI和决策AI的结合,无疑为实现AGI开辟了新的可能性,而游戏作为训练AI的试验场,在通用人工智能研究中的角色也愈发重要。我们看到,基于大语言模型和AI智能体的结合,已经能够塑造出像SIMA这样的通用游戏智能体,不仅能在给定环境下做出有效决策,还能不断学习和适应未知环境,并根据自然语言指令完成各类复杂任务,表现出类人智能。未来,随着训练环境的不断增加,通用游戏智能体或将具备对更复杂、更高级语言指令的理解和能力,人们有望创造出更为灵活、适应性更强、更接近人类智能的AI系统。我们也期待,有一天,通用智能体能够通过游戏这个小世界的测试,顺利走向现实大世界的广阔舞台,服务人类社会的千行百业。

感谢曹建峰、刘林、王鹏等在本文写作过程中给予的指导!

最新 更多 >
  • 1 以太坊价格分析:以下是ETH每天崩溃5%后最有可能恢复的水平

    随着以太坊的价格继续走低,投资者怀疑牛市是否已经结束。然而,仍然有一个关键的支持水平可以为复苏提供舞台。 技术分析 通过TradingRage 每日图表 在日线图上,价格在一个大的下降通道模式内呈下降趋势。在过去的几天里,市场未能收复3500美元的水平,在看跌拒绝后下跌。 目前,预计将下降至3000美元的支撑位,这与通道的下限和200天移动平均线重合。 虽然这种支持因素的汇合使3000美元成为一个

  • 2 Celeb处理人员Sahil似乎套现,假冒Iggy杜鹃花代币买家等待退款

    臭名昭著的名人加密货币推广人Sahil Arora获得了38万美元的预售资金,购买了一种他声称是Iggy Azalea的官方加密货币的代币。一个多月后,资金开始离开钱包,但参与者仍然抱怨他们没有收到任何代币。 一位预售参与者告诉Decrypt:“我用两个不同的钱包给他寄了5个SOL(670美元),他就留着。”。另一位网友说:“我投了3个SOL(400美元),但什么也没得到。我很惊讶没有人喊他。”。

  • 3 比特币价格能跌到多低?洗盘完可能涨的会更猛

    截至发稿时比特币的价格为57100美元,价格在本周初上涨至 64,000 美元后,过去三天已下跌逾 9.5%。从图中可以看出,比特币价格从 7 月 2 日的 63,223 美元高点突然跌至 7 月 4 日的盘中低点 56,709 美元。比特币的价格在过去 30 天内下跌了 18%,其每日交易量同期下降了 32%。然而,多项指标暗示比特币将出现更深层次的回调,因此未来几天不太可能迅速从这些损失中恢复

  • 4 什么是Aevo的基础交易金库?它是如何工作的?

    永久合约平台Aevo推出了Aevo Strategies,这是一项新功能,提供自动交易金库,旨在帮助用户执行复杂的策略。 衍生品二层平台最近通过X帖子披露了这一进展,确认用户现在可以无缝访问以前为大型机构和做市商保留的交易策略。 该平台推出的第一个保险库是“基础交易保险库”,这是一种三角洲中立策略,常用于包括Ethena实验室在内的各种协议。这种策略通过收取受市场趋势影响的资金来产生收益。 此外

  • 5 从矿业角度看 BTC 的重要支撑位

    作者:BTC 老矿工,来源:作者推特@BtcOldminer1、电力成本 $30,000(关机价)以全网算力550E,0.38元/度电,目前市场主流矿机T21配置作为参考得出的关机价位,历史上来说,没有出现过当年主流/旗舰机型在相对适中电价的情况下关机的行情。2、黑天鹅支撑 $48,000(关机价*160%)历史上所有黑天鹅都没有出现过低于本周期内电力成本160%的行情,因此依据目前1个BTC电力

  • 6 UFC明星推出Meme Coin,在内幕交易索赔中几分钟内跌至零

    不败的UFC超级明星哈姆扎特·奇马耶夫连续九个月未能进行一场战斗,他转向了加密货币——现在他自己的表情包硬币也开始了。 周二,这位出生于俄罗斯的摔跤手询问粉丝他应该投资哪种加密货币,引来粉丝们的建议和恐慌。这与大多数即将推出自己代币的名人最近的做法相同。果不其然,奇马耶夫就是这么做的。 第二天,他让粉丝们购买以哈姆扎特为主题的表情包“SMASH”——以他放在面前的“粉碎所有人”的著名咒语命名。 奇

  • 7 顶级交易员表示,如果比特币交易量回升至主要阻力位以上,将有10万美元的比特币流入——但有一个陷阱

    一位密切关注的加密货币策略师认为,如果比特币能够收复主要阻力位,其价格可能会达到六位数。 在一次新的策略会议上,化名加密货币分析师DonAlt告诉TechnicalRoundup YouTube频道的61000名订户,如果比特币能够以比当前价格高出9%左右的价格收盘,最近目睹的抛售可能会无效。 之后,该交易员表示,按市值计算,这一顶级加密资产可能会引发反弹,使其超过今年早些时候创下的历史新高。 “

  • 8 摩根大通发布经济警告称,特朗普战胜拜登可能引发“滞胀灵丹妙药”

    摩根大通刚刚就总统大选的经济影响发出警告。 在彭博社的一次新采访中,摩根大通首席全球策略师David Kelly针对前总统特朗普提高进口关税以降低所得税的兴趣。 凯利表示,如果特朗普战胜拜登,大幅提高关税,这位前总统将为滞胀开出药方。 “我确实认为(辩论中)发生的事情有意义地增加了共和党在11月大获全胜的可能性… 现在,如果他们横扫,如果你相信唐纳德·特朗普的话,你会得到更高的关税,而关税是滞胀的

  • 9 萨克斯第五大道母公司HBC以26.5亿美元收购内曼·马库斯集团

    萨克斯第五大道母公司HBC周四表示,将以26.5亿美元的价格收购内曼·马库斯集团,合并这两家著名零售商。合并后将成立萨克斯全球,其中包括萨克斯第五大道、萨克斯OFF 5TH、内曼·马库斯的同名百货连锁店和伯格多夫·古德曼。HBC首席执行官Richard Baker表示:“我们很高兴能迈出这一步,将这些标志性的奢侈品牌汇集在一起。”。在一份声明中说。“多年来,许多业内人士都期待着这笔交易,以及它将为

  • 10 比特币创2月以来新低,期权市场保持乐观

    根据最新数据,当比特币跌至57000美元以下时,加密货币衍生品交易所清算了30543万美元。一位分析师预测,随着Mt Gox和德国政府的抛售,“供应可能会超过需求。”相反,QCP Capital指出,尽管目前加密货币出现抛售,但期权市场仍充满希望。 比特币下跌,加密货币清算突破3.05亿美元 比特币在7月4日跌至57000美元以下,达到每单位56769美元。它仍在努力维持美国东部时间周四上午9:3