OpenAI正在悄悄研发代号“草莓”的神秘项目 其能力或已达到博士水平

时间:2024-09-25 编辑: 浏览:(623)

为了在飞速发展的人工智能领域保持领先地位,OpenAI正在秘密研发一种新的AI模型,代号为“草莓”。

这一消息来自路透社和一位知情人士透露的内部文件。这家由微软支持的初创公司以其ChatGPT产品而闻名,目前正全力展示其模型具备的高级推理能力,这可能会成为AI技术的一大飞跃。

01.“草莓”项目内部一览

根据路透社5月份看到的一份最新内部文件,OpenAI团队正在深入研究“草莓”项目。虽然该文件的确切时间线尚不清楚,但它概述了OpenAI利用“草莓”进行高级人工智能研究的计划。

该项目被称为“正在进行中”,即使在公司内部也一直处于保密状态。“草莓”的目标是让人工智能不仅能生成答案,还能自主、可靠地浏览互联网,进行OpenAI所称的“深度研究”。

“这是迄今为止人工智能模型无法实现的。”消息人士指出了该项目的雄心勃勃。

在被问及“草莓”和这篇报道中的细节时,OpenAI的一位发言人在一份声明中说道:“我们希望我们的人工智能模型能像我们一样看待和理解这个世界。持续研究新的AI能力是业界的普遍做法,我们的共同信念是,随着时间的推移,这些系统的推理能力将不断提高。”

但这位发言人没有直接回答有关“草莓”的问题。

02.从Q到“草莓”推理新时代

有消息称,“草莓”是前一个名为Q的项目的继任者。

据两位知情人士透露,OpenAI内部已将Q视为一项突破,因为它能够回答复杂的科学和数学问题,超越了目前大多商业化模型的能力。

据彭博社报道,在今年的一次内部全体会议上,OpenAI展示了一个研究项目,展示了新的类人推理能力。

虽然路透社无法证实所展示的项目是否为“草莓”,但这与该公司一直以来为增强人工智能推理能力所做的努力不谋而合。

OpenAI首席执行官奥特曼强调了推理在AI中的重要性,他在今年早些时候表示,“最重要的进步领域将围绕推理能力展开”。

03.人工智能推理的挑战

研究人员认为,提高人工智能模型的推理能力是实现人类或超人级智能的关键。虽然大型语言模型可以高效地总结文本和撰写文章,但它们在常识性问题和逻辑任务上会经常失误,导致所谓的“幻觉”或生成错误信息。

根据AI研究人员的描述,推理涉及人工智能规划、理解物理世界和解决多步骤问题的能力。

OpenAI的“草莓”项目旨在通过采用专门的后期训练过程来克服这些挑战。这包括在大量数据集上对人工智能模型进行预训练后,对其进行微调。

据一位知情人士透露,“草莓”的方法与斯坦福大学的“自学推理”(STaR)有相似之处,后者允许人工智能模型迭代地创建自己的训练数据,有可能使它们达到更高的智能水平。

STaR的创造者之一、斯坦福大学教授Noah Goodman评论说:“我认为这既令人兴奋,又令人恐惧......如果事情继续朝着这个方向发展,作为人类,我们就有一些严肃的事情需要思考了。”

04.长任务规划和自主研究

“草莓”项目雄心勃勃的目标之一是能够执行长期任务(LHT),这要求人工智能在较长时间内计划并执行一系列行动。

内部文件显示,OpenAI正在一个“深度研究”数据集上训练和评估模型,以实现这些能力。

虽然该数据集的具体内容和延长时间仍未披露,但目标很明确:让人工智能能够在计算机使用代理(CUA)的帮助下自主开展研究,并根据研究结果采取行动。

05.竞争激烈的人工智能产业

在增强人工智能推理能力方面,OpenAI并非孤军奋战。谷歌、Meta和微软等大型科技公司以及众多学术实验室也在探索各种技术,以提高人工智能的推理能力。

然而,对于大型语言模型能否在预测中纳入长期规划和高级推理,人们的看法却不尽相同。Meta的现代人工智能先驱YannLeCun就经常对大语言模型(LLM)能否实现类人推理的能力表示怀疑。

“草莓”代表了OpenAI战略的重要组成部分,旨在解决当前AI模型的局限性。通过开发更先进的推理能力,OpenAI旨在为人工智能开启新的可能性,从科学发现到创建新的软件应用。

同时,该公司一直在向开发者和合作伙伴发出信号,表示即将发布推理能力显著增强的技术。

“草莓”的开发包括微调等后期训练方法,其中涉及人类反馈和迭代学习过程。这些技术旨在完善人工智能模型,提高它们在特定任务中的表现。

通过“草莓”技术取得的进步可以重新定义人工智能的能力,并为这些模型所能达到的目标设定新的标准。

虽然前进的道路充满挑战,但潜在的回报也是巨大的,预示着一个智能、自主的人工智能系统的新时代即将到来。

用OpenAI发言人的话来说,“我们希望我们的人工智能模型能像我们一样看待和理解这个世界。如果‘草莓’项目取得成功,我们就离实现这一愿景更近了一步。”

OpenAI引入了一个五级系统来跟踪其在实现通用人工智能(AGI)的进展。这些等级从代表当前对话式人工智能的第1级,到设想能够管理和执行整个组织工作的第5级,涵盖了不同层次的AI能力。

下面是OpenAI划定的五个人工智能等级:

1.聊天机器人:具备对话语言的Al

2.推理者:具备人类水平的问题解决能力

3.代理者:能够采取行动的系统

4.创新者:能够帮助发明创造的AI

5.组织者:能够完成组织工作的Al

OpenAI认为“草莓”正在接近第2级,这一级涉及解决问题,类似于不借助工具的博士水平。该框架旨在提供一种结构化的方法来理解和开发人工智能系统,从而最终超越人类智能。

原文来源于:

https://www.tekedia.com/strawberry-project-openai-developing-a-new-reasoning-ai-technology/

中文内容由元宇宙之心(MetaverseHub)团队编译,如需转载请联系我们。

最新 更多 >
  • 1 币安将于9月2日开始将Monero转换为USDC,作为退市的一部分

    继币安2月份宣布将Monero(XMR)退市并于当月晚些时候最终确定后,该交易所现在宣布了将隐私币从其平台上撤下的最后步骤。 在8月12日的一篇博客文章中,币安表示将于2024年9月2日将包括XMR在内的15种不同代币的余额转换为美元硬币(USDC)。转换将于2025年3月1日完成,USDC将进入用户钱包。 公告解释说,这些资产的转换率将基于2024年9月2日至2025年3月1日的平均汇率。 除门

  • 2 PEPE、PEPE Unchained(PEPU)和MPEPE:2024年将赚取数百万美元的三大Meme币

    加密货币领域充满了潜力,尤其是在模因币领域。随着2024年的临近,三位杰出的竞争者——百事可乐(PEPE)、解放的百事可乐(PEPE Unchained)和Mpeppe(MPPE)——正受到广泛关注。这就是为什么这些模因币正在掀起波澜,并可能成为你获得巨额利润的门票。 PEPE:Meme币的老手 为什么PEPE继续领先 百事可乐(PEPE)长期以来一直是模因币领域的先驱,其灵感来自标志性的青蛙佩佩

  • 3 普京猛轰基辅“严厉报复” 中东火药桶引爆 比特币一度跌穿5.8万

    周一(8月12日)亚市尾盘,黄金短线反弹触及2442美元,比特币跌深一度失守58000美元关口,最低探至57651美元。乌克兰总统泽连斯基周末打破沉默,首次正式确认大胆的跨境俄罗斯地面行动,俄罗斯总统普京政府开始对乌克兰首都实施严厉报复。伊朗袭击威胁迫在眉睫,真主党向以色列发射火箭弹。俄罗斯猛轰乌克兰首都实施“严厉报复”知名金融博客ZeroHedge报道,库尔斯克入侵行动已经进入第六天,泽连斯基表

  • 4 用中文创造的Web3文化有多少原创性?

    作者:larri 「去中心化、DAO、公共物品、创作者经济、网络城邦、互操作性、代币经济、共识机制、创作者基本收入、主权个人……」 这些你听过的web3概念,有多少是从英语翻译来的?今天,我们还和100多年前的前辈一样,学着拉丁系的语言,把汉字中的“民”和“主”组在一起思考社会、将“科”和”学“组在一起理解知识么? 我们在创造、还是依然在翻译?能公开检索的中文web3信息里,非常高的比例是硬核技术

  • 5 奖项如何提升你的品牌

    外汇经纪商面临着开发和维护一个真正独特于竞争对手的品牌的挑战。通过奖项获得品牌认可可以通过提供合法性、知名度和认可度来提高您的品牌在金融服务行业的声誉。 获奖如何加强您的品牌在金融服务领域的地位: 增强品牌信誉 奖项是行业的有力支持。对于外汇阅读本条款经纪商和在线交易阅读本条款平台,获得奖项可以证明品牌卓越,并保证为客户和合作伙伴提供高质量的服务和可靠性。 提高品牌知名度 认可过程,包括公告和促销

  • 6 加利福尼亚市推出新的“比特币办公室”,致力于BTC的“转型潜力”

    加利福尼亚州圣莫尼卡正在设立一个新的办公室,致力于向社区宣传比特币(BTC)。 在一份新的公告中,洛杉矶县圣莫尼卡市政府表示,将开设比特币办公室,帮助居民和企业了解其在现代经济中的潜力和作用。 “我们与劳动力证明基金会合作,致力于提供有关比特币及其在现代经济中的作用的全面教育,帮助圣莫尼卡居民和企业了解这项创新技术。 除了提供教育外,比特币办公室的使命还侧重于确定和促进比特币行业合作伙伴关系,积极

  • 7 什么是Mskcoin MASK(MAK)

    Mskcoin  MASK | 简介Mskcoin  MASK是一个去中心化的区块链公有网络,由欧盟、IMF等国际组织联合发起,共同治理的,致力于打造打造去中心化WEB3.0生态以及隐私匿名功能生态应用平台。同时打造属于自己的DEX,与其他 DEX( Swap)相比,MASK不仅仅是个DEX,多赛道布局是 MASK立身根本。同时采用创新型税收股权制社区治理方案,将平台收益权所有权交还社区,实现社区

  • 8 WIF领先于狗狗币?分析dogwifhat 21%的激增

    在周线图上,WIF飙升了21%。过去一周,Dogwifhat的未平仓合约增加了51.5%。 在过去的两周里,加密货币市场经历了极端的波动。自一周前市场崩盘以来,大多数加密货币正在复苏。 在这种复苏中,模因币已经领先,WIF领先。基于Solana的模因币dogwifhat[WIF]正在超越其他模因币,取得了显著收益。 Dogwifhat引领模因币市场 WIF在周线图上的涨幅超过了大多数模因币。 首先

  • 9 前美国证券交易委员会官员表示,摩根士丹利通过向客户提供比特币ETF来释放“死亡愿望”

    美国证券交易委员会(SEC)互联网执法办公室前负责人表示,摩根士丹利最近对比特币(BTC)的接受将引起政府的审查。 摩根士丹利最近允许其财富顾问向其富裕客户推销比特币交易所交易基金(ETF)产品。 在社交媒体平台X上,John Reed-Stark表示,通过允许其经纪人向客户推销BTC ETF,摩根士丹利现在已经接受了他所说的“历史上最大的SEC和FINRA审查” 据这位前美国证券交易委员会官员称

  • 10 马拉松数字控股股份有限公司宣布拟私募发行2.5亿美元可转换优先票据

    马拉松数字控股股份有限公司宣布拟私募发行2.5亿美元可转换优先票据 收益主要用于收购比特币和一般企业用途 佛罗里达州劳德代尔堡,2024年8月12日(环球新闻)——马拉松数字控股有限公司(纳斯达克股票代码:MARA)(“MARA”或“公司”),一家利用数字资产计算支持能源转型的全球领导者,今天宣布,根据市场条件和其他因素,它打算根据1933年《证券法》修订版(“证券法”)第144A条,以私募方式向