谷歌推动Gemini人工智能升级,稳步推进OpenAI的ChatGPT

时间:2024-09-23 编辑: 浏览:(444)

在OpenAI高调宣布其改进的“全模态”大型语言模型GPT-4o的第二天,谷歌对其Gemini AI产品进行了一系列升级,展示了其技术实力,利用了其实时搜索优势,并巩固了其与mindshare领导者ChatGPT的对抗地位。

基于其优势,谷歌正在将生成性人工智能融入其搜索体验,使用户能够与搜索引擎自然互动,而不是依赖于基于关键词的查询。主题演讲包括一个关于去除咖啡污渍的谷歌搜索查询演示。搜索引擎没有仅仅显示带有指令的网页链接,而是立即提供了人工智能生成的全面答案。

这些人工智能生成的结果,旨在直接有效地解决用户查询,将显示在搜索结果上方。

在整个演示过程中,谷歌明确表示,其在网络搜索领域的主导地位转化为其人工智能举措的一个关键优势,展示了各种功能如何利用当前信息,而不是像其他大型语言模型(LLM)那样依赖过时的快照。

其中一个突出的功能是“询问照片”,它允许用户与Gemini进行自然对话,在他们的图库中搜索信息。虽然谷歌照片长期以来一直允许人们在图像库中搜索特定的人、物体或单词,但人工智能的更新支持开放式的自然语言查询。

例如,一位谷歌用户问Gemini他的车的车牌号是什么。Gemini浏览了他所有的照片,对它们进行了评估,并给出了正确的答案。

另一个升级对一系列人工智能会议助理的用户来说很熟悉,包括Zoom等在线会议平台中内置的会议助理。在Google Meet中,Gemini现在可以分析会议,总结会议,并对聊天中的问题做出回应。会议结束后,Gemini会提供一份行动项目和任务分配清单。

最大的新闻涉及引擎盖下的升级。谷歌今天宣布发布Gemini 1.5 Pro,拥有100万个多模式代币的惊人上下文窗口。这一容量使GPT-4的12.8万代币限制相形见绌,并且已经可供科技巨头的付费人工智能服务层Gemini Advanced的开发者和消费者使用。

图片:谷歌

谷歌表示,计划在今年晚些时候进一步扩大其代币处理能力,可能为开发者提供多达200万个代币,比GPT-4o增加十倍。

由于其巨大的容量增加,谷歌还展示了Gemini令人印象深刻的检索能力。这是一个关键功能,因为到目前为止,像Claude或GPT-4这样强大的LLM在收到大量数据提示时,会显示出性能下降——“忘记”之前讨论过的信息。

除了顶级机型外,谷歌还推出了Gemini 1.5 Flash,这是一款紧凑的多模式LLM,旨在与Claude 3 Haiku和GPT-3.5竞争,提供快速答案。然而,其100万代币处理能力使其成为迄今为止最强大的“轻型”机型。

可能最有趣的公告是谷歌的Astra项目,这是一个通用的人工智能代理,可以根据每个用户的需求进行个性化和定制。谷歌指出,Astra的演示是实时录制的,很可能是对OpenAI昨天GPT-4o实时演示的回应。这种互动似乎比GPT-4o更有能力,也没有那么笨拙,尽管反应更具体,也不像人。

虽然双子座的声音也很自然,但它缺乏OpenAI新的ChatGPT声音的情感——甚至“调情”——品质。谷歌的首要任务似乎是功能,而OpenAI则强调更人性化的交互。

超越传统的语言模型,谷歌引入了跨平台可定制的人工智能代理,称其能够推理、规划和记忆。这些能力使双子座表现得像一群专业的人工智能在一起工作。

这些基于API的连接,谷歌称之为“宝石”,似乎是对OpenAI可定制GPT的回应。Gems与谷歌的生态系统无缝集成,提供实时语言翻译、上下文搜索和个性化推荐等功能。用户可以将Gems塑造成专注于特定任务或主题领域,或者使用特定的语气。

图片:谷歌

谷歌还宣布了新的图像、视频和音乐生成人工智能模型。谷歌的新图像生成器Imagen 3提供了高度逼真和详细的图像,与OpenAI的卡通外观形成对比。他们还声称它擅长生成文本,OpenAI也声称这一功能有所改进。

他们还为生成音乐爱好者推出了MusicLM的升级版。

锦上添花的是Veo,一款Generative Video模型,在OpenAI备受吹捧但尚未发布的Sora视频工具发布之前宣布。未经编辑的原始输出表明其质量水平与即将推出的OpenAI条目相当。谷歌表示,它将在几周内推出Veo,这一时间表可能会击败索拉进入市场。

在两个多小时的主题演讲即将结束时,谷歌还向开源社区展示了一些爱,推出了开源愿景模型Pali Gemma。该公司还承诺将于6月推出Gemma 2,这是其开源大型语言模型的下一次迭代。新模型将有一个扩展的令牌上下文窗口,并且将更加强大和准确。

最后,谷歌宣布将首次在其安卓移动操作系统上发布Gemini功能套件。此前,OpenAI明显偏爱苹果的MacOS和iOS平台,在顶级投资者微软创建的Windows平台上发布最新更新之前,它在这些平台上发布了最新更新。

最新 更多 >
  • 1 2009年比特币购买

    2009年比特币购买可以是相关行业人士都值得关心的知识,在此老币网对2009年比特币购买渠道中止精细的引见,并拓展一些相关的知识分享给自己,希冀可以为您带来辅佐!最后获取比特币的渠道只需一个“挖矿”比特币(Bitcoin)的概念最后由中本聪在 2008年11月1日提出,并于2009年1月3日正式出世。比特币的源代码集成了弱小的隐私维护功用。该系统旨在公开记载比特币买卖和其他相关数据,而不披露触及的