谷歌I/O总结：Gemini AI更新、新搜索功能等

时间：2024-09-19 编辑： 浏览：(265)

在这篇文章GOOGL关注你最喜欢的股票REATE FREE ACCOUNT 谷歌首席执行官桑达尔·皮查伊在谷歌I/O开发者大会上发言。Andrej Sokolow |图片联盟|盖蒂图片社周二，谷歌举办了年度I/O开发者大会，推出了一系列人工智能产品，从新的搜索和聊天功能到面向云客户的人工智能硬件。这些公告强调了该公司在抵御OpenAI等竞争对手时对人工智能的关注。谷歌推出的许多功能或工具只是在测试中，或仅限于开发人员，但它们让我们了解了谷歌如何看待人工智能以及在哪里投资。谷歌通过向使用其模型的开发者和支付Gemini Advanced的客户收取费用，从人工智能中赚钱。Gemini是其ChatGPT的竞争对手，每月收费19.99美元，可以帮助用户汇总PDF、谷歌文档等。周二的公告是在其人工智能竞争对手举办类似活动之后发布的。本月早些时候，亚马逊支持的Anthropic宣布了其首个企业产品和免费的iPhone应用程序。与此同时，OpenAI于周一推出了新的人工智能模型和桌面版ChatGPT，以及新的用户界面。以下是谷歌宣布的内容。

Gemini AI更新

谷歌推出了Gemini 1.5 Pro的更新，这是其人工智能模型，很快将能够处理更多的数据——例如，该工具可以汇总用户上传的1500页文本。还有一种新的Gemini 1.5 Flash AI模型，该公司表示，该模型更具成本效益，适用于快速总结对话、为图像和视频添加字幕以及从大型文档中提取数据等较小的任务。谷歌首席执行官桑达尔·皮查伊强调了Gemini翻译的改进，并补充说，全球所有开发者都可以使用35种语言。皮查伊说，在Gmail中，Gemini 1.5 Pro将分析附件中的PDF和视频，提供摘要等。这意味着，如果你在度假时错过了一封很长的电子邮件，双子座将能够将其与任何附件一起汇总。新的Gemini更新也有助于搜索Gmail。该公司举了一个例子：如果你一直在比较不同承包商的价格来修复你的屋顶，并正在寻找一个摘要来帮助你决定选择谁，Gemini可以在不同的电子邮件线程中返回三个报价以及预期的开始日期。谷歌表示，Gemini最终将取代安卓手机上的谷歌助手，这意味着它将成为iPhone上苹果Siri的更强大竞争对手。

Google Veo、Imagen 3和音频概述

谷歌宣布了其最新的高清视频生成模型“Veo”和最高质量的文本到图像模型Imagen 3，该模型承诺图像逼真，“比我们以前的模型更少令人分心的视觉伪像”。这些工具将于周一提供给选定的创作者，并将在谷歌的机器学习平台Vertex AI上使用，该平台允许开发者训练和部署人工智能应用程序。在此之前，将有一个等待名单。该公司还展示了“音频概述”，即基于文本输入生成音频讨论的能力。例如，如果用户上传了一个课程计划，聊天机器人可以说出它的摘要。或者，如果你问一个现实生活中的科学问题的例子，它可以通过交互式音频来做。立即观看视频2:1502:15 Alphabet首席执行官桑达尔·皮查伊：我们可以通过生成人工智能来更好地进行谷歌搜索另外，该公司还展示了“人工智能沙盒”，这是一系列基于用户提示从头开始创建音乐和声音的生成人工智能工具。然而，聊天机器人和图像创作者等生成型人工智能工具的准确性仍然存在问题。谷歌搜索主管Prabhakar Raghavan上个月告诉员工，竞争对手“可能有一个新的小发明，人们喜欢玩，但他们仍然会来谷歌验证他们在那里看到的东西，因为它是可信的来源，在这个生成人工智能的时代，它变得更加重要。”今年早些时候，谷歌推出了Gemini驱动的图像生成器。用户发现了在网上疯传的历史错误，该公司取消了该功能，并表示将在未来几周内重新推出。该功能仍未重新发布。

新的搜索功能

谷歌搜索主管Liz Reid表示，谷歌将于周一在美国谷歌搜索中推出“人工智能概览”。人工智能概览显示了最复杂搜索问题的快速答案摘要。例如，如果用户搜索清洁皮靴的最佳方法，结果页面可能会在顶部显示“人工智能概述”，其中包含多步骤清洁过程，这些过程是从网络上合成的信息中收集的。该公司表示，计划直接在搜索中引入类似助手的规划功能。谷歌解释说，用户将能够搜索诸如“为一个易于准备的群体创建一个3天的用餐计划”之类的内容，你将从网络上的各种食谱中获得起点。就其提供“多模式”或在生成人工智能工具中集成更多图像和视频的进展而言，谷歌表示将开始测试用户通过视频提问的能力，例如拍摄他们拥有的产品的问题，上传并要求搜索引擎找出问题。在一个例子中，谷歌显示有人在拍摄一台坏了的录音机时问它为什么不工作。谷歌搜索发现了这台录音机的型号，并表示它可能出现了故障，因为它没有得到适当的平衡。测试中的另一个新功能“AI队友”将集成到用户的谷歌工作区中。它可以从带有更多PDF和文档的消息和电子邮件线程中构建一个可搜索的工作集合。例如，一位未来的创始人可以问人工智能团队成员，“我们准备好发布了吗？”助理将根据其在Gmail、谷歌文档和其他工作区应用程序中可以访问的信息提供分析和总结。

Astra项目

Astra项目是谷歌在人工智能助手方面的最新进展，该助手由谷歌的DeepMind人工智能部门构建。目前它只是一个原型，但你可以把它看作谷歌开发自己版本的J.a.R.V.I.s.的目标，J.a.R.R.V.I.s是托尼·斯塔克在漫威宇宙中的无所不知的人工智能助手。在谷歌I/O上展示的演示视频中，助手通过视频和音频，而不是聊天机器人界面，能够帮助用户记住他们把眼镜放在哪里，查看代码，并在视频中显示扬声器时回答关于扬声器的某个部分叫什么的问题。谷歌表示，一个真正有用的聊天机器人需要让用户“自然地、无延迟地与它交谈”。演示视频中的对话是实时进行的，没有延迟。该演示是在OpenAI周一展示与ChatGPT的类似音频来回对话之后进行的。DeepMind首席执行官德米斯·哈萨比斯（Demis Hassabis）在台上表示，“将响应时间减少到对话是一项艰巨的工程挑战。”皮查伊表示，他预计阿斯特拉项目将于今年晚些时候在双子座启动。

AI硬件

最后，谷歌宣布了其第六代TPU Trillium，即张量处理单元，这是运行复杂人工智能操作不可或缺的硬件，将于2024年底向云客户提供。TPU并不打算与其他芯片竞争，比如英伟达的图形处理单元。例如，Pichai在I/O期间指出，谷歌云将于2025年初开始提供英伟达的Blackwell GPU。英伟达在3月份表示，谷歌将使用Blackwell平台进行“各种内部部署，并将成为首批提供Blackwell支持实例的云提供商之一”，对英伟达系统的访问将有助于谷歌为构建大型语言模型的企业开发人员提供大规模工具。皮查伊在演讲中强调了谷歌“与英伟达的长期合作关系”。这两家公司已经合作了十多年，皮查伊过去曾表示，他预计十年后他们仍会这样做。观看：CNBC对Alphabet首席执行官桑达尔·皮查伊的完整采访视频11:0311:03观看CNBC对Alphabet首席执行官桑达尔·皮查伊的完整采访闭幕钟：加班