微软的人工智能语音克隆技术太好了,你无法使用它

时间:2024-09-19 编辑: 浏览:(326)

微软的研究团队推出了VALL-E 2,这是一种新的语音合成人工智能系统,能够用几秒钟的音频生成“人类级性能”的声音,这些声音与来源无法区分。

研究论文写道:“(VALL-E 2)是神经编解码语言模型的最新进展,标志着零样本文本到速度合成(TTS)的里程碑,首次实现了人类的奇偶性。”该系统建立在2023年初推出的前身VALL-E的基础上。神经编解码器语言模型将语音表示为代码序列。

该团队表示,VALL-E 2与其他语音克隆技术的区别在于其“重复感知采样”方法和采样技术之间的自适应切换。这些策略提高了一致性,并解决了传统生成声音中最常见的问题。

研究人员写道:“VALL-E 2能够始终如一地合成高质量的语音,即使是那些由于复杂或重复短语而传统上具有挑战性的句子。”他们指出,这项技术可以帮助失去说话能力的人生成语音。

然而,尽管它令人印象深刻,但该工具将不会向公众开放。

微软在其道德声明中表示:“目前,我们没有计划将VALL-E 2纳入产品中,也没有计划扩大对公众的访问。”微软指出,这些工具带来了风险,如未经同意的声音模仿,以及在骗局和其他犯罪活动中使用令人信服的人工智能声音。

研究团队强调,需要一种标准的方法来对人工智能世代进行数字标记,并认识到高精度检测人工智能生成的内容仍然是一个挑战。

他们写道:“如果该模型被推广到现实世界中看不见的说话者,它应该包括一个协议,以确保说话者批准使用他们的声音和一个合成的语音检测模型。”。

也就是说,与其他工具相比,VALL-E2的结果非常准确。在研究团队进行的一系列测试中,VALL-E2在生成语音的稳健性、自然度和相似性方面优于人类基准。

图片:Microsoft

VALL-E-2只需3秒的音频就可以实现这些结果。然而,研究小组指出,“使用10秒的语音样本可以获得更好的质量。”

微软并不是唯一一家在没有发布尖端人工智能模型的情况下展示这些模型的人工智能公司。Meta的Voicebox和OpenAI的Voice Engine是两个令人印象深刻的语音克隆器,它们也面临着类似的限制。

Meta AI发言人去年告诉Decrypt:“生成语音模型有很多令人兴奋的用例,但由于潜在的滥用风险,我们目前没有公开Voicebox模型或代码。”。

此外,OpenAI解释说,在推出合成语音模型之前,它正试图首先解决安全问题。

OpenAI在一篇官方博客文章中解释道:“根据我们对人工智能安全的态度和我们的自愿承诺,我们选择预览但目前不广泛发布这项技术。”。

这种对道德准则的呼吁正在整个人工智能社区传播,尤其是随着监管机构开始对生成性人工智能在我们日常生活中的影响表示担忧。

由Ryan Ozawa编辑。

最新 更多 >
  • 1 南非初创公司Neonomad将推出稳定币Zarcoin

    南非混合交易平台Neonomad将推出与南非兰特挂钩的稳定币Zarcoin。根据一份报告,该稳定币将迎合没有银行账户和有银行账户的南非人,利用Solana进行即时支付和低成本交易。

  • 2 " 发文称“拜登接受临终关怀”的X账号已被删除

    此前在X平台发文称“拜登接受临终关怀”的账号“Global Press”页面已不存在。该账号此前表示,如果发布的是假消息,就会删除账号。

  • 3 "7月23日9只ETF增持8021枚BTC

    据Lookonchain监测,7月23日更新: ·贝莱德增持7,764枚BTC(5.1584亿美元),目前持有334,943枚BTC(222.5亿美元); ·灰度增持268枚BTC(1780万美元),目前持有272,062枚BTC(180.8亿美元); 9只ETF增持8,021枚BTC(5.3293亿美元)。

  • 4 特朗普宣布比特币战略储备计划

    美国前总统特朗普在比特币2024会议上表示,若当选,政府将100%保留其拥有的比特币。

  • 5 "pump.fun竞品Meme Royale双币PK玩法已获Solana官方及联创toly关注

    7月27日消息,Solana 生态新 Meme 币启动平台 Meme Royale 在社区内引发热议。除了对标 pump.fun 的 Meme 币启动功能外,Meme Royale 还推出了Battles功能,支持用户通过投入流动性来参与双币 PK,获胜一方的 Meme 币将吸取失败方 Meme 币池子的流动性,失败方的筹码将以较低的价格转换为胜利方的筹码。 Meme Royale 官推目前已获得

  • 6 XT首发DARKMUSK/USDT,涨幅达230%

    Odaily星球日报讯 XT.COM 首发代币 DARKMUSK,开盘价 0.006000,现报 0.019817,日前涨幅已达 230.28%。现已开放充提。

  • 7 Gate Charity为印尼Duano部落开展”海洋之书”扫盲活动

    Odaily星球日报讯 据官方消息,Gate Group 旗下的全球性非盈利区块链慈善组织 Gate Charity 近日于在印度尼西亚成功举办了“海洋之书:Duano 部落扫盲活动”。该活动旨在提高 Duano 部落的教育水平,帮助这个传统上被称为“海上人”的土著社区克服教育障碍。Gate Charity 与当地社区、教育工作者和志愿者合作,提供基本的扫盲资源,为约 100 名当地儿童举办学习活

  • 8 " BTC跌破64000 USDT,24H跌幅3.51%

    Odaily星球日报讯 OKX 行情显示,BTC 跌破 64000 USDT,现报 63993.9 USDT,24H 跌幅 3.51%。

  • 9 " BTC跌破65500美元

    行情显示,BTC跌破65500美元,现报65398美元,日内跌幅达到0.79%,行情波动较大,请做好风险控制。

  • 10 " 马斯克的X平台将默认使用用户公开帖子训练Grok AI模型

    据X平台(原Twitter)@Safety账号发布的公告,所有X用户现在可以控制其公开帖子是否可用于训练Grok AI搜索助手,该选项默认启用。除了现有的控制选项,用户还可以管理与Grok相关的互动、输入和结果是否被利用。该隐私选项目前在网页版平台可用,并将在移动端推出。用户可以在隐私设置(隐私和安全-数据共享和个性化-Grok-数据共享-允许将您的帖子以及您与 Grok 的互动、输入和结果用于训