微软的人工智能语音克隆技术太好了,你无法使用它

时间:2024-09-30 编辑: 浏览:(418)

微软的研究团队推出了VALL-E 2,这是一种新的语音合成人工智能系统,能够用几秒钟的音频生成“人类级性能”的声音,这些声音与来源无法区分。

研究论文写道:“(VALL-E 2)是神经编解码语言模型的最新进展,标志着零样本文本到速度合成(TTS)的里程碑,首次实现了人类的奇偶性。”该系统建立在2023年初推出的前身VALL-E的基础上。神经编解码器语言模型将语音表示为代码序列。

该团队表示,VALL-E 2与其他语音克隆技术的区别在于其“重复感知采样”方法和采样技术之间的自适应切换。这些策略提高了一致性,并解决了传统生成声音中最常见的问题。

研究人员写道:“VALL-E 2能够始终如一地合成高质量的语音,即使是那些由于复杂或重复短语而传统上具有挑战性的句子。”他们指出,这项技术可以帮助失去说话能力的人生成语音。

然而,尽管它令人印象深刻,但该工具将不会向公众开放。

微软在其道德声明中表示:“目前,我们没有计划将VALL-E 2纳入产品中,也没有计划扩大对公众的访问。”微软指出,这些工具带来了风险,如未经同意的声音模仿,以及在骗局和其他犯罪活动中使用令人信服的人工智能声音。

研究团队强调,需要一种标准的方法来对人工智能世代进行数字标记,并认识到高精度检测人工智能生成的内容仍然是一个挑战。

他们写道:“如果该模型被推广到现实世界中看不见的说话者,它应该包括一个协议,以确保说话者批准使用他们的声音和一个合成的语音检测模型。”。

也就是说,与其他工具相比,VALL-E2的结果非常准确。在研究团队进行的一系列测试中,VALL-E2在生成语音的稳健性、自然度和相似性方面优于人类基准。

图片:Microsoft

VALL-E-2只需3秒的音频就可以实现这些结果。然而,研究小组指出,“使用10秒的语音样本可以获得更好的质量。”

微软并不是唯一一家在没有发布尖端人工智能模型的情况下展示这些模型的人工智能公司。Meta的Voicebox和OpenAI的Voice Engine是两个令人印象深刻的语音克隆器,它们也面临着类似的限制。

Meta AI发言人去年告诉Decrypt:“生成语音模型有很多令人兴奋的用例,但由于潜在的滥用风险,我们目前没有公开Voicebox模型或代码。”。

此外,OpenAI解释说,在推出合成语音模型之前,它正试图首先解决安全问题。

OpenAI在一篇官方博客文章中解释道:“根据我们对人工智能安全的态度和我们的自愿承诺,我们选择预览但目前不广泛发布这项技术。”。

这种对道德准则的呼吁正在整个人工智能社区传播,尤其是随着监管机构开始对生成性人工智能在我们日常生活中的影响表示担忧。

由Ryan Ozawa编辑。

最新 更多 >
  • 1 以太坊价格的警告信号?交易员们,小心这个指数!

    以太坊的指标显示,尽管最近出现了反弹,但牛市有理由感到担忧。更高的时间偏差是牛市,但可能在一两周内下跌2%-7% 5月20日,经过三周的努力,以太坊(ETH)突破了310万美元的关键阻力区。这一举措是在以太坊现货ETF获批的消息传出后不久做出的,官方将于5月23日批准。 然而,自交易量激增以来,交易量已降至5月早些时候的水平。NFT市场的活动也明显下降。此外,美国投资者的兴趣也大幅下降。 Coin

  • 2 华尔街顶级分析师看好这些股息股

    在这篇文章中TGT HAS IBM关注你最喜欢的股票REATE FREE ACCOUNT 交易员在纽约证券交易所工作。Brendan McDermid |路透社 在动荡的市场中,投资者可以转向股息支付的股票,这些股票可以提供收入,并有助于在困难时期缓冲投资组合。考虑到股息支付公司的庞大规模,选择合适的股票可能是一项艰巨的任务。为此,投资者可以跟踪华尔街专家的建议,他们会对公司的盈利增长潜力和股

  • 3 储蓄应用首席执行官表示,85000个账户被锁定在金融科技崩溃中:“我们从未想过会出现这样的情况”

    奥斯卡·王|时刻|盖蒂图片社 2019年,Adam Moelis与人共同创立了一家名为Yotta的金融科技初创公司,他想给美国人一种新的省钱方式,帮助他们缓解生活的起伏。相反,他的公司无意中给成千上万依靠Yotta账户领取工资、支付账单和为紧急情况储蓄的客户带来了深深的痛苦。这场危机始于5月11日,当时Yotta的两个银行合作伙伴——金融科技中间商Synapse和总部位于田纳西州的Evolve

  • 4 热门加密货币赢家今日6月2日-虫洞、WEMIX、Mask Network、离心机

    在最近的一次摩根大通会议上,Coinbase首席运营官Emilie Choi对加密货币市场的不可预测性提出了令人耳目一新的看法。当被问及加密货币周期时,她打趣道:“所以我足够聪明,不会预测我们在周期中的位置,因为我相信我总是错的。”这突出了一个关键的投资教训:市场时机几乎是不可能的,而且经常会导致错误。 Choi的见解强调了长期投资方法的重要性。投资者应该专注于保持投资,而不是试图把握市场的时间,

  • 5 顶级DEX Altcoin Uniswap(UNI)在项目延迟协议升级后价格下跌

    周五,在去中心化交易所(DEX)宣布决定投资一项重要的协议升级后,Uniswap的本地资产UNI暴跌约9%。 DEX计划于周五启动链上投票,以实施一项提案,该提案将启用一种收费机制,奖励已下注并委托其代币的UNI代币持有人。 升级旨在减轻Uniswap治理的负担,并保持协议的“可信中立性” 然而,据Uniswap基金会称,在过去的一周里,一位利益相关者提出了“与这项工作有关的一个新问题,需要额外的

  • 6 以太坊在最近的趋势中表现优于比特币-最新加密货币新闻

    以太坊(ETH)在对抗比特币(BTC)时表现出了令人印象深刻的表现,达到了一个显著的水平,这可能会引发altcoin热潮。自5月中旬以来,受美国批准以太坊现货ETF的猜测推动,以太坊的表现优于比特币。 内容隐藏1是什么推动了以太坊的激增?2为什么ETH/BTC比率显著?3个关键要点 是什么推动了以太坊的激增? 在宣布可能批准以太坊现货ETF后,以太坊的价格飙升。ETH/BTC对目

  • 7 2024年顶级Meme Coin预售:MoonBag吹走Binance和Ripple

    加密货币市场以其诱人的高回报和创新的金融解决方案吸引投资者。在众多数字资产中,MoonBag(MBAG)、币安币(BNB)和Ripple(XRP)凭借其独特的属性和市场策略抢占了聚光灯。 本文考虑到这些加密货币的市场表现、流动性和未来潜力,对其进行了详细的了解。无论是考虑到MoonBag币,它在2024年因其无与伦比的Top meme币预售而备受关注,还是考虑到币安在其社区中的广泛应用,或者XR

  • 8 BNB的下一步行动:它会突破600美元吗?还是应该为暴跌做好准备?

    BNB的价格目前呈三角下降趋势。对altcoin的需求必须增加,才能突破这个三角形的上线。 自5月27日币价达到612美元的峰值以来,币安币一直呈下跌趋势,形成了一个下降的三角形。截至本文撰写之时,altcoin的交易价格为593.11美元,在过去三天里下跌了3%。 十字路口的BNB 按照目前的价格,币安币的交易价格略低于下降三角形的底线,这形成了支撑。 为了实现向这个三角形(阻力位)的上方反弹,

  • 9 Farcaster投资1.5亿美元,解决Web3社交媒体障碍

    Farcaster是web3社交媒体领域的佼佼者,其最新成就继续成为头条新闻:获得了Paradigm牵头的1.5亿美元的巨额投资。 资金激增与六个月前Farcaster向无许可模式转型后的惊人增长数字不谋而合。 尽管面临着典型的行业挑战,但该社交中心拥有35万个付费注册,网络活动显著增加了50倍,正在加强其作为在线网络变革力量的地位。 来源:Farcaster

  • 10 当宇宙网络衰落和Arbitrum受挫时,Moonbag预售是投资者的首选

    您是否正在寻找加密货币世界的下一个重大机遇?尽管Cosmos的交易量、价格和网络活动急剧下降,Arbitrum在DeFi的采用和代币稳定性方面面临重大挫折,但MoonBag硬币的预售越来越令人兴奋。这款迷因币旨在将迷因文化的乐趣与创新的金融策略相结合,为投资者提供一个独特的机会,让他们尽早进入并实现回报最大化。MoonBag的预售已经创造了巨大的FOMO,第四阶段的定价定为1 MBAG=0.000