微软的人工智能语音克隆技术太好了,你无法使用它

时间:2024-09-21 编辑: 浏览:(76)

微软的研究团队推出了VALL-E 2,这是一种新的语音合成人工智能系统,能够用几秒钟的音频生成“人类级性能”的声音,这些声音与来源无法区分。

研究论文写道:“(VALL-E 2)是神经编解码语言模型的最新进展,标志着零样本文本到速度合成(TTS)的里程碑,首次实现了人类的奇偶性。”该系统建立在2023年初推出的前身VALL-E的基础上。神经编解码器语言模型将语音表示为代码序列。

该团队表示,VALL-E 2与其他语音克隆技术的区别在于其“重复感知采样”方法和采样技术之间的自适应切换。这些策略提高了一致性,并解决了传统生成声音中最常见的问题。

研究人员写道:“VALL-E 2能够始终如一地合成高质量的语音,即使是那些由于复杂或重复短语而传统上具有挑战性的句子。”他们指出,这项技术可以帮助失去说话能力的人生成语音。

然而,尽管它令人印象深刻,但该工具将不会向公众开放。

微软在其道德声明中表示:“目前,我们没有计划将VALL-E 2纳入产品中,也没有计划扩大对公众的访问。”微软指出,这些工具带来了风险,如未经同意的声音模仿,以及在骗局和其他犯罪活动中使用令人信服的人工智能声音。

研究团队强调,需要一种标准的方法来对人工智能世代进行数字标记,并认识到高精度检测人工智能生成的内容仍然是一个挑战。

他们写道:“如果该模型被推广到现实世界中看不见的说话者,它应该包括一个协议,以确保说话者批准使用他们的声音和一个合成的语音检测模型。”。

也就是说,与其他工具相比,VALL-E2的结果非常准确。在研究团队进行的一系列测试中,VALL-E2在生成语音的稳健性、自然度和相似性方面优于人类基准。

图片:Microsoft

VALL-E-2只需3秒的音频就可以实现这些结果。然而,研究小组指出,“使用10秒的语音样本可以获得更好的质量。”

微软并不是唯一一家在没有发布尖端人工智能模型的情况下展示这些模型的人工智能公司。Meta的Voicebox和OpenAI的Voice Engine是两个令人印象深刻的语音克隆器,它们也面临着类似的限制。

Meta AI发言人去年告诉Decrypt:“生成语音模型有很多令人兴奋的用例,但由于潜在的滥用风险,我们目前没有公开Voicebox模型或代码。”。

此外,OpenAI解释说,在推出合成语音模型之前,它正试图首先解决安全问题。

OpenAI在一篇官方博客文章中解释道:“根据我们对人工智能安全的态度和我们的自愿承诺,我们选择预览但目前不广泛发布这项技术。”。

这种对道德准则的呼吁正在整个人工智能社区传播,尤其是随着监管机构开始对生成性人工智能在我们日常生活中的影响表示担忧。

由Ryan Ozawa编辑。

最新 更多 >
  • 1 比特币大涨的真相:如何避免投资陷阱, 保护你的财富 !

    昨天一个朋友找我聊天,他最近疯狂买比特币,把买的全都存到冷钱包里。他坚信比特币在未来的牛市中能涨到20万美元,想狠狠赚一笔。我曾经也像他一样狂热,省吃俭用,疯狂买进。我觉得,人生在世,就应该勇敢把握机会。但是,随着年龄的增长和经验的积累,我现在的想法变了。我认为,克制贪婪、顺应市场趋势才是明智的做法。金融市场是充满不确定性的世界,真正的事实是资源有限且分布不均。全球各地的冲突,其实就是为了争夺这些

  • 2 DFZ Labs和Unstopable Domains将推出.DFZ Web3域名

    DFZ Labs是Deadfellaz NFT项目的创建者,与Unstopable Domains合作推出了.DFZ域名,旨在改善Deadfellaz社区的数字身份管理。 .dfz域名允许用户为区块链交易创建人类可读的地址,与以太坊和Polygon等平台兼容。 这些域名旨在简化发送和接收加密货币和NFT的过程,满足Deadfellaz NFT持有者和更广泛的web3社区的需求。 来源:Deadf

  • 3 本周“最关键的会议”来了降息后能为市场带来大牛市吗

    行情分析从上周大盘周线的表现,整体处于窄幅周线横盘状态,而本周依然还是会进入周线窄幅横盘状态,波动相对来说不是很大,本周大盘整体会在56000-62000区间在走,以太周线整体会在2500-2800区间在走,而sol周线整体会在135-152区间在走。不过周线这种横盘想要变盘还是比较容易,具体还得多关注下本周鲍威尔讲话,这个也许会走出一波行情,具体情况我们需要耐心等下。今日行情看待从目前走势来看,

  • 4 公链项目如何脱颖而出,是否还能吸引投资人的目光

    公链板块,从区块链诞生至今,一直是兵家必争之地,作为区块链发展的根本,一条成功的公链,不仅会聚集市场上大部分资金和人气,还能依靠自身的生态建设左右市场的发展趋势。以太链诞生后,智能合约开始横行天下,人人皆可发币。币安链火起来之后,粉红平台一天最多可以发售9000个项目,而后面SOL等链的成功,开启了Layer2技术竞赛,低费率,高速度成为新的公链标准。这些项目成功的背后,是巨量的收益,催生了无数的

  • 5 美国大选影响加密货币市场-最新加密货币新闻

    加密货币市场正在经历受即将到来的美国大选影响的重大波动。随着11月选举的临近,预计动荡将升级。然而,一位著名的加拿大投资者认为,无论选举结果如何,美国加密货币格局都会发生重大变化。 内容隐藏1美国加密货币法规的现状如何?2加密货币法案进展如何?投资者的3个关键要点 美国加密货币法规的现状如何? 一年前,众议员、参议员和白宫正在就加密货币监管进行讨论。然而,选举动态已将焦点从这一

  • 6 印度比特币交易所WazirX在遭受2.34亿美元黑客攻击后恢复余额

    WazirX交易所经历了一次大规模黑客攻击,损失了价值超过2.3亿美元的客户资金。在停止提款后,该交易所恢复了账户余额,并对其中一个在黑客攻击中受损的Safe Multisig钱包进行了维护。 印度最大的比特币交易所WazirX遭到黑客攻击,导致该公司损失了2.34亿美元的客户存款。 该事件发生在近一个月前的7月18日,影响了45%的用户资金。肇事者被认为是朝鲜黑客。该公司宣布,已立即采取行动扭转

  • 7 随着特朗普在Polymarket上的平局达到48%,卡玛拉的获胜几率下降

    卡玛拉·哈里斯只是在受伤的地方受到了打击——几率。目前,加密货币博彩平台Polymarket显示,她和特朗普势均力敌,获胜的几率为48%。 卡玛拉已经骑得很高了一段时间,但最近的发展表明她已经失去了控制。特朗普的副总统JD Vance声称,他的内部数据显示卡玛拉的支持率已经“稳定” 它对加密货币有什么作用 让我们来谈谈房间里的大象:加密货币。Kamala对加密货币一直非常谨慎,

  • 8 加密反黑客指南:多种措施保护好个人资产

    作者:INSIGHTFUL;编译:深潮 TechFlow免责声明本指南无法保证任何内容,并不是从「加密或网络安全专家」的角度编写的,而是基于多个来源和个人经验的不断学习成果。例如,我自己在刚进入这个领域时就曾因害怕错过(FOMO)和贪婪而受骗(假直播诈骗和假 MEV 机器人诈骗),因此我花时间认真学习、设置和理解安全性。不要成为那个因为失去一切或大量资产而被迫学习安全的人。黑客攻击还是用户错误?所

  • 9 40岁以下的美国人迫使两个政党“崩溃”成比特币:Pantera Capital首席执行官Dan Morehead

    Pantera Capital首席执行官Dan Morehead表示,政治机构基本上被迫屈服于支持加密货币的立场。 在该公司的月度区块链信件中,Morehead表示,美联储几十年的印钞主要使少数老年人口受益,同时惩罚了现在拥有更大投票权的大多数人。 莫尔黑德展示了一张图表,引用了美联储自己的数据,描绘了财富向美国老年人的压倒性分配,而年轻一代则越来越落后。 “不需要政治学专业的学生就能弄清楚为什么

  • 10 上一篇:十亿美元银行突然终止了“人类芭比娃娃”Jessica Alves的账户,因为她在Only Fans上:报道

    模特兼自称“人类芭比娃娃”的杰西卡·阿尔维斯表示,她的银行账户已被终止,因为她在OnlyFans上。 据《每日邮报》报道,阿尔维斯表示,她收到了巴克莱银行的账户关闭通知,并立即前往伦敦的一家分行了解情况。 “我在巴克莱银行开户22年了,有人告诉我,我不能再在他们那里开户了,因为我被认为是性工作者。我解释说,我不是,我的收入来自我的租赁房产、电视节目和品牌代言。 My Only fans纯粹是一个粉