人工智能模型在人工智能生成的数据上训练时会吐出“胡言乱语”

时间:2024-09-30 编辑: 浏览:(422)

一项新的研究发现,基于人工智能生成材料的先前迭代训练的大型语言模型(LLM)产生的输出缺乏实质性和细微差别。这些发现给人工智能开发人员带来了新的挑战,他们依赖有限的人工生成数据集来获取内容。

另请阅读:AI deepfakes使美国当局难以保护儿童——报告

来自英国剑桥大学和牛津大学的人工智能研究人员试图根据仅包含人工智能生成内容的数据集编写提示。结果并不理想,因为它产生了难以理解的反应。

人工智能仍然需要人类来理解

该论文的作者之一,剑桥大学的Zhakar Shumaylov表示,需要对提供LLM的数据进行质量控制,LLM是ChatGPT和谷歌Gemini等生成式人工智能聊天机器人背后的技术。Shumaylov说:

“信息是,我们必须非常小心训练数据中的结果。[否则,]事情总是会出错。”。

Shumaylov详细介绍说,这种现象被称为“模型崩溃”。它已被证明会影响各种人工智能模型,包括那些专门使用文本提示生成图像的模型。

根据这项研究,在一个模型上使用人工智能生成的数据重复文本提示最终会产生胡言乱语。例如,研究人员发现,一个用关于英国中世纪教堂塔楼的文本进行测试的系统仅在九代之后就产生了重复的野兔列表。

在评论这些结果时,加州大学计算机科学家Hany Farid将数据崩溃比作动物繁殖中特有的挑战。

法里德说:“如果一个物种与自己的后代近亲繁殖,并且没有使其基因库多样化,这可能会导致该物种的崩溃。”。

当研究人员将人类生成的数据注入人工智能数据时,崩溃的速度比在纯人工智能生成的内容上运行时要慢。

人工智能模型在人工智能生成的数据上训练时会产生胡言乱语。

研究人员:人工智能可能会加剧对少数群体的偏见

语言模型通过在大量文本中建立标记(单词或单词部分)之间的关联来工作,这些文本通常是从互联网上抓取的。他们根据这些学习模式,通过吐出统计上最可能的下一个单词来生成文本。

另请阅读:ChatGPT驱动的泰迪熊Poe为孩子们读睡前故事

7月24日发表在《自然》杂志上的这项研究表明,数据集中几次提到的信息可能不会重复。研究人员担心,这可能会对已经被边缘化的少数群体产生负面影响。

为了避免现实生活中的模型崩溃,该研究建议对人工智能生成的内容和人类生成的内容进行水印处理。但它表示,由于竞争对手人工智能公司之间缺乏协调,这也可能是一个问题。

这项研究的发现正值人们越来越多地争论人工智能是否会导致人类在创作内容时被完全排除在外,包括小说和报纸文章的写作。

这项名为“人工智能模型在递归生成的数据上训练时会崩溃”的研究结果平息了这场争论——人类还没有被排除在等式之外。

最新 更多 >
  • 1 以下是Shiba Inu投资1000美元的回报,如果SHIB达到ETH市值,回报为0.000017美元

    如果SHIB达到以太坊的市值,在Shiba Inu投资1000美元的个人可能会获得40倍的回报。 Shiba Inu仍面临看跌压力,连续几周创下新低。在整个市场持续下跌的情况下,SHIB已跌至0.0000173美元的底部。这反映出其股价较本月早些时候的0.00002627美元高点暴跌34%以上。 目前,Shiba Inu尚未从下跌中恢复,徘徊在0.00001766美元左右,市值约为103.6亿美元

  • 2 加密ATM在全球范围内激增-最新加密货币新闻

    过去一年,全球加密ATM的数量激增了17.8%,总数达到38279台,接近2022年12月39541台的峰值。Coin ATM Radar报告称,到2024年,共安装了2564台新的加密ATM,这表明在2023年净损失2861台机器后,这是一个积极的趋势。 内容隐藏1为什么ATM设备兴起?2哪些国家在加密ATM方面领先?3个关键见解 ATM设备为什么会增加? 从2023年7月到2

  • 3 邮储银行:进一步强化数字人民币个人客户身份信息完整性、有效性核实工作

    7月1日,邮储银行发布关于推进数字人民币客户身份信息治理的公告。根据《中华人民共和国反洗钱法》《金融机构客户身份识别和客户身份资料及交易记录保存管理办法》《数字人民币反洗钱和反恐怖融资工作指引》等法律法规要求,邮储银行将进一步强化数字人民币个人客户身份信息完整性、有效性核实工作。对个人客户身份信息不完整、未留存身份证件影印件或身份证件过期且在90天内没有及时更新等情况,将对客户名下钱包采取降低交易

  • 4 Vitalik:以太坊如何更快确认交易

    作者:Vitalik,以太坊创始人;翻译:0xjs@良好的区块链用户体验的一个重要特性是快速的交易确认时间。如今,以太坊与五年前相比已经有了很大的进步。得益于 EIP-1559和Merge之后稳定的区块时间,用户在L1上发送的交易可以在 5-20 秒内得到可靠确认。这与使用信用卡支付的体验大致相当。然而,进一步改善用户体验是有价值的,有些应用程序确实需要数百毫秒甚至更短的延迟。本文将介绍以太坊的一

  • 5 比特币BTC夺回6.35W“假”突破?6种加密货币带来利好

    美元指数跌至105.71,黄金在2323美元回吐涨幅,比特币早盘爆冲重夺62500美元。勒庞领导的极右翼赢得法国首轮大选,并继续瞄准多数席位,刺激欧元开盘走高,法国最后一轮投票将于7月7日举行。美国个人消费支出(PCE)显示通胀放缓,加剧了降息定价。美联储鸽派官员强调,政策正在发挥作用。目前的反弹可能只是技术性的“假”突破?1.1小时来看,比特币1小时布林带在突破之前的上午阶段已经收窄到250点不

  • 6 Hamilton Lane希望将Shariah合规私人信贷代币化,合作伙伴AltaX、Phillip Securities

    Hamilton Lane正与新加坡金融管理局(MAS)Project Guardian旗下的Alta Exchange(AltaX)和Phillip Securities合作,通过代币化提高流动性。 这三家公司将合作扩大Hamilton Lane高级信贷机会(“SCOPE”)基金的代币化版本。SCOPE在AltaX上市,于2023年3月推出,是一家为投资者提供安全和收益的高级私人信贷工具。 辉立

  • 7 ​SUN.io上SUN-USDT LP活期APY达19.06%

    官方数据显示,SUN.io治理挖矿上SUN-USDT LP(活期)APY高达19.06%。同时,SUN平台也将持续加大对新矿池的政策倾斜和资金支持力度,为用户带来更好的体验和更高的奖励。此外,作为波场TRON重要的DeFi平台之一,SUN.io将致力于为用户提供更加稳定和优质的服务,并为波场生态带来更多价值和机会。

  • 8 比特币ATM崛起:加密货币成为主流,全球拥有38000台机器

    加密货币的世界正见证着可访问性的繁荣,比特币ATM引领了这一潮流。从2020年10月的1万台,全球这些现金到加密货币转换器的数量已激增至3.8万多台。这种激增不仅仅是一种时尚;专家预测,便利性、盈利能力和战略扩张的完美风暴将推动经济持续增长。 超越银行分行:用现金进入加密货币 对许多人来说,传统金融机构仍然是进入加密货币世界的障碍。比特币ATM通过允许用户用现金购买加密货币,消除了对银行账户或浏览

  • 9 第三季度股市情绪:年轻投资者看涨,但退伍军人仍持悲观态度

    根据盛宝的一项调查,18岁至35岁的投资者对股市表现的乐观情绪最高,因为59%的这一年龄段的投资者认为股市将在2024年第三季度上涨。该调查审查了约2300名不同年龄客户的回复。 专用外汇云解决方案,具有稳定快速的跨境连接,能够满足高需求场景。阿里云帮助外汇交易员在全球范围内安全运营。点击了解更多! 年轻的公牛和年老的熊 另一方面,在76岁以上的投资者中,只有33%的人认为市场在未来三个月会上涨

  • 10 德国、美国政府转移大额BTC和ETH说明了什么

    作者:Josh O'Sullivan,CoinTelegraph;编译:五铢,德国和美国政府在转移数百万美元的加密货币资产后引起了广泛关注。7 月 1 日,德国政府将价值约 9500 万美元的 1,500 BTC 转移到多个加密货币交易所,而美国政府将价值 1175 万美元的 3,375 ETH 转移到一个未知地址。德国政府 BTC 转账根据链上分析平台 Arkham Intelligence 的