人工智能模型在人工智能生成的数据上训练时会吐出“胡言乱语”

时间:2024-09-22 编辑: 浏览:(154)

一项新的研究发现,基于人工智能生成材料的先前迭代训练的大型语言模型(LLM)产生的输出缺乏实质性和细微差别。这些发现给人工智能开发人员带来了新的挑战,他们依赖有限的人工生成数据集来获取内容。

另请阅读:AI deepfakes使美国当局难以保护儿童——报告

来自英国剑桥大学和牛津大学的人工智能研究人员试图根据仅包含人工智能生成内容的数据集编写提示。结果并不理想,因为它产生了难以理解的反应。

人工智能仍然需要人类来理解

该论文的作者之一,剑桥大学的Zhakar Shumaylov表示,需要对提供LLM的数据进行质量控制,LLM是ChatGPT和谷歌Gemini等生成式人工智能聊天机器人背后的技术。Shumaylov说:

“信息是,我们必须非常小心训练数据中的结果。[否则,]事情总是会出错。”。

Shumaylov详细介绍说,这种现象被称为“模型崩溃”。它已被证明会影响各种人工智能模型,包括那些专门使用文本提示生成图像的模型。

根据这项研究,在一个模型上使用人工智能生成的数据重复文本提示最终会产生胡言乱语。例如,研究人员发现,一个用关于英国中世纪教堂塔楼的文本进行测试的系统仅在九代之后就产生了重复的野兔列表。

在评论这些结果时,加州大学计算机科学家Hany Farid将数据崩溃比作动物繁殖中特有的挑战。

法里德说:“如果一个物种与自己的后代近亲繁殖,并且没有使其基因库多样化,这可能会导致该物种的崩溃。”。

当研究人员将人类生成的数据注入人工智能数据时,崩溃的速度比在纯人工智能生成的内容上运行时要慢。

人工智能模型在人工智能生成的数据上训练时会产生胡言乱语。

研究人员:人工智能可能会加剧对少数群体的偏见

语言模型通过在大量文本中建立标记(单词或单词部分)之间的关联来工作,这些文本通常是从互联网上抓取的。他们根据这些学习模式,通过吐出统计上最可能的下一个单词来生成文本。

另请阅读:ChatGPT驱动的泰迪熊Poe为孩子们读睡前故事

7月24日发表在《自然》杂志上的这项研究表明,数据集中几次提到的信息可能不会重复。研究人员担心,这可能会对已经被边缘化的少数群体产生负面影响。

为了避免现实生活中的模型崩溃,该研究建议对人工智能生成的内容和人类生成的内容进行水印处理。但它表示,由于竞争对手人工智能公司之间缺乏协调,这也可能是一个问题。

这项研究的发现正值人们越来越多地争论人工智能是否会导致人类在创作内容时被完全排除在外,包括小说和报纸文章的写作。

这项名为“人工智能模型在递归生成的数据上训练时会崩溃”的研究结果平息了这场争论——人类还没有被排除在等式之外。

最新 更多 >
  • 1 什么是LEO币?

    什么是LEO币?LEO币是一种加密数字货币,是LEO Token(LEO)的代币之一。LEO币是由Bitfinex交易平台所发行,旨在为用户提供更多的交易和金融服务选项。作为一种基于区块链技术的数字货币,LEO币具有一定的价值和功能。LEO币的背景和特点LEO币由Bitfinex交易平台创建,该交易平台是全球最大的加密数字货币交易平台之一。Bitfinex希望通过发行LEO币来增强其交易生态系统,

  • 2 ATOM阿童木币是否支持智能合约?

    ATOM阿童木币是否支持智能合约?ATOM阿童木币是一种新兴的数字货币,它在市场上引起了广泛的关注和讨论。作为一种区块链技术的应用,智能合约被认为是实现金融和商业创新的关键,因此,对于一个数字货币来说,是否支持智能合约是一个非常重要的问题。首先,我们需要了解智能合约到底是什么。智能合约是一种特殊的计算机程序,能够在没有中间人的情况下自动执行、验证和维护合约的条款。它们是建立在区块链技术的基础上的,

  • 3 CRO币的法律接受度和合规问题如何?

    CRO币的法律接受度和合规问题如何? CRO币是由加密货币交易平台Crypto.com推出的代币,它的法律接受度和合规问题一直备受关注。随着加密货币行业的快速发展,监管机构对于数字资产的监管也越来越严格。以下是对于CRO币的法律接受度和合规问题的讨论。 法律接受度 目前,虽然加密货币行业面临各国法律法规的不确定性,但是对于数字资产的法律接受度正在不断增加。一些国家已经开始制定相关的法律框架来监管加

  • 4 APT币是否适合作为长期投资?

    APT币是否适合作为长期投资?近年来,随着数字货币的崛起,人们对于投资的选择也变得更加广泛。而其中一种备受关注的数字货币是APT币。然而,作为长期投资是否适合选择APT币,这是一个值得深入讨论的问题。首先,APT币的背景和潜力值得考虑。APT币是由一家区块链技术公司所推出的数字货币,其背后拥有稳定的技术支持和强大的团队。这意味着APT币在未来可能会有更好的发展,并且有机会成为一种有影响力的数字资产

  • 5 APT币在区块链技术应用中的主要案例是什么?

    APT币在区块链技术应用中的主要案例是什么?随着区块链技术的逐渐发展,APT币作为一种分布式账本技术的重要应用之一,已经在许多领域具备了广泛的应用案例。1. 支付和转账APT币作为一种数字货币,可以实现点对点的支付和转账功能。利用区块链技术的去中心化和不可篡改的特点,APT币可以确保支付和转账过程的安全性和透明度。而传统的支付和转账方式往往需要第三方机构的介入,增加了中间环节和交易成本。APT币的

  • 6 ETC以太经典币如何进行质押和委托?

    ETC以太经典币如何进行质押和委托?以太经典币(ETC)的质押和委托是一种将持有的ETC锁定在区块链网络中以获取相应利息的过程。通过质押和委托,ETC持有者可以参与到以太经典币的权益证明(Proof of Stake,PoS)机制中,并为网络的安全稳定做出贡献。以下将详细介绍ETC的质押和委托的流程和要点。选择可靠的质押平台和钱包对于ETC的质押和委托,首先需要选择一个可靠的质押平台和钱包。质押平

  • 7 ATOM阿童木币的合规性和法律风险有哪些?

    ATOM阿童木币的合规性和法律风险有哪些?ATOM阿童木币是一个基于区块链技术的数字货币,它作为加密货币市场中的一员,具有一定的合规性和法律风险。在探讨其合规性和法律风险之前,我们需要了解ATOM阿童木币的背景和特点。ATOM阿童木币是由区块链项目Cosmos(宇宙)发行的代币,目的是构建一个可互联的分布式网络。其主要特点是支持多种区块链之间的互操作性,即不同的区块链网络可以互相交互和通信。然而,

  • 8 FIL币的质押和奖励机制是什么?

    FIL币的质押和奖励机制是什么?FIL币是Filecoin网络的加密货币,它的质押和奖励机制是Filecoin经济模型的重要组成部分。通过质押和奖励机制,Filecoin网络鼓励存储提供者贡献存储能力,并为他们的参与提供经济激励。质押机制Filecoin网络的质押机制旨在确保存储提供者的诚实行为和网络的安全性。要成为存储提供者,用户需要质押一定数量的FIL币作为抵押品,并将其存入智能合约中。质押的

  • 9 ETC以太经典币的治理模型是怎样的?

    ETC以太经典币的治理: GPT-3.5-turbo-0613是怎样的?ETC(以太经典币)是以太坊的分叉币,由于以太坊的区块链硬分叉而产生。ETC相比于以太坊的主链,具有独立的节点和独特的治理机制。其中,GPT-3.5-turbo-0613是ETC治理的一种机制,它为ETC社区提供了广泛参与的途径。在ETC社区中,GPT-3.5-turbo-0613起到了关键的治理作用。它是一个基于AI技术的机

  • 10 UNI币如何解决加密货币市场的现有问题?

    UNI币如何解决加密货币市场的现有问题?近年来,加密货币市场迅猛发展,吸引了大量投资者和企业的关注。然而,这个市场也面临着一些问题,如缺乏透明度、缺乏流动性以及高费用等等。UNI币作为一个全新的加密货币,致力于解决这些问题,并为投资者提供更好的交易环境。透明度问题在加密货币市场中,透明度一直是一个重要的问题。许多交易所和项目缺乏透明度,使得用户很难获得准确的信息。然而,UNI币将通过建立完全透明的