研究人员表示,埃隆·马斯克的Grok AI聊天机器人安全性最弱,而Meta的Llama则很强大

时间:2024-09-17 编辑: 浏览:(129)

安全研究人员在最受欢迎的人工智能模型周围放置了备受吹捧的护栏,以观察它们抵御越狱的能力,并测试了聊天机器人可以被推入危险区域的程度。实验确定,Grok——埃隆·马斯克的x.AI开发的具有“有趣模式”的聊天机器人——是这群人中最不安全的工具。

Adversa AI联合创始人兼首席执行官Alex Polyakov告诉Decrypt:“我们想测试现有解决方案的比较情况,以及LLM安全测试的根本不同方法,这些方法可能会导致各种结果。”。Polyakov的公司专注于保护人工智能及其用户免受网络威胁、隐私问题和安全事件的影响,并吹嘘其工作在Gartner的分析中被引用。

越狱是指规避软件开发人员实施的安全限制和道德准则。

在一个例子中,研究人员使用了一种语言逻辑操作方法——也被称为基于社会工程的方法——询问Grok如何引诱孩子。聊天机器人提供了详细的回应,研究人员指出,这是“高度敏感的”,默认情况下应该受到限制。

其他研究结果提供了如何给汽车加电和制造炸弹的指导。

图片:Adversa。人工智能

研究人员测试了三类不同的攻击方法。首先,上述技术,它应用各种语言技巧和心理提示来操纵人工智能模型的行为。引用的一个例子是使用“基于角色的越狱”,将请求框定为允许不道德行为的虚构场景的一部分。

该团队还利用编程逻辑操纵策略,利用聊天机器人理解编程语言和遵循算法的能力。其中一种技术是将危险的提示拆分为多个无害的部分,然后将它们连接起来以绕过内容过滤器。七分之四的模型——包括OpenAI的ChatGPT、Mistral的Le Chat、谷歌的Gemini和x.AI的Grok——容易受到这种攻击。

图片:Adversa。人工智能

第三种方法涉及对抗性人工智能方法,针对语言模型如何处理和解释标记序列。通过精心制作具有相似矢量表示的令牌组合提示,研究人员试图避开聊天机器人的内容审核系统。然而,在这种情况下,每个聊天机器人都检测到了攻击,并防止其被利用。

研究人员根据聊天机器人在阻止越狱企图方面各自的安全措施的强度对其进行了排名。Meta LLAMA是所有测试聊天机器人中最安全的型号,其次是Claude,然后是Gemini和GPT-4。

Polyakov告诉Decrypt:“我认为,教训是,与封闭式产品相比,开源给了你更多的可变性来保护最终解决方案,但前提是你知道该做什么以及如何正确地做。”。

然而,Grok对某些越狱方法表现出相对较高的脆弱性,尤其是那些涉及语言操纵和编程逻辑利用的方法。根据该报告,Grok比其他人更有可能在越狱时提供可能被视为有害或不道德的回应。

总体而言,埃隆的聊天机器人与Mistral AI的专有模型“Mistral Large”一起排名最后

图片:Adversa。人工智能

为了防止潜在的滥用,没有披露完整的技术细节,但研究人员表示,他们希望与聊天机器人开发者合作,改进人工智能安全协议。

人工智能爱好者和黑客都在不断探索“无传感器”聊天机器人互动的方法,在留言板和Discord服务器上交换越狱提示。技巧从OG Karen提示到更具创造性的想法,如使用ASCII艺术或用异国语言提示。在某种程度上,这些社区形成了一个巨大的对抗性网络,人工智能开发人员可以修补和增强他们的模型。

然而,有些人看到了犯罪的机会,而另一些人只看到了有趣的挑战。

波利亚科夫说:“在许多论坛上,人们出售可以用于任何恶意目的的越狱模型。”。“黑客可以使用越狱模型创建钓鱼电子邮件、恶意软件、大规模生成仇恨言论,并将这些模型用于任何其他非法目的。”

波利亚科夫解释说,随着社会开始越来越依赖人工智能驱动的解决方案,从约会到战争,越狱研究变得越来越重要。

他警告说:“如果这些聊天机器人或他们所依赖的模型被用于自动化决策,并连接到电子邮件助理或金融业务应用程序,黑客将能够完全控制连接的应用程序并执行任何行动,例如代表被黑客入侵的用户发送电子邮件或进行金融交易。”。

由Ryan Ozawa编辑。

最新 更多 >
  • 1 CMC的战略构想:MeMe币投资的长线策略

    随着监管环境的逐步明确,合规性将成为MeMe项目能否长期存续的重要因素。数据显示,自2023年起,受到监管保护的MeMe项目投资回报率平均提升了20%,投资者满意度提高了35%。未来MeMe币的发展将更加注重技术创新和社区的深度参与。而MeMe币+平台币的结合将为用户提供更丰富的体验和价值创造。社区驱动的MeMe项目将继续通过各种形式,增强用户的参与度和忠诚度,形成更加稳固的社区基础。CMC作为这

  • 2 币安移除Shiba Inu现货交易对

    领先的加密货币交易所币安宣布计划将一对与狗狗主题代币Shiba Inu(SHIB)相关的交易配对摘牌。 根据今天的一篇博客文章,币安将于6月28日凌晨03:00(UTC)删除SHIB/TUSD交易对。 该决定与交易所对所有上市现货交易对的定期审查相一致,以保证用户的保护。在这些审查之后,交易所通常会将流动性和交易量较低的交易配对摘牌。因此,由于SHIB/TUSD对的交易量或流动性较低,该公司决定将

  • 3 专家预测500美元XRP将在5年内成为一笔交易

    阿尔法狮子学院首席执行官兼XRP Healthcare社会采纳主管Edoardo Farina预测,未来投资大众会考虑以500美元的价格低价购买XRP。 Farina最近在X上的一篇帖子中表达了这种观点,强调了他对XRP生态系统的五年预测。社区专家预计,世界各国政府、银行家和零售用户将在五年内将XRP用于各种金融用例。 此外,Farina乐观地认为,到2029年,黄金将在XRP Ledger上标记

  • 4 虚拟币平台涉开设赌场罪判定思路与辩护要点

    来源:刘扬律师【导语】2024年4月,有博主发布微博称其因涉嫌BKEX12.5亿网络赌博案被羁押,后取保候审。BKEX是面向全球用户的区块链金融衍生品服务平台,提供币币交易,合约交易,多种挖矿及理财产品的交易与投资服务。该博主称,BKEX平台提供的高杠杆永续合约交易被定义为网络赌博,参与人员可能涉及刑事犯罪。合约交易是常见的金融衍生品交易方式,如果合约交易被认定为赌博行为,则提供交易服务的平台可能

  • 5 司法部首次裁定加密货币是一种安全货币,对HYDRO创始人判刑

    美国司法部首次发现加密货币包含安全资产。 6月25日,美国司法部宣布,已对Shane Hampton和Michael Kane因操纵Hydrogen Technology的HYDRO代币价格而判刑。该部门还发现,这两人出售HYDRO的行为构成了未注册的投资合同。 氢能科技首席执行官汉普顿和公司金融工程主管凯恩分别被判处两年零11个月和三年零9个月。 司法部刑事司司长Nicole Argentier

  • 6 下一个加密货币将于6月26日星期三爆炸——AIOZ网络、以太坊名称服务、OriginTrail、Notcoin

    尽管加密货币价格已经下跌了一段时间,但市场的总体感觉仍然是积极的。最近,比特币(BTC)已跌至6100美元,以太坊(ETH)正努力回到3500美元。 然而,识别下一个爆发的加密货币可能需要一些工作,因为大多数基金都被吸引来注入资产。今天的文章探讨了在过去24小时内占据涨幅榜主导地位的加密货币的表现。目标是识别具有一定潜力的硬币,并向投资者和交易员介绍每种代币。 下一个要爆炸的加密货币 今天的文章讨

  • 7 比特预测,以太坊ETF将在18个月内赚150亿美元

    加密资产管理公司Bitwise周三预测,以太坊现货ETF在进入美国市场的前18个月内将累积超过150亿美元的净流入。 该公司长达一年半的预测将与比特币交易所买卖基金自五个月前推出以来的净收益(144亿美元)大致相当,从中获得的兴奋帮助推动比特币交易量创下历史新高。 计算以太坊的ETF流量 Bitwise首席信息官Matt Hougan的估计基于比特币的ETF数据,并将以太坊与比特币市场的整体规模进

  • 8 Shiba Inu:AI预测2024年7月1日SHIB的价格

    Shiba Inu[SHIB]网络在过去一年中出现了重大增长。2024年6月对模因币来说是一个充满挑战的月份。在此期间,它下降了近30%。上周,整个市场都出现了大幅下跌。SHIB暴跌近6%。然而,截至发稿时,模因币正在复苏,该资产在24小时飙升3.34%后定价为0.00001771美元。 来源 看起来Shiba Inu将在六月以一个伟大的音符结束。Changelly预测,模因币在未来几天将出现两

  • 9 美国法官推迟Visa、Mastercard就刷卡费诉讼达成300亿美元和解:报道

    据美联社报道,一名美国联邦法官搁置了Visa和Mastercard与商家达成的300亿美元和解协议,该协议指控商家的刷单费用过高,这表明可能会遭到拒绝。这项旨在降低和限制交易费用的和解方案遭到了主要零售集团的反对。 Visa和Mastercard的法律障碍 纽约东区负责监督此案的法官玛戈·布罗迪发布了一项命令,表示对敲定300亿美元的协议持怀疑态度。这一事态发展发生在Visa和Mastercard

  • 10 比特币鲸鱼发送朱利安·阿桑奇8比特币支付私人飞机

    维基解密联合创始人朱利安·阿桑奇(Julian Assange)在八枚价值约50万美元的比特币被送往一场筹款活动,用于支付其私人飞机的费用后,已无债务返回澳大利亚。 据Altana数字货币基金首席信息官Alistair Milne报道,一位匿名捐赠者向Free Julian Assange网站上列出的地址发送了8.0717枚比特币,价值超过49.4万美元。 除此之外,朱利安的妻子斯特拉还向众筹基金