您的当前位置:首页 > 热门资讯 > 研究:用诗歌就能让AI说违禁内容,成功率达62% 正文
时间:2025-12-20 03:47:55 来源:网络整理 编辑:热门资讯
IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容周口市某某车业专卖店便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功周口市某某车业专卖店实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
山东舰入列6周年!三航母时代已来,期待更多突破2025-12-20 03:41
斯瓦泰克退出中网2025-12-20 02:57
海底捞还在“海底捞”?2025-12-20 02:30
“中秋限定”商机有多大2025-12-20 02:21
捷蓝航空航班在委附近海域险些与美军加油机相撞2025-12-20 02:17
苹果 iOS 18 引入“慢速充电通知”功能,低于 7.5W 慢充将提示2025-12-20 02:08
困在出海与电商 “老字号”天佑德酒也有迷茫2025-12-20 02:03
国足换帅一周内大反转!铺天盖地“伊万下课”→伊万留任几成定局2025-12-20 01:28
首度公开!航天技术骨干炒股亏空,竟向间谍……2025-12-20 01:25
消费者不满苹果画大饼?iPhone 16首销报告出炉:同比大跌12.7%2025-12-20 01:05
“海鲲号”是“台独”病态的一个缩影2025-12-20 03:35
上海多个小区加装电梯工程出现“严重拖延”:是代建公司资金紧张所致?2025-12-20 03:31
征服了新贵,蔚来又瞄准“老钱”2025-12-20 03:18
滴滴出行数据报告:中秋节打车上涨43%2025-12-20 03:02
受贿6539万余元 崔保华一审被判十四年2025-12-20 02:43
小鹏 MONA 系列产品负责人否认 M03“网约车公司估计一大半”说法2025-12-20 02:21
每体:德科将利用巴萨和摩纳哥的比赛考察对手两名后卫的表现2025-12-20 02:18
人工智能的“盛宴” 创新合作的平台——第三届全球数字贸易博览会前瞻2025-12-20 01:44
英媒:大众首次关闭德国本土生产线2025-12-20 01:40
卡尼萨雷斯:库尔图瓦是门将位置上的马拉多纳、梅西、C罗2025-12-20 01:30