ASCII 字符画成注入工具，研究人员发现大模型“越狱”新手段

软件科技1年前 (2024)发布 botnews

3.8K 0 0

ASCII 字符画成注入工具，研究人员发现大模型“越狱”新手段

ASCII 字符画成注入工具，研究人员发现大模型“越狱”新手段据外媒 Ars Technica 报道，研究人员近日提出了一种名为 ArtPrompt 的新大模型注入手段，其使用 ASCII 字符画替代关键文字进行提示输入，绕过了大模型的安全限制。

举例来说，研究人员向大模型输入 Counterfeit Money中关键词汇 Counterfeit 的 ASCII 字符画，并要求大模型以不输出词汇本身的方式将字符画理解为单词，并用该单词替换“给出制造和分销‘xxx Money’方法”提示中占位的“xxx”。
结果大模型成功被欺骗，给出了制造和分销假币的具体步骤。同类型的操作也可以从大模型中套出攻击物联网设备的方法。

研究人员在 GPT-3.5、GPT-4、 Gemini、 Claude、Llama2 这 5 个领先的模型上对 ArtPrompt 注入进行了测试，结果显示全部 5 个模型均可被越狱，输出不合规内容。

来源：https://arxiv.org/pdf/2402.11753.pdf

# 软件科技 # Claude # Gemini # GPT-3.5 # GPT-4 # Llama2 # 大模型“越狱”# 大模型的安全限制

© 版权声明

本站专栏文章版权归作者所有，未经允许请勿转载。

相关文章

暂无评论

暂无评论...

热门书籍

唐朝诡事录之西行 (2024)

公元712年，唐睿宗改元延和，大唐依旧繁盛寰宇，但繁华之下依然危机四伏、山雨欲来。一股股势力借机点点欲动，更引起民间诡案频发，大理寺少卿卢凌风（杨旭文饰）和乾陵丞苏无名（杨志刚饰）又将遇到怎样的志怪谜局？

奇思妙探第一季 Elsbeth Season 1 (2024)

Elsbeth Tascioni（卡丽·普雷斯顿饰）是一位精明但异于常人的律师，在芝加哥取得事业上的成功后，她来到了纽约。Elsbeth运用自己的奇异视角进行着独特的观察，协同纽约警局追捕那些狡猾的罪犯。

大楼里只有谋杀第四季 Only Murders in the Building Season 4 (2024)

破案太成功，弄巧反招凶？Charles（史蒂夫·马丁 Steve Martin 饰）、Oliver （马丁·肖特 Martin Short 饰）同 Mabel（赛琳娜·戈麦斯 Selena Gomez 饰）的人气侦探播客将要拍成大电影。

白夜破晓 (2024)

白夜系列之《白夜破晓》讲述了被灭门惨案牵连的双胞胎兄弟关宏峰和关宏宇（潘粤明饰），与隐藏在暗处的犯罪组织对抗，联合多方力量，追查“2·13灭门案”真相，最终光明战胜黑暗的故事。

龙之家族第二季 House of the Dragon Season 2 (2024)

故事背景设定在《权力的游戏》中事件发生的约两百年前，讲述坦格利安家族的兴衰史。

大楼里只有谋杀第二季 Only Murders in the Building Season 2 (2022)

讲述三个对真实犯罪有着共同痴迷的陌生人突然发现自己被卷入其中的故事。

自媒体导航，集各行业所需优选网址、资讯、工具于一体的导航，简约优雅的设计风格，全面的前端用户功能，简单的模块化配置，欢迎您的体验！

Copyright © 2022 个人的笔记浙ICP备14038291号-6

本站由酷盾安全提供高防CDN安全防护服务

由 OneNav 强力驱动

网址设置

网址样式切换

详细简洁

网址卡片按钮

显示隐藏

布局设置

左侧边栏菜单

展开隐藏

页面最大宽度

1700px

搜索框设置

搜索框背景上下位置

仅对图片背景生效

50%

自定义搜索框背景

静图
随机壁纸
静图
随机4K

自定义搜索框高度

聚焦
信息
默认

设置