关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者3081人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

外媒:法国称“已准备好”向乌克兰派兵

参考消息 浏览 4092

演员黄璐将惊喜现身明日艺术影院映后❤️

幕味儿 浏览 3141

OpenAI再度“挖墙角”,从谷歌挖来Albert Lee执掌公司发展

华尔街见闻官方 浏览 3368

巴黎小将博利首次代表一线队出场却上半场就伤退,含泪离场

懂球帝 浏览 3361

比亚迪秦家族新款7.98万起售!爆胎稳定系统上车,综合续航超2000km

车东西 浏览 3184

被张坤抛弃,又一巨头跌懵了!

财经锐眼 浏览 2886

利雅得胜利客战利雅得体育:C罗缺阵,菲利克斯、马内先发

懂球帝 浏览 2841

碳酸锂价格,巨震!

证券时报 浏览 3695

"荒野求生"48万元奖金被平分 选手:这点钱不够盖房子

极目新闻 浏览 9519

特朗普:泽连斯基阻挠俄乌达成和平协议

环球网资讯 浏览 3165

VNU University of Science:精准调控技术提升机器人执行能力

科技行者 浏览 2944

杭州一家有两位百岁老人:同年同月同日生 被指心态好

极目新闻 浏览 12830

今年秋冬最流行的外套竟然是它?谁穿谁时髦!

LinkFashion 浏览 3482

捐款超1500万,嫣然医院欠租问题有望解决,但更麻烦的事在后面

数字财经智库 浏览 3058

CDS复兴?“AI发债潮”重燃了市场的“次贷回忆”

华尔街见闻官方 浏览 3921

17个街道年投入逾亿元 资质错配、服务动力不足何解?

南方都市报 浏览 3517

科长,我啥时候才能换电脑啊?

识局 浏览 3069

谈情也谈钱,浪漫又轻盈,这门亲事我同意了!

吐槽电影院 浏览 2540

体系决胜 长安汽车从300万辆进击全球TOP10的"增长逻辑"

网易汽车 浏览 1123

"95后"情侣开房车旅行卖咖啡赚钱 月入5万后越走越远

中国新闻周刊 浏览 8635

美锁定伊朗打击新目标 考虑重启军事行动

上观新闻 浏览 9
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1