关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者1703人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2025 FT年度人物:黄仁勋

新智元 浏览 2051

雅图高新被举报后发长文反驳:谁是谁非需捋清 北交所非“垃圾箱”IPO企业非出气筒

财经下午茶 浏览 2661

三星单季利润暴增208%

21世纪经济报道 浏览 1685

媒体:美国解除对白制裁 系大国格局中精心策划的变动

上观新闻 浏览 14917

前三季度海洋生产总值7.9万亿元 同比增长5.6%

央视财经 浏览 2631

福建一摄影大赛一等奖作品被质疑用AI生成 主办方回应

环球网资讯 浏览 23780

吉林延边州珲春市发生5.5级地震 震源深度560千米

界面新闻 浏览 8045

米体:普利希奇将接受医疗检查,阿莱格里和米兰对美国队不满

懂球帝 浏览 2818

俩小伙卖给美军无人机:建"无中国"供应链太难了

澎湃新闻 浏览 32425

雷克萨斯,扳回一局

电动势 浏览 2008

狂砸30亿!阿里千问官宣“春节请客”计划,吃喝玩乐全免单

雷科技 浏览 1382

燃油+电动全都配 全新宝马4系最新消息曝光

乐选爱车 浏览 1483

香波特:讨厌在尼克斯&骑士打3D 到了国王才感觉解放

直播吧 浏览 3471

《熊猫计划之部落奇遇记》春节档上映 成龙、马丽携手送欢乐

封面新闻 浏览 1517

金价暴跌 不少上海人跑外地买黄金:就像在抢大白菜

极目新闻 浏览 5770

十年前,我们万万想不到

牛弹琴 浏览 1926

凌晨!全线大涨!美联储宣布:降息!鲍威尔重磅发声!

券商中国 浏览 2107

郭富城夫妇合体看赛马,透露三胎预产期

疯说时尚 浏览 2790

炸了!古二再曝录音,王家卫称游本昌不是省油灯,还说唐嫣很装

娱乐圈笔娱君 浏览 2477

美国否决加沙停火决议草案后 以美代表亲切握手

看看新闻Knews 浏览 3469

伦纳德:我对保罗一事毫不知情,我们之间的沟通没有问题

懂球帝 浏览 2086
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1