关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3141人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

两会对话|商汤徐立:建议推动AI工具的公共职业化培训,促进就业形态多元化发展

澎湃新闻 浏览 2913

美防长下令从德国撤出5000名驻军

国际在线 浏览 885

马切吉亚尼:迈尼昂扑点的秘诀是米兰的门将教练菲利皮

懂球帝 浏览 3961

以色列部长回应"虐待环保少女":很自豪

CCTV国际时讯 浏览 2967

美推进“金穹”系统的天基拦截器研制 但钱和技术都存在问题

澎湃新闻 浏览 4197

玩换电,推增程,埃安到底要干什么

汽车公社 浏览 3795

车长5米3 华为乾崑奕境首款旗舰大六座SUV定名X9

网易汽车 浏览 1236

索尼耳夹式LinkBuds Clip耳机曝光:4种颜色、续航37小时

IT之家 浏览 3122

“调改”难挽颓势,永辉超市减持红旗连锁套现8100万,去年已清仓式减持中百集团

红星资本局 浏览 4258

《红舞鞋》官微删除道歉信,司机还挑衅网友:猫也没人疼戏照样拍

萌神木木 浏览 4143

弹无虚发,凯恩德甲18次罚点全中

体坛周报 浏览 3830

这顶级尤物,也凉了

独立鱼 浏览 3369

静默复古风,低调显贵的穿搭密码!得物2025秋冬趋势发布!

LinkFashion 浏览 6117

稳步迭代,全面超越:vivo S50 Pro mini 评测:小直屏旗舰的进化标杆

快科技 浏览 3272

小米手表5灰度OS3.0.152.0版本,带来表端独立微信版本更新等

IT之家 浏览 3099

向太儿子向佑近照流出 威胁父母“不给钱我就去借”

鲁中晨报 浏览 7727

爱德华兹像乔丹又实锤了? 火箭名宿:没人像乔丹但我喜欢华子

仰卧撑FTUer 浏览 4183

2025年央八收视前十:《沉默的荣耀》第四,孙俪新剧遥遥领先

娱乐圈笔娱君 浏览 3146

女子结婚14年被丈夫打了13年 丈夫:我才是受害者

中国新闻周刊 浏览 14489

比变老更可怕的是不会穿!中年女人掌握4个技巧,优雅不费力

静儿时尚达人 浏览 3149

货车司机在高速服务区猝死 妻子:跑车4个月只回家2次

红星新闻 浏览 10016
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1