关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3147人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊朗选出新领袖 战事还要打多久

红星新闻 浏览 2261

谭松韵扛剧能力被质疑 赵丽颖成女主?

楚楚号 浏览 3320

上汽一季报出炉 在低增长周期里守住基本盘

网易汽车 浏览 940

铜梁龙李镇全谈冲超:有这么多人支持我们,为什么不能冲超?

懂球帝 浏览 3900

美军新锐舰队为应对中国大举集结 集结地却远在夏威夷

枢密院十号 浏览 8534

E句话| 蔡天凤案有判决结果了?

仙女事件簿 浏览 4109

女生希望"慢慢相处" 男子以送早餐为名进酒店实施性侵

红星新闻 浏览 13400

纵贯一整年的精彩:柏林电影节佳作在中国

幕味儿 浏览 3384

券商密集实施中期分红 近90亿元红利在路上

证券时报 浏览 3472

今年秋冬最时髦的穿法:外套+连帽卫衣,减龄又松弛!

LinkFashion 浏览 3264

前女友曝19岁荣梓杉出轨打人,男方评论区沦陷,网友喊话道歉退圈

扒虾侃娱 浏览 4269

紫光展锐发布端边AI芯片平台N9系列:4nm工艺,Arm v9.2 CPU

IT之家 浏览 866

福建籍女网红流落柬埔寨街头 毒品检测呈阳性

中国新闻周刊 浏览 6765

最好的相互救赎,我在《秋雪漫过的冬天》看见了

仙女事件簿 浏览 3039

联手腾讯搞AI,美团大涨8%,腾讯、阿里、比亚迪集体起飞

21世纪经济报道 浏览 9

抖音&LV-NUS开源多模态新模,以小博大刷新SOTA,8B推理比肩GPT4o

量子位 浏览 4257

原来他就是白百何的二婚老公,难怪能逆风翻盘

情感大头说说 浏览 13

70岁老人与歹徒搏斗被咬掉鼻子吞下 曾一度剧痛半昏迷

潇湘晨报 浏览 35002

没上映票房就破2400万,邓超加陈凯歌都压不住,国庆档冠军定了?

靠谱电影君 浏览 4731

《一路繁花2》出圈理由

娱乐圈笔娱君 浏览 4180

245万的房子被中介私自标价170万挂牌 浙江业主怒了

FM93浙江交通之声 浏览 10125
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1