关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3148人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

还是这些穿搭最适合秋天,以基础款为主、针织衫配裙子,很显气质

静儿时尚达人 浏览 4035

赵磊:一个把粉丝当ATM,最后和私生锁死的男人

八卦三缺一 浏览 3446

中国人寿前三季归母净利润超1678亿元,高基数基础上同比增60.5%

证券市场周刊 浏览 4119

吉文:可能我有点老派,看不惯加纳乔走路歪着身子还挂条链子

懂球帝 浏览 3662

特朗普试图重建长期关税壁垒 民主党将阻止

华尔街见闻官方 浏览 2550

泽连斯基新年致辞:不要"乌克兰的终结"

中国经济网 浏览 3280

上天的小鼠为何更瘦?这场跨年科学对话透露了很多航天趣事|科学家·马上回答

封面新闻 浏览 3320

日产卖楼关厂裁员,断臂求生

21世纪经济报道 浏览 3921

碳酸锂价格,巨震!

证券时报 浏览 3699

媒体:中国该如何在军事部署上经营台湾 如今值得思考

新民周刊 浏览 8360

“恨海情天仙品CP”郭晓婷王天辰将合体拍杂志

手工制作阿歼 浏览 2478

八位堂推出“任天堂 NES 游戏机 40 周年”主体限定外设硬件

IT之家 浏览 4287

新版《保管合同(示范文本)》发布 进一步明确权责促进交易公平

央视财经 浏览 3384

香波特:讨厌在尼克斯&骑士打3D 到了国王才感觉解放

直播吧 浏览 4832

曾负债超200亿,创始人已跑路!这家新势力官宣复活,即将发新车

明镜pro 浏览 4080

10天内5省迎新任副省长:两人是70后 两人跨省调整

国是直通车 浏览 2951

10月新势力销量爆发:零跑首破7万辆,小米稳超4万辆,理想猛跌38%

21世纪经济报道 浏览 3967

【观察】一打强队就出问题,齐沃打硬仗还欠火候

体坛周报 浏览 3635

股价“闪崩”、市值蒸发500亿,寒武纪怎么了?

征探财经 浏览 2924

记录最近收获很大的一次深度链接

黎贝卡的异想世界 浏览 2482

14岁少年强奸杀害女同学被判无期 奶奶受刺激闭门不出

潇湘晨报 浏览 31078
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1