关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2632人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国色特别策划 | 故宫技艺与古意新生

时尚COSMO 浏览 2800

市值减少约7800亿元!汽车业上市公司巨震

汽车K线 浏览 3694

衣服完全没有必要越买越多!准备好这3款单品,百搭又舒适

静儿时尚达人 浏览 2609

香港知名女星惹同性绯闻,和朋友关系举止亲密

你约电影 浏览 2548

预售20.99万元起 新款领克10正式下线

车质网 浏览 274

正在热播的五部电视剧,《剥茧》排在第三

农城浪子 浏览 2677

回归哈弗H序列 实拍哈弗H6L

太平洋汽车 浏览 3620

纽卡vs阿森纳双方公布首发

体坛周报 浏览 3416

TA:阿莫林对3-4-3的执念,从一开始就注定了他在曼联的失败

懂球帝 浏览 2664

米兰球员身价变更:帕夫洛维奇+1000万,巴尔泰萨吉+1500万

懂球帝 浏览 3170

俄最新核潜艇下水 可搭载“末日鱼雷”

环球网资讯 浏览 3536

俄外长:向乌提供“战斧”将让俄美关系出现最危险局面

上观新闻 浏览 3630

距伊朗161公里 巴基斯坦想邀美国在敏感地点建港口

上观新闻 浏览 3232

胜辽宁发布会!潘江赞对手,亲承张宁将缺席三周,迪亚洛总结不足

篮球资讯达人 浏览 2618

央行:1月23日将开展9000亿元1年期MLF操作

央视财经 浏览 2477

换装全新设计语言 北京EU8申报图曝光

车质网 浏览 3745

3000马力!百万售价! 仰望U9赛道版比高铁快

车毂轆 浏览 4344

48小时内"拔管"可获百万赔偿 儿子坚持救父"人财两失"

新京报 浏览 12714

“50%汽车芯片由格力产品替代”?广汽回应

第一财经资讯 浏览 2568

维蒂尼亚晒自己和伊涅斯塔合影:终极榜样,我太幸运了

懂球帝 浏览 2852

比大衣更高级,比羽绒服更时髦?它才是今年冬天最火的外套!

LinkFashion 浏览 2671
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1