关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2631人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

三元锂和磷酸铁锂二合一?揭开零跑D19超混电池黑科技

吴佩频道 浏览 3731

江苏省委省政府成立调查组 对南京博物院开展全面调查

北京日报客户端 浏览 31233

从北京到平壤的火车线路被指将于周四开通 外交部回应

外交部网站 浏览 31975

廖三宁压哨三分绝杀北控险胜福建 曾凌铉33分三分9中9历史首人

醉卧浮生 浏览 2630

小伙雕刻"全球首个汽车石窟" 曾雕"奥特曼"石窟引争议

封面新闻 浏览 9315

轻舟亮剑:城市NOA计划上车50款,量产下放10万级

网易汽车 浏览 2420

美国要求乌单方面撤军 泽连斯基回应

每日经济新闻 浏览 8723

又见借媒体之手维权,事后要求删稿…

深蓝财经 浏览 2503

涉及中国 日本高官公开道歉并撤回错误言论

环球时报国际 浏览 35628

退出春晚25年,陈佩斯和朱时茂的生活差别太大了

贵州小娟 浏览 3607

孙越没想到,岳云鹏竟因一个动作口碑逆转

无处不风景love 浏览 2636

“小黑靴”今年冬天又火了!这4组搭配照着搭就很时髦

LinkFashion 浏览 3510

北约启动今年最大规模军演 美国未参与

看看新闻Knews 浏览 2405

糊了22年,他终于凭借「性张力」火了

独立鱼 浏览 3513

在南海坠毁的美军机比F-35还贵 单价1亿美元

参考消息 浏览 2599

4年“伺候”4位总经理,水井坊公关一号位挂印封金

财经众议院 浏览 3054

比速腾L略小 入门级的全新速腾S将发布

网易汽车 浏览 2652

记者谈马宁连出三红:密集出牌虽彰显权威,却也容易激化矛盾

懂球帝 浏览 3890

电车失控在市区以超100km/h时速连撞15车 阿维塔回应

极目新闻 浏览 8538

双片闪耀,北京跨年放映今日开票!

幕味儿 浏览 2399

河北公务员,干出200亿乳品王国

创业家 浏览 2440
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1