关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者2585人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

多国欢迎加沙停火协议生效 呼吁尽快结束人道主义危机

上观新闻 浏览 3774

慕尼黑车展折射中欧车企博弈

盖世汽车 浏览 4509

采用插混动力 奇瑞风云A7谍照曝光

车质网 浏览 1625

网红版闫学晶!600万粉博主阿爆翻车

萌神木木 浏览 2538

赏叶季人生照片拍摄指南.PDF

时尚COSMO 浏览 2786

刘维伟回国寄语杨瀚森:未来不会顺利每天都要进步 获赠签名球衣

醉卧浮生 浏览 3569

“大空头”11亿空单瞄准英伟达和Palantir,AI泡沫真的来了吗?

郭施亮 浏览 3492

当你的代码测试出问题时,人工智能能像专业程序员一样修复吗?

科技行者 浏览 2308

这顶级尤物,也凉了

独立鱼 浏览 2973

将于3月10日首发 奔驰VLE国内测试车曝光

车质网 浏览 2447

李玟账号被异常登陆!最新解读

环球网资讯 浏览 3737

将于东京车展首发 全新丰田卡罗拉官图曝光

车质网 浏览 3694

喜羊羊之父,又要去IPO了

投资家 浏览 2797

NBA战报:马刺133-104大胜步行者取NBA5连胜,文班亚马17+12+1

懂球帝 浏览 3645

央视披露解放军实战演练"斩首"行动画面

北京日报 浏览 2264

预售22.99万起 "新一代"小米SU7开启小订

网易汽车 浏览 2649

邱淑贞女儿沈月回应,称这辈子都没买过热搜,很欣赏张凌赫与沈月

扒虾侃娱 浏览 3397

99年女生读博时退学去开公司修家电:好评近100%

大象新闻 浏览 23128

竟然人VS居然人,这是什么新标签?

时尚COSMO 浏览 3055

自动驾驶将迎来巅峰对决

禾颜阅车 浏览 3447

宏胜集团法定代表人变更,郑群娣接棒祝丽丹

21世纪经济报道 浏览 3451
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1