关闭广告

斯坦福大学团队推出「许可证神谕」:让AI学会说「我不知道」

科技行者2566人阅读


当你向ChatGPT询问某位哲学家的出生日期时,它总是信心满满地给出答案,哪怕这个答案完全错误。这种现象被研究者称为「幻觉」,就像AI患了妄想症,总是编造一些听起来很有道理但实际上完全错误的信息。来自加州圣迭戈RA软件公司的理查德·阿克曼和保加利亚索菲亚大学的西蒙·埃马努伊洛夫在2025年发表的这项研究,提出了一个革命性的解决方案——「许可证神谕」系统。

这项研究发表在2025年的学术期刊上,研究者通过设计一种全新的架构,让AI在回答问题前必须先检验自己的答案是否正确,就像给AI装上了一个严格的「事实核查员」。研究团队在实验中取得了惊人的成果:传统方法只能达到56.7%的准确判断率,而他们的系统达到了完美的100%准确率,完全消除了虚假答案的产生。

研究者首先深入分析了AI产生幻觉的根本原因。在他们之前发表的研究《大型语言模型是如何被设计来产生幻觉的》中,研究团队指出,这个问题并非来自训练数据不足或模型调优不当,而是源于变换器架构本身的局限性。变换器模型就像一个只会模仿的学生,它能够生成语法正确、听起来合理的句子,但缺乏验证这些句子是否符合事实的能力。研究者将这种现象比作「平面语义空间」,在这个空间中

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中东棋局骤变:美以\"师徒反目\"暗流汹涌

浏览 6669

这小车也有辅助驾驶了!奇瑞QQ3EV将于2月6日上市

网易汽车 浏览 2528

遵义市市长黄伟任上被查:16岁考上大学 几天前在参会

红星新闻 浏览 5858

埃迪-豪联赛对前东家伯恩茅斯7场不胜,并列英超最长纪录

懂球帝 浏览 4468

星际之门计划捧红了这家公司,化废弃能源为AI算力,估值达百亿

DeepTech深科技 浏览 3759

跨年档、抓总统、何晴、南京博物院、斩杀线等

电影最TOP 浏览 2311

商务部公告附件首次改为wps格式,金山办公的信创未来该咋看?

江瀚视野 浏览 3697

国家出手太快,这一仗是打不起来了

老斯基财经 浏览 2076

标杆的智能化进阶 试驾一汽-大众全新速腾L

车质网 浏览 3671

贵金属风口催生7连板!白银有色涨势凌厉,基本面却“拖后腿”

览富财经网 浏览 2542

监管部门再出重拳“反内卷”:严禁车企不正当价格竞争,比亚迪小鹏北汽等表态

北京商报 浏览 2986

关于生成式AI,这三个问题很关键

经济观察网 浏览 3601

五连胜保持不败!萨林杰32+11广东双杀广州 徐杰20+4断陈国豪8分

颜小白的篮球梦 浏览 2870

癌症晚期男子驾车撞死婆孙2人后病亡 法院判赔超200万

台州交通广播 浏览 2562

拉莫斯:虽然浙江队实力很强,但我们最近的火力也很强盛

懂球帝 浏览 3572

‍9.7分,成本400万,票房破2亿?陈思诚也压不住,年度黑马来了

靠谱电影君 浏览 282

300万以内无敌手 莲花首款插混SUV定名For Me

网易汽车 浏览 3057

这届双十一,充满了“AI味”与“本地生活味”

连线Insight 浏览 3516

酿酒入列历史经典产业,郎酒的“慢功夫”见真章

征探财经 浏览 3450

试驾深蓝S09:带“家”旅行 配置一“部”到位

驾仕派 浏览 3637

曝杨威与儿子失联!杨阳洋父母情绪崩溃

有趣的胡侃 浏览 3360
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1