关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者3600人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

OptiScaler发测试版:抢跑AMD为Vulkan游戏开启FSR 4

IT之家 浏览 2047

菲戈和伊尔迪兹获2025地中海卓越奖,颁奖典礼于10月20日进行

懂球帝 浏览 3690

马斯克xAI污水处理厂破土动工,每年可为孟菲斯节约近190亿升水

IT之家 浏览 3884

10000亿中芯国际,一剑封喉!

飞鲸投研 浏览 3117

存储厂商争相敲定下一代标准,DDR6 研发进程提速

财闻 浏览 274

山东海阳老人扎堆领结婚证现场挤满人 有村庄包车去办

极目新闻 浏览 9669

短剧男主遇上长剧男主,谁是天然帅哥谁是滤镜美男,差距一目了然

娱乐圈笔娱君 浏览 3212

销量口碑双丰收 东风奕派 007 + 推动 15 万级新能源产业提质

新华报业网 浏览 2896

格拉斯纳:期待与埃泽的碰面,但在比赛中我们只会全力争胜

懂球帝 浏览 3617

冬天穿衣其实很简单!上短下长、加点亮色,高级舒适又耐看

静儿时尚达人 浏览 2688

哈登:我以前从未如此不顺但我仍充满信心,这是对我们的考验

懂球帝 浏览 3199

穆塞蒂全八强难耐德约,辛纳速胜同胞会师球王

网球之家 浏览 2482

丈夫因妻子"买肉价格低"疑其出轨 捅刺结婚30多年妻子

红星新闻 浏览 3850

稳居无创产检检测赛道第二,双三类证在手,安诺优达三度闯关港股|港E声

时代周报 浏览 785

于东来周鸿祎秦英林王宁张红超,2025河南企业家影响了中国?

BT财经 浏览 2954

43岁蔡卓妍官宣再婚!明星好友纷纷祝福

萌神木木 浏览 452

美媒感叹:中美已不存在贸易战了 中国巨轮势不可挡

澎湃新闻 浏览 15032

"分割顿巴斯"提议遇阻 北约秘书长赴美会谈

环球网资讯 浏览 3581

宋小宝春晚临时瞎编一句话红遍全国

乡野小珥 浏览 3560

李平康:国安在谈一名东欧外教,其人在北京&还是以前的渠道

懂球帝 浏览 3467

酷睿Ultra X9处理器388H体验:电竞级核显,续航超持久

IT之家 浏览 2471
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1