关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者3599人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

法媒:让热亚尔与巴黎的合同明夏到期,法兰克福等队对他有意

懂球帝 浏览 2895

试过了,“和SIM卡并无差异”

都市快报橙柿互动 浏览 2936

丹麦航运巨头:中东战事加剧全球贸易和物流不确定性

极目新闻 浏览 169

李湘王岳伦酒店同住引热议,女儿成和解纽带?

最美的开始 浏览 2953

【中超】恩里克2球迪力穆拉提世界波 梅州1比4玉昆

体坛周报 浏览 3570

福原爱首次回应再婚怀孕 现任丈夫正是出轨风波男主

新民周刊 浏览 7941

黄一鸣宣布新恋情,王思聪或成过去式

赵昉是个热血青年 浏览 2597

广汽启动自主品牌BU改革 昊铂埃安渠道统筹运营

网易汽车 浏览 2927

净利腰斩 “非洲之王”传音失速

北京商报 浏览 2385

售价40.28万元 2026款丰田GR YARIS上市

网易汽车 浏览 1018

业余球手夺一球致胜冠军!高芙贡献名面,周杰伦球都没碰到就出局

网球之家 浏览 2600

俄方表示结束乌克兰危机“欧洲方案”不具建设性

环球网资讯 浏览 3222

猛士汽车2025全年销量10228台 同比增长387%

网易汽车 浏览 2663

新能源汽车的轮胎,为啥那么贵?

小李车评李建红 浏览 3615

笔在手中,镜头是新墨水

上观新闻 浏览 2768

中俄最后一刻没保住伊朗 制裁重启哈梅内伊政权危险了

文雅笔墨 浏览 37302

搭2.9T插混动力 法拉利SC40官图发布

车质网 浏览 3589

德甲欧战,还是只能靠拜仁、多特撑着

体坛周报 浏览 3526

2025 全球十大工程成就发布:DeepSeek、人形机器人等入选

IT之家 浏览 3898

外媒:法国称“已准备好”向乌克兰派兵

参考消息 浏览 3574

极石ADAMAS将于12月28日上市

天天电动 浏览 2892
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1