关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者3598人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

高市早苗曾主张修改日本宪法 企图让日本重获宣战权

上游新闻 浏览 8646

技嘉X870E X3D超级冰雕主板图赏:超大彩屏,五彩斑斓的白

IT之家 浏览 3273

碧桂园高层调整!联席主席及总裁变更,债务重组有大进展

券商中国 浏览 3133

深圳1900亿央企换将,去年人均薪酬超51万

华美财经 浏览 3058

日本年度第一!文艺影迷必刷的蓝色之诗

幕味儿 浏览 3472

朱江明和费翔一起发零跑车皇!增程配80度大电池,“全身名牌”登场

车东西 浏览 3396

今冬高质感穿搭,很有气质!

Yuki女人故事 浏览 3107

满电仅需6分钟,宁德时代发布新电池

大象新闻 浏览 762

王一博风波升级!吐槽肖战等十几位明星

阿废冷眼观察所 浏览 1917

北京越野BJ40增程大电池版实车图曝光

车质网 浏览 2930

不止本田遭遇“冰雹”,这些跨国车企如何找回“春天”?

禾颜阅车 浏览 1608

再冷的天也拆不散我和九分裤组CP

Yuki女人故事 浏览 3742

银行大动作!这类大额存单利率,跌破1%

中国基金报 浏览 2701

东京车展首发 曝丰田世极轿跑SUV概念车官图

车质网 浏览 3206

山东城商行“王者之战”戏剧性落幕

财经众议院 浏览 1998

终结3连败!骑士大胜双杀步行者 米切尔43分末节16分

醉卧浮生 浏览 3112

徐帆带徐朵参加活动,徐朵发文回应质疑

无处不风景love 浏览 2554

柴麒敏:绿色低碳产业将释放约30万亿元新增投资

中国企业家杂志 浏览 2532

泽连斯基称俄乌和平协议无简单解决方案 普京发声

每日经济新闻 浏览 3050

初夏穿衣千万别发愁,看看这些日常穿搭,减龄舒适又显身材

静儿时尚达人 浏览 185

30 个月,一个周榜的诞生与消失

晚点LatePost 浏览 3546
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1