关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者2735人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

燃油车的“智能”反击!2025广州车展燃油新车盘点

车市红点 浏览 2259

超级转型,大洛佩斯生涯前8年仅进3记三分,后9年命中1072记三分

懂球帝 浏览 2849

《爸爸去哪儿》村长李锐,52岁签迪拜12亿大单

草莓解说体育 浏览 2959

鏖战3小时,40岁老将瓦林卡追平纳达尔职业生涯一大纪录!

网球之家 浏览 1850

「冰雪+温泉」模式:山地文旅地产如何重构冬季休闲生活?

豹变 浏览 1972

5分钟充满电!全球首款可量产全固态电池来了

21世纪经济报道 浏览 1817

大S两个孩子回北京过年,汪小菲和孩子团聚

素素娱乐 浏览 1509

杭州一家有两位百岁老人:同年同月同日生 被指心态好

极目新闻 浏览 11451

天津外援阿代米谈胜利:现在要做的是忘掉这一场比赛,准备下一场

直播吧 浏览 3514

充电十分钟、续航2000公里!宁德时代宣布:2027年量产全固态电池

优视汽车 浏览 2273

你的“龙虾”是否“遵规守纪”?“养虾人”速查风险

环球网资讯 浏览 644

陆毅女儿漂亮到认不出!年仅16岁身高超一米七,长相神似陈都灵

温柔娱公子 浏览 2927

金店墙体惊现盗洞 男子将170万元黄金藏祖坟墓碑后

极目新闻 浏览 2056

E句话| 恭喜,他们生三娃了!

仙女事件簿 浏览 2638

徐艺洋机场被偶遇,生图五官优越有星味

往史过眼云烟 浏览 1525

关税预期与矿山停产“共振”,伦铜首次突破1.2万美元再创历史新高

华尔街见闻官方 浏览 2022

波音圣路易斯地区罢工持续近三月,谈判陷入僵局

国际金融报 浏览 2685

55岁港星宣萱自曝:放弃结婚,29岁最后一晚哭一天,黄金时代过去

温柔娱公子 浏览 2459

联盟各队在恐慌雷霆 战绩第一还手握快船2026年首轮签

仰卧撑FTUer 浏览 2242

鸿蒙智行"9系"扩容 首款MPV智界V9来了

网易汽车 浏览 2144

美H-1B签证申请费猛增至10万美元 印度政府发出警告

澎湃新闻 浏览 20088
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1