关闭广告

香港科技大学团队发现形式化验证如何让AI推理更聪明

科技行者2923人阅读


这是一个关于人工智能如何学会更好地思考的故事。想象一下,你在教一个聪明但有点"散漫"的孩子做数学题。这个孩子通常能猜对答案,但他的推理过程常常有漏洞——他会说"因为看起来对所以就对了",而不是真正理解为什么。如今,来自香港科技大学、上海人工智能实验室、浙江大学和香港浸会大学的研究团队发现了一个巧妙的办法,让这个"散漫的孩子"学会了像数学家一样严谨地思考。这项研究发表于2026年1月,论文编号为arXiv:2601.22642。

这个故事的核心很有趣:当今最强大的语言模型,比如ChatGPT和Claude,在处理复杂推理问题时,常常会犯一个致命的错误。它们会生成看似合理但逻辑上存在严重漏洞的答案。研究人员的发现更是令人担忧——即使在最终答案是对的情况下,推理过程中有39.3%的步骤在形式化验证中被"驳回"了。而当答案错误时,这个比例甚至高达52.4%。这就像一个学生虽然最后得到了正确答案,但他的计算过程完全是错的——纯粹是靠运气或者模式识别碰巧得对了。

研究团队的创新之处在于,他们不是简单地让AI生成答案就完事,而是在推理的每一步都加入了一个"严厉的数学老师"——形式化验证系统。这个"老师"会实时检查每

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

徐正源:以饱满斗志迎接挑战 会对阵容进行调整

体坛周报 浏览 4298

全网爆火的“鲨鱼裤”太丑了!巨显腿粗!

Yuki女人故事 浏览 4245

去年上海人工智能产业规模预计超5500亿元,增速超30%

澎湃新闻 浏览 3240

何猷君为6岁儿子何广燊庆生,儿子神似赌王

王稱吃吃喝喝 浏览 4129

日本开年密集外交搞了不少小动作 引发地区国家警惕

澎湃新闻 浏览 7474

零跑造豪车,“优衣库”依然是朱江明最坚硬的铠甲

雪豹财经社 浏览 4104

向华强说娱乐圈明星美女他看不上眼:极致宠溺背后的事业共生学

互联观察联盟 浏览 3015

朝鲜举行盛大阅兵式 高清大图来了

新华社 浏览 4017

股票涨停 360三季度净利润同比扭亏为盈

中国经营报 浏览 3927

惨不忍睹,四川全场46分创CBA常规赛单场历史最低分

懂球帝 浏览 3388

太阳报:曼联17岁中场思韦茨随一线队训练,被比作佩德里

懂球帝 浏览 4356

负债数亿,足力健卖食品要开20000家店

中国企业家杂志 浏览 3931

巨人网络80后CEO张栋辞职 前任刘伟再掌舵

中新经纬 浏览 14973

反趋势?理想汽车盈转亏!MEGA召回烧没11亿元?

道哥说车 浏览 3763

加斯佩里尼:意甲争冠?我知道有一些实力更强的球队

懂球帝 浏览 3444

赵少康称"很多人想退党" 黄建豪:应给郑丽文时间调整

海峡导报社 浏览 8827

乌代表团“换将”赴美 佩斯科夫:俄方只和美国谈

每日经济新闻 浏览 3633

枪手又被黑?塔帅称VAR的解释不对

体坛周报 浏览 3065

新华保险首个中资产康养旅居社区落地开启旅居养老新范式

经理人杂志 浏览 3998

有消息称“美军战机系被友军误击”

南方都市报 浏览 2387

公安分局公示的三个监督电话打不通 官方回应

大风新闻 浏览 8720
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1