关闭广告

斯坦福大学团队推出「许可证神谕」:让AI学会说「我不知道」

科技行者3056人阅读


当你向ChatGPT询问某位哲学家的出生日期时,它总是信心满满地给出答案,哪怕这个答案完全错误。这种现象被研究者称为「幻觉」,就像AI患了妄想症,总是编造一些听起来很有道理但实际上完全错误的信息。来自加州圣迭戈RA软件公司的理查德·阿克曼和保加利亚索菲亚大学的西蒙·埃马努伊洛夫在2025年发表的这项研究,提出了一个革命性的解决方案——「许可证神谕」系统。

这项研究发表在2025年的学术期刊上,研究者通过设计一种全新的架构,让AI在回答问题前必须先检验自己的答案是否正确,就像给AI装上了一个严格的「事实核查员」。研究团队在实验中取得了惊人的成果:传统方法只能达到56.7%的准确判断率,而他们的系统达到了完美的100%准确率,完全消除了虚假答案的产生。

研究者首先深入分析了AI产生幻觉的根本原因。在他们之前发表的研究《大型语言模型是如何被设计来产生幻觉的》中,研究团队指出,这个问题并非来自训练数据不足或模型调优不当,而是源于变换器架构本身的局限性。变换器模型就像一个只会模仿的学生,它能够生成语法正确、听起来合理的句子,但缺乏验证这些句子是否符合事实的能力。研究者将这种现象比作「平面语义空间」,在这个空间中

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

娜扎《玉茗茶骨》解锁国风新体验

呱田里的猹 浏览 3153

联合国官员:加沙惨状如末日电影

上观新闻 浏览 3261

你敢变重6公斤吗?

时尚COSMO 浏览 823

伊姐周日热推:电视剧《超感迷宫》;电视剧《风与潮》......

伊周潮流 浏览 2783

冬天别只穿黑白灰,看看这些“蓝色系”穿搭,清爽减龄又高级

静儿时尚达人 浏览 3478

"最快女护士"新年第一跑夺冠获1.5万奖金 本人发声

红星新闻 浏览 18512

再斩第一!OceanBase蝉联IDC榜单,国产数据库实力领跑

雷科技 浏览 3248

从负债几百万,到霸榜粮油,抖音直播间隐藏着农业产业带的崛起

锦缎研究院 浏览 4711

SpaceX提示风险:太空AI技术未经验证,未必能商业化

财联社 浏览 1309

董卿母子现身看电影,13岁儿子身高超160

娱乐圈圈圆 浏览 2951

Windows 11长期存在0x80070103错误:微软承认无法彻底修复!

快科技 浏览 3965

卡拉菲奥里:我不想看世界杯比赛;希望在阿森纳继续赢下去

懂球帝 浏览 185

雅图高新被举报后发长文反驳:谁是谁非需捋清 北交所非“垃圾箱”IPO企业非出气筒

财经下午茶 浏览 4057

看大疆做全景相机,不要只看两份报告

连线Insight 浏览 3872

深耕全民阅读落地,咪咕以数智服务拓宽书香边界

环球网资讯 浏览 1308

从“白幼瘦”到“气血感”,审美标准终于“健康”了?

Yuki女人故事 浏览 3556

外媒:特朗普反复威胁 欧洲领导人已感到厌倦

参考消息 浏览 15080

男子凌晨打车嫌98元车费太贵 和的哥在派出所耗到天亮

环球网资讯 浏览 8625

一只“死鸡”,能骗走你多少钱?

虎嗅APP 浏览 11

石油巨头裹足不前的心理阴影:委内瑞拉与美国的百年石油恩怨

澎湃新闻 浏览 3148

巴平民被枪杀 特朗普扬言“冲进加沙铲除哈马斯”

参考消息 浏览 10312
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1