关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者3166人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊朗炮艇逼近悬挂美国旗油轮

CCTV国际时讯 浏览 2879

规模创历史新高 2025浦江创新论坛共议科技未来

看看新闻Knews 浏览 4807

金秀贤消失一年近况曝光,坚强筹备今年复工

汪巗的创业之路 浏览 911

《伟大的长征》首发预告,于和伟饰演毛泽东,总觉得差点意思

最爱酷影视 浏览 4234

星尘智能绳驱机器人T1发布:能做饭、晾衣服,8.99万元起

IT之家 浏览 194

台媒:大陆在朱日和基地复制"总统府" 不可掉以轻心

经济观察报 浏览 13344

解码东道主意大利的冲金版图 丰塔纳的最后一舞

体坛周报 浏览 2861

2026短剧出海:淘汰赛加速,谁主沉浮?

霞光社 浏览 3050

女子花费2000多元认养老虎 结果虎园隐瞒老虎死讯数月

大风新闻 浏览 31849

强抓马杜罗后 特朗普:"门罗主义"该改为"唐罗主义"了

环球时报国际 浏览 10569

男子围猎多名女性自称是"公务员" 有女子给他140万

极目新闻 浏览 95903

清华团队提出药物相互作用预测方法,预测准确率提升近三成

DeepTech深科技 浏览 4979

斯图里奇:阿森纳踢得非常老练,他们传球精准&决策出色

懂球帝 浏览 3457

葡媒:穆里尼奥保留了前任拉热教练组里的两名成员

懂球帝 浏览 4927

全新旗舰SUV 蔚来ES9将于第二季度正式上市

车质网 浏览 3096

台湾教授苑举正痛心疾首:赖清德称"终战"是愚不可及

大象新闻 浏览 9539

“咨询行业的黄埔军校”,又被罚了

财通社 浏览 3089

车长超5米 比亚迪海狮08/海豹08配高阶智驾

网易汽车 浏览 3194

《罚罪2》40集:彭局弘市长判刑20年

影像温度 浏览 3116

张朝阳:AI让人人成为“知道分子”,但我们仍需思考丨2025世界互联网大会

红星资本局 浏览 3771

又见天价离婚,冻结上市公司股权34亿!

诗与星空 浏览 4330
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1