关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者1681人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

惠若琪拟任新职!父母没生儿子被轻视

东方不败然多多 浏览 2032

1年暴涨16倍!超级大牛股,突然爆大雷?

财经锐眼 浏览 1811

IU李钟硕新年撒糖,两人穿情侣装低调秀恩爱

阿雹娱乐 浏览 1627

马斯克:特斯拉Optimus机器人将成为“令人难以置信的外科医生”

IT之家 浏览 2656

李迅雷:黄金暴涨、股市波动,普通人机会在哪?

首席经济学家论坛 浏览 2771

“一个杯子开15次会”?小米徐洁云:至少开了16次

三言科技 浏览 1821

央视一姐董卿“陨落”!51岁的她成于自己

君笙的拂兮 浏览 3351

更智能更豪华 乐道L90加配置会贵多少?

网易汽车 浏览 1699

一封AI邮件,竟让Go语言之父爆起粗口

机器之心Pro 浏览 1936

一个长城战略下,哈弗重塑命名体系

帮宁工作室 浏览 2689

赛英电子治理“黑洞”:IPO前人事动荡,保荐机构入股,独董适格性存疑|读懂IPO

时代周报 浏览 1768

美媒承认:乌重镇即将被攻克

环球时报国际 浏览 2530

限时19.68万元起 比亚迪2026款夏上市

网易汽车 浏览 2496

这家中国民企,破解了“迪拜之眼”难题,还拿下30多项“世界第一”!

国是直通车 浏览 2601

卡拉格:曼城表现得很好,阿森纳会在英超冠军争夺中感到紧张

懂球帝 浏览 2456

美军新锐舰队为应对中国大举集结 集结地却远在夏威夷

枢密院十号 浏览 7161

军事专家:日本敢染指台湾 就是对中国本土造成侵略

环球网资讯 浏览 2208

侯晓楠喊出积极拥抱IP,但阅文很难成为下一个泡泡玛特

蓝鲸新闻 浏览 3322

98年翻版金城武,“正统男港星”终于又出现了

时尚COSMO 浏览 2065

纯电续航210km 海豹05DM-i/海豹06DM-i超享版加推新车型

网易汽车 浏览 1668

天啊!看到林志玲和小13岁刘亦菲同框,才懂王晶为啥说她很一般了

温柔娱公子 浏览 2299
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1