关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者2974人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

许绍雄葬礼设公祭时段,开放公众致意,曝他去年查出肾脏有肿瘤

扒虾侃娱 浏览 3886

郑晓龙监制!杨紫主演耗资3.5亿的史诗级传奇剧

娱乐圈笔娱君 浏览 2348

唐一军16年敛财1.37亿获无期 曾通过妻子大搞权钱交易

界面新闻 浏览 9035

告别“躺赚” 消金与小贷走向殊途

北京商报 浏览 3011

山东省首家国际顶尖科学家工作室启动,聚焦阿秒激光技术领域

财闻 浏览 2147

对话刘展术|大众安徽是转型先锋,与众09将于下半年上市

My车轱辘 浏览 18

演讲遭抗议 以总理下令:"黑"进加沙手机 用扩音器直播发言

红星新闻 浏览 4792

中超第27轮传球成功率榜:国安89.6%居首,时隔5轮再次登顶

懂球帝 浏览 3664

陈凯歌做梦也没想到,竟有一天会因儿子陈飞宇,实现口碑暴增

温柔娱公子 浏览 3918

威胁要对盟国加征关税后 特朗普亲率代表团出席达沃斯

澎湃新闻 浏览 12632

这是一个跨越二十四年的纪实长镜头

幕味儿 浏览 3681

将于2027年上市 AMG CLA猎装车谍照曝光

车质网 浏览 2808

尹锡悦被控同军方合谋试图“诱使朝鲜发动进攻”

扬子晚报 浏览 8874

新国标来了!曾经吹上天的辅助驾驶要“变天”了

知嘹汽车 浏览 1279

谁说冬天不能穿裙子?照着搭美出新高度

LinkFashion 浏览 2701

新年将至 普京问候前线俄军:感谢英勇的所有人

看看新闻Knews 浏览 3287

事实证明,女人到了五六十岁别再去扮嫩!这样穿又优雅又显贵

静儿时尚达人 浏览 4175

迪马济奥:尤文已与前主帅图多尔解约

懂球帝 浏览 3161

西蒙菲莎大学发布:1.7万图像皮肤病变数据集训练AI诊断

科技行者 浏览 3163

全球研发投入2000强中国占29%:谁在玩命砸钱?钱都花哪了?

澎湃新闻 浏览 3424

山东城商行“王者之战”戏剧性落幕

财经众议院 浏览 2497
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1