关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者2969人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"商务部公告附件首次改为wps格式"不实 至少5年前已用

极目新闻 浏览 8384

综合续航超1500km 加方盒子车身 智己LS9即将上市!

车品 浏览 3839

德黑兰传出防空系统拦截声 以宣称考虑恢复对伊军事行动

极目新闻 浏览 906

“做次反派,人生爽翻”

时尚COSMO 浏览 3303

厦大EMBA,四维一体、育见未来

经理人杂志 浏览 4151

中年女人想穿得时髦,少穿羽绒服+紧身裤,换成这些好看保暖

静儿时尚达人 浏览 3722

辽宁加时95-82江苏,赵继伟16+7+8,威尔斯21分

懂球帝 浏览 2894

不愧牛市!证券公司赚疯了,有人利润翻5倍

说财猫 浏览 3091

富豪阮鸿献给爱女发过亿大红包,已连续三年未登上胡润百富榜

雷达财经 浏览 3761

美无人机出现在委内瑞拉近海

北青网-北京青年报 浏览 3467

Bella的戛纳之旅,次次“神级”表现

时尚COSMO 浏览 168

美媒:特朗普羡慕中国 华盛顿正在模仿北京

观察者网 浏览 7104

蔚来ES9领衔 蔚来三品牌全系亮相大湾区车展

网易汽车 浏览 5

第138届广交会10月15日开幕,约3600家企业首亮相,首设智慧医疗专区

红星资本局 浏览 4265

六王表演赛:辛纳2-0横扫阿卡,带走600万美金和一把纯金球拍

懂球帝 浏览 4024

深铁再救万科220亿,暗藏的动作太多了

大猫财经Pro 浏览 3499

QClaw指令发红包?微信员工紧急回应:假的!

雷科技 浏览 2342

熊黛林带双胞胎女儿旅行,2个女儿长得完全不一样

素素娱乐 浏览 2991

追梦:篮网27号秀是“犹太约基奇”?是个人就是小约基奇啊

懂球帝 浏览 2967

特朗普呼吁立即停火 遭俄方坚决驳斥

财联社 浏览 4174

“林下生金”,看生态与产业如何共振

海外网 浏览 4030
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1