关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者1532人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

国庆可提车 吉利银河星耀6先享预售价7.98万元起

网易汽车 浏览 3389

900V架构打造 莲花ForMe将于3月29日上市

车质网 浏览 735

空军发布重磅视频 多款新型战机亮相

参考消息 浏览 1773

特朗普行政令降低大麻管制等级,投资者“卖事实”,大麻股普跌

华尔街见闻官方 浏览 2019

千亿豪赌,甲骨文会成“甲骨文”?

每日资本论 浏览 2122

AI虚拟细胞面世,无需等待实验,可预警药物疗效与机制

DeepTech深科技 浏览 1721

法甲+欧联九连败,巴黎人报:尼斯主帅弗朗克-海瑟已正式下课

懂球帝 浏览 1925

与美主持人激烈辨论后被闭麦 万斯怒了

环球网资讯 浏览 6887

陶瓷业加速洗牌:政策倒逼转型,马可波罗如何引领行业突围?

红星资本局 浏览 1461

袁悦苦战182分钟惨胜后遭调侃打球兼项马拉松,吴易昺疑似又伤了

网球之家 浏览 1720

穆塞蒂全八强难耐德约,辛纳速胜同胞会师球王

网球之家 浏览 1563

北京现代EO 羿欧将于10月16日正式开启预售

车质网 浏览 2895

俄称已控制红军城和沃尔昌斯克

国际在线 浏览 2262

方媛生三胎后现身芜湖,摘墨镜气血不足显憔悴

小椰的奶奶 浏览 1678

辽粤会师全运会半决赛!杨鸣:广东占天时地利人和

体坛周报 浏览 2561

10月工信部新车申报:小鹏/奥迪/吉利等多款车型在列!

百姓评车 浏览 2899

省委书记、省长等18位省领导 一下火车直奔企业车间

政知新媒体 浏览 8069

外媒聚焦中国“最强航母”:看得清清楚楚 很冲击了

观察者网 浏览 6750

郭富城三胎还是女儿!狗仔拍到其扁嘴照,方媛发声强调不在乎性别

萌神木木 浏览 2779

巴黎时装周|来看,全世界最美的衣服

LinkFashion 浏览 2877

巴菲特大举买入谷歌,股神为何爱上科技股?

郭施亮 浏览 2408
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1