关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3191人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

欧冠一夜4战!将有4队出线:头号黑马呼之欲出 2队晋级无忧

叶青足球世界 浏览 2589

仝卓表弟获救了!照片曝光头发已被剃光,从求助到救出不到24小时

萌神木木 浏览 3612

酷睿Ultra X9处理器388H体验:电竞级核显,续航超持久

IT之家 浏览 2975

外套里面穿什么?这8件“姐感内搭”高级又好看

LinkFashion 浏览 4096

迅雷再次起诉前CEO陈磊 知情人:追索金额达2亿元

红星新闻 浏览 14563

从轿车变成MPV? 雷克萨斯LS概念车正式发布

网易汽车 浏览 4012

美方被指仍在追截第三艘油轮 并拟增派力量强行登船

环球网 浏览 3313

媒体人:国足主帅应让中青年土帅担纲,说不定杀出一位霍去病

懂球帝 浏览 4896

萧煌奇妻子正面照曝光:是短发气质美女,双方否认是奉子成婚

素素娱乐 浏览 3200

特斯拉前全球销售主管爆猛料

电动知家 浏览 3501

韩国最大军工企业爆炸 已造成5人死亡

红星新闻 浏览 13

今年秋天最流行的6条半裙,怎么搭都好看!

LinkFashion 浏览 4789

伊朗陆军司令:伊斯法罕省行动失败是敌方停火主因

界面新闻 浏览 1298

绝色美人赛道,太适合何晴了!

温柔娱公子 浏览 2788

喻国明:正因为人常常不按“最优”计算行动,世界才充满魅力

上观新闻 浏览 3072

特朗普:南非对白人搞"屠杀" G20峰会美国不去了

澎湃新闻 浏览 9873

TVB颁奖典礼:佘诗曼黄宗泽拿视帝视后,《新闻女王》成最大赢家

扒虾侃娱 浏览 3294

科学家开发“神经蠕虫”,实现颅内电极游走模式

DeepTech深科技 浏览 5085

西安市委书记方红卫任上落马 7月刚表态韩松被查

鲁中晨报 浏览 9303

胜利就是最佳礼物,B费:为曼联出战300场最好的庆祝方式

懂球帝 浏览 3349

伊姐周六热推:电视剧《樊笼》;电视剧《翘楚》......

伊周潮流 浏览 13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1