关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3185人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

这个「疯批」星二代,撕碎了娱乐圈的滤镜

独立鱼 浏览 3003

女星安吉丽娜·朱莉访乌 其随身保镖被乌军征兵处抓走服役

极目新闻 浏览 3964

丈夫抢儿被拘15日仍不送还 女博士:儿子快不认识我了

红星新闻 浏览 3209

E句话| 女星放弃抢救病危丈夫,儿子当场质问?

仙女事件簿 浏览 2888

伊朗外长:美封锁港口是战争行为

环球网资讯 浏览 32700

浙大团队突破:AI实现多人脸精准生成

科技行者 浏览 4188

勇士124-106轻取鹈鹕,库里11中2仅9分,穆迪8记三分

懂球帝 浏览 3914

专栏 | 我们对女性友谊太缺乏想象力了

时尚COSMO 浏览 4187

700万辆之后 中国汽车出口的“下一程”

车质网 浏览 3132

清华大学团队NeurIPS 2025文章分析 RL 与 SFT 泛化性差异

机器之心Pro 浏览 4463

张子宇加盟首次未登场:前两场正负值均最差 山东女篮加时胜江苏

醉卧浮生 浏览 3196

石药集团185亿美元合作背后

YOUNG财经 浏览 2932

这年头长得好看也成错了?!

伊周潮流 浏览 2102

美媒:乌克兰向美国提交对最新“和平计划”的回复

澎湃新闻 浏览 3428

NBA战报:灰熊141-125热火,阿德巴约23分

懂球帝 浏览 4172

今年春夏最火的3个穿搭思路,普通人可以直接照搬吗?

黎贝卡的异想世界 浏览 802

双红会3亿强援替补!维尔茨谢什科遭弃用,媒体人:斯洛特真大胆

奥拜尔 浏览 4204

进博面对面|A2牛奶公司黎笑:借进博会“溢出效应”不断升级“全家营养解决方案”

中国商报 浏览 3991

拥抱变局!2025外滩年会揭幕,聚焦新秩序、新科技

国际金融报 浏览 4192

“过年红”就这么穿,真不俗!

Yuki女人故事 浏览 2976

马斯克评英伟达纯视觉自动驾驶系统Alpamayo

不看车bukanche 浏览 3224
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1