关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3186人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

十年前,我们万万想不到

牛弹琴 浏览 3340

上海团队让人人都能当"数字城市建造师"

科技行者 浏览 2895

尼昂:外界没帮莱奥,他需要帮助

懂球帝 浏览 205

闻泰科技百亿半导体资产控制权受限

南方都市报 浏览 4204

A股2025年分红额创历史新高 分红次数居前上市公司名单一览

财联社 浏览 3362

印度稀土转卖丑闻曝光,伪造文件骗取稀土转卖老美

大国观察眼 浏览 2814

如何在全球高端设备领域掌握话语权?“深圳智造”又传喜报

南方都市报 浏览 4085

维拉已放弃买断桑乔!曼联若解约多特或引进,只会免费签约不给钱

罗米的曼联博客 浏览 3971

德雷森:由衷希望穆勒能在未来回归,拜仁大门将永远为他敞开

懂球帝 浏览 3123

岚图汽车2025年交付150169辆 同比增87%

网易汽车 浏览 3308

舒淇最爱穿的裙子搭配,真的很适合春天!

黎贝卡的异想世界 浏览 2398

用这几件单品,轻松get秋日氛围!

黎贝卡的异想世界 浏览 4193

大众汽车营收微降却亏麻了,利润腰斩暴跌53.5%!

财视传播 浏览 2329

楊千嬅开live老公乱入因一事说离婚

粤睇先生 浏览 3416

人形机器人上演“春晚争夺战”,机器人到底是不是用来表演的?

BT财经 浏览 3362

消失8年,她一回归又是王炸

独立鱼 浏览 3151

中国加速构建具身智能数据标准体系 “浦江X”平台发布

上观新闻 浏览 4159

媒体:马杜罗大难临头仍相信"不至于" 但美却赶尽杀绝

文汇报 浏览 9129

王楚钦:大家都清楚现在的局面,但谁又能说能稳吃我们呢

懂球帝 浏览 1109

媒体:不客气地说 荷兰是在全球面前抢劫中国企业

环球网资讯 浏览 9218

“白色阔腿裤”今年夏天又火了!这样穿时髦又高级

LinkFashion 浏览 838
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1