关闭广告

小米研究院推出AI视频理解:让机器像人一样"回看"思考视频内容

科技行者3085人阅读


这项由小米人工智能实验室(MiLM Plus)的李佳泽领导,联合独立研究者以及中国人民大学团队合作完成的研究,发表于2025年11月的计算机视觉领域顶级会议论文中。有兴趣深入了解的读者可以通过论文编号arXiv:2511.13026v1查询完整论文。

当你在看一部长电影时,如果朋友突然问你"刚才那个场景里谁救了谁",你可能会本能地回想刚才看到的画面,重新审视那些关键镜头。现在,研究团队让人工智能也学会了这种"回看思考"的能力。

目前的AI视频理解系统就像一个只能"一遍过"看视频的观众,看完就必须立即给出答案,不能重新检查可能遗漏的重要细节。特别是面对长视频时,这种限制变得更加明显。就好比你被要求看完一部两小时的电影后,不允许回想任何情节就要回答复杂问题一样困难。

研究团队发现了现有AI系统的一个重要缺陷:当这些系统

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

慢镜头:莫塔不会回归尤文,但他的合同会影响尤文选帅

懂球帝 浏览 4144

中国驻英国使馆发言人就英方制裁中国实体问题答记者问

网易财经 浏览 4185

太阳报:奥利塞帮助埃泽适应枪手新生活,二人经常会在线下棋

懂球帝 浏览 3560

山东济宁一商家芒果礼盒藏试卷、课本 商家回应

极目新闻 浏览 5793

微创、高效、直达大脑!我国科学家开辟脑卒中病灶给药新路径

环球网资讯 浏览 3086

特朗普称"不许中国领先美国" 不到24小时中方定下规矩

军机Talk 浏览 7215

复婚无望!baby黄晓明陪小海绵零交流

八卦王者 浏览 1235

拉莫斯:可以接受战平浙江队的结果,球队走在正确的道路上

懂球帝 浏览 4089

全面大撤离!李嘉诚英国“套现”2000亿

创业家 浏览 865

13.99万元起 深度解读深蓝L06三大黑科技

第五冲程 浏览 4024

BBC两高管宣布辞职 特朗普:他们试图"介入总统选举"

红星新闻 浏览 8981

“亚洲巴菲特”,大手笔押注黄金

财通社 浏览 3071

刘强东“10年1元年薪”之约到期,律师解构高净值人群如何妥善处理财产

红星资本局 浏览 4772

中国平安这张“卫星牌”,打得太“牛”了

野马财经 浏览 877

巴基斯坦与沙特签协议被指影响超越中东 引发多国震动

环球网资讯 浏览 16903

今年春夏最火的3个穿搭思路,普通人可以直接照搬吗?

黎贝卡的异想世界 浏览 798

推动新场景大规模应用要打通哪些堵点?专访工信部赛迪研究院胡国栋丨聚焦国常会

封面新闻 浏览 3919

特斯拉Model3/ModelY Standard正式发布

网易汽车 浏览 4185

路易斯破82天球荒!复出后首球,申花锁定胜局,马纳法精妙助攻

奥拜尔 浏览 4323

西部联体育主管被指控未经许可挪用好友资金,给俱乐部修球场

懂球帝 浏览 4121

华盛顿大学与耶鲁大学联手:医疗数据库为何让顶尖AI模型"抓狂"

科技行者 浏览 3173
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1