关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者4128人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

清华教授:高市狂言是对中国武力威胁 暴露日危险走向

上观新闻 浏览 7263

这一夜,龚俊不再吃香,被46岁的男配惊艳

温柔娱公子 浏览 4039

美媒称中国又抓到美国痛点:一旦断供 美国就得瘫痪

观察者网 浏览 3209

香港著名女星,为照顾儿子淡出娱乐圈

秋枫凋零 浏览 3119

直言“薪资不及预期”!上任仅3个月,上市公司财务负责人“闪辞”

红星资本局 浏览 1607

莱因克尔:对阵勒沃库森时哈弗茨应首发,他能提供更多东西

懂球帝 浏览 2161

都灵主帅:我很尊重斯帕莱蒂,我们必须带着创造历史的信念比赛

懂球帝 浏览 3914

高市为当首相对维新会大幅让步 接受其数个"绝对条件"

极目新闻 浏览 9199

三镇小将姜利勋:中超首秀还是有点放不开,教练一直在鼓励我

懂球帝 浏览 2353

你敢变重6公斤吗?

时尚COSMO 浏览 828

毛衣+衬衫、夹克+裙子,今年秋天最流行的4组搭配,时髦又减龄!

LinkFashion 浏览 3443

美媒为联盟防守球员分档:文班独1档 AD3档 詹杜10档 库里未入榜

颜小白的篮球梦 浏览 4759

安东尼奥:难以置信的比赛,球员们真是不可思议

懂球帝 浏览 3071

迈向新时代 上汽大众朗逸新老款车型对比

车质网 浏览 3489

美国拟实施载人绕月飞行任务

北京商报 浏览 3128

日本前首相:中国批高市理所当然 日媒为什么不批

环球网资讯 浏览 16527

特朗普:泽连斯基阻挠俄乌达成和平协议

环球网资讯 浏览 3169

悬了!仅剩80天!“西北酒王”进入倒计时

壹只灰鸽子 浏览 4234

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者 浏览 4107

"四大天王"被网友笑称"四大岳父" 最年轻的黎明已59岁

极目新闻 浏览 8426

集齐产业、PE/VC与央企国资!曦望披露近30亿元新融资细节

21世纪经济报道 浏览 3049
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1