关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者4133人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

50岁蒋勤勤这状态绝了!新西兰海边生图似神女

阿握聊事 浏览 2205

X把伊朗国旗改成狮子太阳旗 哈梅内伊把"国旗"删了

澎湃新闻 浏览 13697

多地现快递驿站转让帖 经营者:每月只赚5千不如当保安

红星新闻 浏览 8928

双电机还不够?三电机都来了 新款阿维塔12申报图曝光

网易汽车 浏览 3209

女演员陈妍希突发意外,紧急手术

人间颂 浏览 873

绿帽哥:切尔西就罗德里戈与皇马展开接触,计划冬窗完成交易

懂球帝 浏览 3882

舒淇最爱穿的裙子搭配,真的很适合春天!

黎贝卡的异想世界 浏览 2399

俄罗斯SALUTEDEV团队VIBE:超轻量AI实现高效图片编辑

科技行者 浏览 3127

俄称控制一城镇 乌称击退多次进攻

环球网资讯 浏览 3087

让AI给人类发工资 28岁小伙用AI创业拿下3000万元投资协议

封面新闻 浏览 1525

普京穿军装看俄白军演:试戴热成像战术眼镜 装填手枪

新京报 浏览 3699

李金羽:冲超没那么容易,希望球员们勇敢地面对各种情况

懂球帝 浏览 4787

新中式,才是属于我们的时尚与生活

LinkFashion 浏览 3430

展映11天!北京国际电影节正式官宣

幕味儿 浏览 2125

特朗普敲打美最高法院:再做出否决 中国就赚爽了

观察者网 浏览 38254

共享电单车下沉战升级!松果出行递表港股,业务覆盖全国422个市县|港E声

时代周报 浏览 3244

响应市场需求,积极推动中加经贸合作

国是直通车 浏览 3113

媒体:美一系列肆行无忌行径 释放极其危险信号

上观新闻 浏览 7697

张雨绮被抵制成功!辽视春晚已将她除名

萌神木木 浏览 2971

这一抹瑞红,在2025年终

时尚COSMO 浏览 2609

泽连斯基:乌谈判团队将于2日晚前往乌美俄三方会谈地点

国际在线 浏览 2940
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1