关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者2753人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

蓝色+灰色、红色+棕色,这4组配色怎么搭都好看!

LinkFashion 浏览 1398

30万的玛莎拉蒂,被一抢而空!超跑皇后暴击中国人

象视汽车 浏览 2002

周末超重磅!特朗普关税突发,ETF净流出近2000亿,央广网:降温不是熄火

看财经show 浏览 1587

极氪右转:为何回归一个吉利?

天天汽车 浏览 2656

特朗普威胁哥伦比亚总统:马杜罗之后就是你

澎湃新闻 浏览 19703

德国央行行长:与中企的竞争 该让所有欧企彻底醒醒了

澎湃新闻 浏览 2826

名记:穆阿尼将继续留在热刺,尤文今夏将再次尝试引进他

懂球帝 浏览 1415

高管“换血”,股东内斗落幕!200亿淳厚基金迎国资入主

独角金融 浏览 1708

专家:敏感时刻俄核演习展示肌肉 发出强烈威慑信号

澎湃新闻 浏览 2674

购置税新规下的购车选择题,插混车抄底还是等新车?

百姓评车 浏览 2901

马筱梅首次公开孕肚!自曝生产全都自己安排,暗示对汪小菲失望

萌神木木 浏览 1758

男子带1650个苹果到烈士陵园:想让每名烈士都能吃5个

极目新闻 浏览 8432

土耳其下令拘捕内塔尼亚胡 以色列外长公开回应

新京报评论 浏览 8757

电池容量竞赛升级?零跑、小米布局80度大电池增程车型

汽车点评AC 浏览 3309

最高法明确:醉驾启用辅助驾驶仍需担刑责

网易汽车 浏览 774

莱巴透露战斯瓦泰克的两大关键,丝袜称气温还这么高会手足无措

网球之家 浏览 1565

一周AI大事:谷歌Gemini学会“接管”你的电脑、马斯克机器人被手卡住了

网易科技报道 浏览 2889

方媛生三胎后现身芜湖,摘墨镜气血不足显憔悴

小椰的奶奶 浏览 1674

今年秋冬最流行的外套竟然是它?谁穿谁时髦!

LinkFashion 浏览 2429

拉波尔塔:23年巴萨为梅西准备一份5年合同,但他选择迈阿密

懂球帝 浏览 787

法甲:马赛2比1客胜斯特拉斯堡

体坛周报 浏览 3198
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1