关闭广告

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者928人阅读


这项由马里兰大学巴尔的摩分校的Shubhashis Roy Dipta教授与英特尔实验室的Tz-Ying Wu、Subarna Tripathi等研究团队共同完成的研究发表于2024年9月,论文编号为arXiv:2509.16538v1。对于那些想要深入了解技术细节的读者,可以通过这个编号在学术数据库中查找完整论文。

当我们观看一段视频时,如果有人为这个视频写了一段描述文字,你如何判断这段描述是否准确呢?这听起来像是一个简单的问题,但对计算机来说却是一个巨大的挑战。就好比你请朋友帮你描述一幅画,你需要判断朋友的描述是否靠谱——但问题是,你手里没有这幅画的"标准答案"。

传统的做法就像考试时需要标准答案一样。研究人员会让人工写出视频的"正确"描述,然后用这些标准答案来评判其他描述的好坏。但这种方法有个致命问题:获得这些标准答案需要花费大量人力和金钱,而且当我们面对互联网上海量的视频时,根本不可能为每个视频都准备标准答案。

更糟糕的是,现有的评估方法就像一个粗心的老师,经常给错误的答案打高分。研究团队发现,即使一段描述把视频中的小提琴说成吉他,把男人说成女人,现有的评估系

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

港媒曝朱茵沽货套现!卖2处房产狂赚千万,两房产都与袁某人有关

文艺圈娱乐号 浏览 13013

外交部:如加方不听劝告 中方必将坚决有力回击

环球网 浏览 116804

亚历山大:我不会做招惹对手说垃圾话的事,只会拿30分赢球走人

懂球帝 浏览 1001

古力娜扎现身电影首映疑状态不佳 对女二态度敷衍

叶公子 浏览 14409

警方3D还原货拉拉事件,司机涉嫌过失致人死亡被批捕

趣看热点 浏览 355013

一篇搞懂:飞书多维表格、n8n、Dify 等自动化工作流里的 Webhook 到底是个啥

钛媒体APP 浏览 1039

媒体:上合组织因俄乌战事面临三重困境 中国迎来机遇

直新闻 浏览 63821

7万+再创造车新势力月销纪录 零跑或成下一个中国前十

道哥说车 浏览 718

在《狐妖小红娘》里有理有据地“转世续缘”

时尚COSMO 浏览 12043

章泽天何超琼出席香港商会

素素娱乐 浏览 15558

俄罗斯终于发现 福建舰服役后做中国的朋友很有面子

现代小青青慕慕 浏览 5321

一加中国区总裁李杰:有的手机宣传边框存在“测算猫腻”

IT之家 浏览 950

钟楚曦过往争议被扒,对苗苗黑脸、戛纳霸占楼梯,一进圈就有野心

萌神木木 浏览 875

热巴亮相活动大秀美背 太惊艳了

萌神木木 浏览 19761

马拉多纳签名被伪造,其私人医生或企图隐瞒真相

趣看热点 浏览 25780

罗晋父亲离世后唐嫣首发声

娱乐圈圈圆 浏览 432

比亚迪重金奖励举报腐败行为,最高500万元!

红星新闻 浏览 14333

"分割顿巴斯"提议遇阻 北约秘书长赴美会谈

环球网资讯 浏览 847

5天跌近50% 鼎益丰:未发布“利好通知”不知悉股价下跌原因

网易财经 浏览 12693

日本新一代货运飞船 HTV-X 首飞,为国际空间站送“快递”

IT之家 浏览 857

要求新增超130亿美元军援 拜登重申支持乌克兰

参考消息 浏览 85034
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1