关闭广告

小米研究院推出AI视频理解:让机器像人一样"回看"思考视频内容

科技行者2570人阅读


这项由小米人工智能实验室(MiLM Plus)的李佳泽领导,联合独立研究者以及中国人民大学团队合作完成的研究,发表于2025年11月的计算机视觉领域顶级会议论文中。有兴趣深入了解的读者可以通过论文编号arXiv:2511.13026v1查询完整论文。

当你在看一部长电影时,如果朋友突然问你"刚才那个场景里谁救了谁",你可能会本能地回想刚才看到的画面,重新审视那些关键镜头。现在,研究团队让人工智能也学会了这种"回看思考"的能力。

目前的AI视频理解系统就像一个只能"一遍过"看视频的观众,看完就必须立即给出答案,不能重新检查可能遗漏的重要细节。特别是面对长视频时,这种限制变得更加明显。就好比你被要求看完一部两小时的电影后,不允许回想任何情节就要回答复杂问题一样困难。

研究团队发现了现有AI系统的一个重要缺陷:当这些系统

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

纯电续航215km 全新阿尔法T5增程版10月底将上市

网易汽车 浏览 3944

跨年档、抓总统、何晴、南京博物院、斩杀线等

电影最TOP 浏览 2310

章若楠妹妹大婚

观察鉴娱 浏览 3597

普通人秋天应该怎么穿衣?颜色选对、衣服穿对,简单又大方

静儿时尚达人 浏览 3359

使命、念力与品位:AI时代的人之为人

华夏时报 浏览 1907

收购“Manus”也治不好大厂的焦虑症

虎嗅APP 浏览 2693

全红婵不参赛有多致命?180元门票惨遭冷落

TVB的四小花 浏览 449

尹锡悦被控同军方合谋试图“诱使朝鲜发动进攻”

扬子晚报 浏览 8389

UC圣地亚哥学者巧用树形搜索让AI画画训练快2.4倍

科技行者 浏览 2694

车机升级 第五代宏光MINIEV将于3月下旬上市

车质网 浏览 1612

迈凯伦新专利 赛道模式将锁定使用场景

车质网 浏览 3076

大兵压境时忽启谈判 特朗普“葫芦里卖的什么药”

看看新闻Knews 浏览 2372

22个州经济正在萎缩,消费者信心持续下跌,多家机构警告美国经济衰退

环球网资讯 浏览 3752

布朗41+7+6绿军险胜双杀太阳 布克40+6迎500场20+里程碑

醉卧浮生 浏览 1725

山姆变盒马?500万中产抵制“阿里味”

花朵财经 浏览 3307

微软CEO纳德拉:能源成本将决定哪些国家能在人工智能竞赛中胜出

IT之家 浏览 2531

共谋细胞与基因治疗产业创新发展!珠海举行前沿技术交流会

南方都市报 浏览 4343

美媒评字母哥五大交易方案 联手文班?加盟湖人?

体坛周报 浏览 3056

蔚来法务部回应遭网络侵权:已报案并获法院判决支持

智车情报局 浏览 3673

稳定币监管僵局震动加密货币市场:Coinbase(COIN.US)带头反对 关键法案被迫推迟审议

智通财经 浏览 2583

能换电池还能焊模块的手机来了

IT之家 浏览 2463
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1