关闭广告

小米研究院推出AI视频理解:让机器像人一样"回看"思考视频内容

科技行者2566人阅读


这项由小米人工智能实验室(MiLM Plus)的李佳泽领导,联合独立研究者以及中国人民大学团队合作完成的研究,发表于2025年11月的计算机视觉领域顶级会议论文中。有兴趣深入了解的读者可以通过论文编号arXiv:2511.13026v1查询完整论文。

当你在看一部长电影时,如果朋友突然问你"刚才那个场景里谁救了谁",你可能会本能地回想刚才看到的画面,重新审视那些关键镜头。现在,研究团队让人工智能也学会了这种"回看思考"的能力。

目前的AI视频理解系统就像一个只能"一遍过"看视频的观众,看完就必须立即给出答案,不能重新检查可能遗漏的重要细节。特别是面对长视频时,这种限制变得更加明显。就好比你被要求看完一部两小时的电影后,不允许回想任何情节就要回答复杂问题一样困难。

研究团队发现了现有AI系统的一个重要缺陷:当这些系统

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

奥迪E5 Sportback获2026 CCOY年度车大奖

网易汽车 浏览 2603

美防长下令从德国撤出5000名驻军

国际在线 浏览 235

腾讯集团高级副总裁郭凯天:坚持智能向善,构筑人与AI的信任机制

上游新闻 浏览 3480

10家车企补贴“倒计时” 谁在让利谁在锁单?

汽势传媒 浏览 3540

鸿蒙智行首款MPV智界V9完成申报,采用7座布局

IT之家 浏览 2674

霍英东体育基金会晚宴,多位奥运冠军现身,霍家更知郭晶晶的份量

不八卦会死星人 浏览 2963

杨紫扛剧女王不是白叫的,顶流胡歌也得给她作配

大黑爱旅游 浏览 2499

撕开铁幕裂缝:国产手术机器人的千亿逆袭

钛媒体APP 浏览 3765

今年冬天最流行的4组叠穿,让你美出新高度!

LinkFashion 浏览 2657

弗莱彻首战曼联将用四后卫,B费请缨出战!新帝星已撤回转会申请

罗米的曼联博客 浏览 2680

从港股GPU第一股看壁仞科技的价值新论

互联网那些事 浏览 2728

缅甸政府将拆除KK园区148栋建筑,其中包括KTV、医院和SPA会所,已拆除101栋

红星新闻 浏览 3334

世体:拉波尔塔率队访问布鲁日,参加接待仪式并漫步市中心

懂球帝 浏览 3404

短剧要翻拍《新英雄本色》,短剧一哥刘萧旭主演,海报有内味儿

最爱酷影视 浏览 3774

打通置换堵点!上海放大招:政府启动二手房收购

国际金融报 浏览 2388

运动化版本 斯柯达Epiq Sportline谍照曝光

车质网 浏览 168

糊了22年,他终于凭借「性张力」火了

独立鱼 浏览 3508

拒绝被ARM偷家!苏姿丰祭出杀手锏:2nm Venice处理器剑指1200亿AI蓝海

快科技 浏览 296

熊园:“十五五”大方向已定,如何跟踪?

首席经济学家论坛 浏览 3647

内娱白月光,毁于潜规则?

阿淫记录生活日常 浏览 3677

骑士135-119轻取步行者,米切尔43+9+6,西亚卡姆26分

懂球帝 浏览 3013
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1