关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2661人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

万科开启了第二笔中票展期

国际金融报 浏览 2980

马斯克最担心的事情来了,阿里投资了核电站!

花朵财经 浏览 2502

我们为什么需要节日穿搭?

时尚COSMO 浏览 2170

郭晶晶白天带孩子爬山,晚上在大学演讲

小娱乐悠悠 浏览 1596

一个手机壳卖200,这家深圳公司靠什么掏空老外钱包?

花朵财经 浏览 2492

以军一天内93次袭击加沙致70人死亡

国际在线 浏览 3776

埃泰克IPO:智能座舱业务驱动营收创新高,客户资源稳步扩展

时代周报 浏览 2552

吉利11月销量破31万辆 连续9个月同环比双增长 再刷历史新高

网易汽车 浏览 3111

"闪赎闪卖"一座万达广场 王健林也玩起"资本游戏"?

BT财经 浏览 2992

71岁奶奶获健美比赛冠军:把健身当上班 被儿媳夸偶像

环球网资讯 浏览 8124

57岁具俊晔又瘦了很多,背影憔悴走路不稳

素素娱乐 浏览 718

离婚真相曝光不到2月,“一言不发”的唐嫣,给娱乐圈上了一课

金风说 浏览 2516

全红婵遭群聊辱骂再升级!国家一锤定音

大鱼简科 浏览 1030

或引入吉利雷神,韩国现代接触中国的插混方案

路咖汽车 浏览 2994

新不如旧!这4件时髦“旧衣服”今年太火了

LinkFashion 浏览 2509

页岩油超级并购来了?Coterra考虑联姻Devon Energy,股价一度涨超10%

华尔街见闻官方 浏览 2559

韩庚和妻子与友人聚餐,素颜皮肤黑眉毛好淡

八怪娱 浏览 1799

美称对“占领”委内瑞拉保留选择权

南方都市报 浏览 2164

《小城大事》大结局:李秋萍和杜涛的缘,在月海续写上且圆满

肆季娱乐 浏览 2645

男子驾车撞死一家三口获死缓 被害人家属递交抗诉申请

看看新闻Knews 浏览 8123

明年起5纳米以下先进制程至少涨3%?台积电回应:定价策略不以机会导向

澎湃新闻 浏览 3469
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1