关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2657人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

永辉超市减持红旗连锁,套现上亿元

红星资本局 浏览 2471

HWG!罗马诺:维拉1200万欧签下梅斯16岁前锋马乔已达成协议

懂球帝 浏览 2659

50+姐姐冬季要会“叠穿”,掌握这些技巧,保暖不臃肿显高级

静儿时尚达人 浏览 2758

长城魏牌9年8换CEO,哈弗总经理赵永坡接任冯复之

红星资本局 浏览 2968

香波特:讨厌在尼克斯&骑士打3D 到了国王才感觉解放

直播吧 浏览 4332

郑丽文当选提三大原则 称绝不让台湾成为"麻烦制造者"

海峡导报社 浏览 7002

Shams:因球场打架,阿尔瓦拉多被禁赛2场&马威被禁赛1场

懂球帝 浏览 2860

古利特:皇马3个前锋无球时做的太少,贝林厄姆成为受害者

懂球帝 浏览 3062

陈道明被王家卫说他是阴阳同体的极品

包饺子ai剪辑 浏览 3430

VLOG:直升机博览会初探

新华社 浏览 3705

研究发现:若告知消费者广告是由AI生成的,点击率会减少31%

IT之家 浏览 3067

科氪 | 荣耀MagicOS 10重构智能体验:AI成伙伴,全品牌互联破冰

36氪 浏览 3698

埃泰克IPO:智能座舱业务驱动营收创新高,客户资源稳步扩展

时代周报 浏览 2551

陈晓最新露面瘦脱相!新剧要和陈妍希对打,女方离婚后状态更好

萌神木木 浏览 3190

澳网最具看点女单比赛来了!莱巴金娜谈迎战斯瓦泰克:保持进攻

网球之家 浏览 2428

23岁美国女孩寻中国亲生父母 志愿者找到当年的孤儿院

封面新闻 浏览 12943

高盛顶级交易员:美股临近CTA卖盘触发位,市场企稳看政府开门

华尔街见闻官方 浏览 3420

这一夜,龚俊不再吃香,被46岁的男配惊艳

温柔娱公子 浏览 3532

特朗普:美对贩毒集团陆地打击行动可覆盖墨西哥等地区

上观新闻 浏览 2510

又有8个大V账号被封!雪球一日连发“两弹”,“游资战法”等遭重点打击

第一财经资讯 浏览 2617

林诗栋嘟嘴新年首胜!赛后直言想多拿冠军 左腿满是肌贴疑存伤病

颜小白的篮球梦 浏览 2707
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1