关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2445人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美军是怎么抓走马杜罗的

澎湃新闻 浏览 2652

于东来周鸿祎秦英林王宁张红超,2025河南企业家影响了中国?

BT财经 浏览 2953

"叶某斌在柬埔寨失联"详情披露:全程自主行动

贵州日报 浏览 20305

郭敬明太爱用风险艺人!吸毒的、偷税的、进监狱的,埋了好几部戏

萌神木木 浏览 2252

铜价历史新高推动“复合集流体”量产提速,易开盖龙头“英联股份”能否成为跨界黑马?

时代周报 浏览 2975

今年春夏最火的3个穿搭思路,普通人可以直接照搬吗?

黎贝卡的异想世界 浏览 189

郎酒发布年度十大图片:“拼”出郎酒的向上征程!

Daily每日财报 浏览 2579

天籁出新款,鸿蒙座舱+燃油车,合资新出路来了?

Nice好车 浏览 4305

美迪西子公司遭客户索赔1.59亿元,因新药项目安评报告交付滞后

红星资本局 浏览 4499

斯坦福突破:AI视觉模型实现测试时自我提升

科技行者 浏览 3438

周年庆专场|| 我的洗漱台上,真的不能没有它

黎贝卡的异想世界 浏览 3762

英伟达H100刚上天,谷歌Project Suncatcher也要将TPU送上天

机器之心Pro 浏览 3438

太二不做酸菜鱼了?告别酸菜鱼的太二想干啥?

江瀚视野 浏览 2612

智元机器人回应赴港上市传闻:不实消息

财联社 浏览 3741

张柏芝自曝被大儿子管很凶,教子有方连谢霆锋妈妈都称赞

扒虾侃娱 浏览 3603

围巾,女人气质的延伸

Yuki女人故事 浏览 3262

冬季穿搭越简单越好看!衣服不多买、搭配彩色围巾,真的耐看

静儿时尚达人 浏览 2494

他靠演反派爆火却对同事女儿一见钟情

张发林 浏览 4356

白宫附近国民警卫队员遭枪击:500名士兵将增派华盛顿

澎湃新闻 浏览 24485

官方:田玉达加盟辽宁铁人

懂球帝 浏览 2535

海哈金喜更新离婚后动态,状态不错

影视口碑榜 浏览 2953
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1