关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者3460人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

里程偏差98%时长偏差136% 女子坐网约车被扣费超10倍

新民晚报 浏览 9921

官方:瑞典裁判尼贝里将执法欧冠热刺vs多特

懂球帝 浏览 2550

奇瑞的2025年,一场教科书级的“协同战”

车评社Auto 浏览 2802

从 Meta 拆解、苹果眼镜爆料,看「不科幻但好用」的 AR 眼镜|硬哲学

爱范儿 浏览 3646

50+姐姐别乱穿!这4个秋天“显贵”的搭配思路,越老越有韵味

静儿时尚达人 浏览 5572

今年秋天最流行“卡其色穿搭”,谁穿谁好看!

LinkFashion 浏览 3737

英超本赛季平均每场持续100分36秒,但净比赛时间只有54.7%

懂球帝 浏览 3818

2025蔚来日在杭州成功举办

财经无忌 浏览 4400

每体:门德斯在巴塞罗那分别与亚马尔、德科进行了会谈

懂球帝 浏览 3880

比大衣更高级,比羽绒服更时髦?它才是今年冬天最火的外套!

LinkFashion 浏览 2667

躲在流量后面的人,被监管点名了

钛媒体APP 浏览 3069

伊朗拒绝出口其高浓缩铀库存

上观新闻 浏览 1974

拼多多,十年启示录

正和岛 浏览 3779

中东棋局骤变:美以\"师徒反目\"暗流汹涌

浏览 6665

经济观察报:深圳4-4卓尔涉5000万的假球,没赢是李铁不想输

懂球帝 浏览 3621

伊姐周日热推:电视剧《我的山与海》;电视剧《在你灿烂的季节》......

伊周潮流 浏览 1626

萧蔷原来这么有趣,看了浪姐后越来越喜欢她了

TVB的四小花 浏览 991

微软官方确认:Windows 11任务管理器出问题了!

快科技 浏览 3401

她们说这才是秋天最实用的单品!6种穿法都帮大家总结好了

黎贝卡的异想世界 浏览 3455

从短剧到漫剧,快手的内容大生意

定焦One 浏览 3443

曝郑爽新账号被封,15天前起的号

有范又有料 浏览 2553
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1