关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者798人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

上海市监局回应"凉皮里加黄瓜丝"被罚:重点不是黄瓜丝

上游新闻 浏览 90285

白电三巨头最新财报出炉!小米高管:友商越急,我们越稳!

互联网那些事 浏览 728

台军“云豹”装甲车现身高雄街头 深夜机动行军

环球网资讯 浏览 19420

寒武纪去年预亏最高收窄至7.56亿元,营收略有降低

澎湃新闻 浏览 12774

美财长公然挑拨中阿关系:米莱承诺"让中国退出阿根廷"

环球网资讯 浏览 3751

54岁闫妮和27岁女儿同框,母女性格相似如姐妹

小咪侃娱圈 浏览 877

MIT最新发现:这十年,算法进步被高估了

机器之心Pro 浏览 84

黎以停火协议生效一年 以军称打死370余名武装人员

国际在线 浏览 259

万亿美元豪赌,Open AI创始人:泡沫化的故事很诱人

21世纪经济报道 浏览 955

媒体:中方已经明确不出席“乌克兰和平峰会” 并给出理由

新民周刊 浏览 67810

乌国安局首次承认袭击克里米亚大桥:准备了几个月

环球网资讯 浏览 14358

特朗普:若俄乌冲突无法解决 可能会供乌“战斧”

界面新闻 浏览 1023

以政府:以色列被扣押人员10月11日起获释

界面新闻 浏览 1052

中年男子自拍图火出圈 凭借"三副面孔"成新晋网红

国是直通车 浏览 74272

奥西利奥:国米的目标是保持领先,我们不像有的球队那样隐藏

懂球帝 浏览 12877

王健林限高已解除,虚惊一场?

财视传播 浏览 1503

前华为“天才少年”创业公司大火!短短数月已完成3轮融资

证券时报 浏览 14257

安理会会议将召开 美再拖延发放俄外长参会签证

海外网 浏览 18902

随着西班牙3-0 世界杯16强定14席 中国队对手确定 亚洲仅韩国出局

侃球熊弟 浏览 843

住户睡觉没拔充电器家被烧 一两分钟火苗蹿到天花板

极目新闻 浏览 6418

邮报:利物浦对沃德-普劳斯持观望态度,南安普顿要价5000万镑

直播吧 浏览 16680
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1