关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者3461人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

理想为什么不做轿车,有了解释……

道哥说车 浏览 183

女子孕检低风险却生下唐氏儿 险企拒赔:只赔"标准型"

鲁中晨报 浏览 9222

律所主任疑"借款"9亿失联 客户有上百人最年长者88岁

界面新闻 浏览 7042

马赛主席在从曼联签下梅森·格林伍德前询问了他的母亲

绿茵情报局 浏览 2443

男子收1300万元拆迁款后被控敲诈勒索获刑 终审无罪

极目新闻 浏览 7591

刘强东朋友圈疑曝光,自嘲在老婆面前失去没自信

柠檬有娱乐 浏览 3465

女孩性侵的案子你都敢盖?!

电影最TOP 浏览 3036

商务部回应审查Meta收购Manus:须符合中国法律法规

财联社 浏览 13315

周年庆专场|| 我的洗漱台上,真的不能没有它

黎贝卡的异想世界 浏览 3761

米体:普利希奇将接受医疗检查,阿莱格里和米兰对美国队不满

懂球帝 浏览 3742

清华Nature发布惊人结论:AI写论文3倍速,但科学边界被锁死

新智元 浏览 2623

大电池增程成风,车企在堆料自嗨?

帮宁工作室 浏览 3251

马克龙:首批法国士兵已抵达格陵兰岛

界面新闻 浏览 2552

消失1年,王子异自称得了抑郁症

失宠的小野猪 浏览 2816

姚晨:自然予我

时尚COSMO 浏览 5599

理想「断腕」:关店100家,李想手里还剩什么牌?

电车通 浏览 2421

皮衣+裙子、大衣+运动鞋,这4组搭配照着穿就很时髦!

LinkFashion 浏览 2429

宋伊人新剧被传谣,是要逼人“剖腹取粉”吗?

麻辣婊 浏览 3135

冬天也想穿裙子!附不同温度的穿搭公式

黎贝卡的异想世界 浏览 3261

规模扩大、体验升级 2025“我与地坛”北京书市亮点纷呈

中国商报 浏览 4431

官方:利物浦签下15岁曼城青训门将阿尔菲-杜利

懂球帝 浏览 3898
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1