关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者3958人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

梓渝:慢下来,也很好

时尚COSMO 浏览 10

夫妇盯上2‰自然损耗规则 上千吨粮食遭盗卖价值500万

CCTV今日说法 浏览 9264

"秒回师"火了:收到消息几秒回复 有人兼职月入过万

上观新闻 浏览 8889

"斩首警告"后高市早苗骑虎难下 日本网民却集体破防

北回归线 浏览 32440

福建舰已完成多次海试 进度远超预期

央视新闻客户端 浏览 3579

BBA大促混战,谁是真性价比之王?

百姓评车 浏览 3316

“咨询行业的黄埔军校”,又被罚了

财通社 浏览 3088

姆巴佩已完成职业生涯400球,为最年轻达成此成就球员

懂球帝 浏览 3508

50、60岁的女人就要这么穿!自然老去,不扮嫩反而更美了

静儿时尚达人 浏览 4224

今年流行“洋葱式”穿法,这样穿高级又好看!

LinkFashion 浏览 3410

这几件衣服太火了,谁穿谁好看

LinkFashion 浏览 3729

ESPN:因内马尔的身体状况和高额薪资,桑托斯不急于和他续约

懂球帝 浏览 4237

24架F-35A隐身战机集结西太平洋

极目新闻 浏览 4357

2026年央视春晚彩排开始!沈腾马丽回归,但呼声最高的是他们

娱乐圈笔娱君 浏览 3217

伊朗指责美以策划动乱 哈梅内伊呼吁伊朗人民保持团结

环球网资讯 浏览 3139

外交部回应"APEC会议期间中美元首是否举行会晤"

界面新闻 浏览 8524

美国动武后 外国领导人首次到访委内瑞拉

上观新闻 浏览 1027

仅需加92号汽油 小鹏X9增程版的谍照曝光

太平洋汽车 浏览 4349

孙红雷夫妇现身三里屯被偶遇,穿着时尚不服老,与妻子同行显娇小

扒虾侃娱 浏览 3268

邓莎没想到,丈夫不管的儿子成了她的“救赎”

贵州小娟 浏览 4077

坦克400预售:新增激光雷达,支持高阶辅助驾驶

IT之家 浏览 4193
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1