关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2583人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

葡萄牙宣布将于9月21日承认巴勒斯坦国

上观新闻 浏览 3469

女演员被前夫指责害死公公 本人称愿接受刑事立案调查

极目新闻 浏览 26086

“安我股保”假保险的真骗局 传销式推广暗藏陷阱

北京商报 浏览 2265

“锂王”炒股,赚了111万,赔掉2000亿

大猫财经Pro 浏览 1372

郑丽文就任国民党主席 曾喊"让台湾人自豪说是中国人"

环球时报新闻 浏览 13598

李婉华:但凡他跟我求婚,我都不会另嫁他人

艳儿说电影 浏览 2857

以色列政府批准加沙停火协议

新华社 浏览 2677

忘切号了?桑乔社媒发文鼓励自己后,又用自己账号留言

懂球帝 浏览 2998

这是陈妍希?新剧开播后居然长这样

Yuki女人故事 浏览 2057

2名以方被扣押人员失联 卡桑旅要求以军暂停空袭24小时

极目新闻 浏览 3314

真情侣就是好嗑,短剧界有多少“因戏生情”的cp?

仙女事件簿 浏览 2681

11场0球0助!利物浦1.3亿巨星不服被批:前面只是适应 别总盯着我

风过乡 浏览 2566

港媒:高市所谓“对话”表态纯属玩文字游戏

参考消息 浏览 7276

王菲没想到女儿窦靖童,会以头秃理由嫌弃亲爹

千言娱乐记 浏览 2640

181亿医疗信息化龙头掌舵人周炜,行贿一审被判后辞去董事长

雷达财经 浏览 2553

希瑞发布智能戒指 “全天候”健康生态野心初显

环球网资讯 浏览 2687

AI时代,重做ERP

钛媒体APP 浏览 2802

米体:罗马想冬窗租借齐尔克泽,若晋级欧冠会自动触发买断

懂球帝 浏览 2220

律所主任疑"借款"9亿失联 客户有上百人最年长者88岁

界面新闻 浏览 6107

南加大团队揭秘:让AI做数学题更聪明的"长度感知"训练法

科技行者 浏览 2663

维持看涨!摩根大通预计金价明年底均价升至5055美元

第一财经资讯 浏览 2775
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1