关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2931人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

记者:米兰正在和布莱顿谈判,尝试纯租借引进科波拉

懂球帝 浏览 3159

拉比奥:我在米兰很好地融入了球队,我和迈尼昂的关系很亲近

懂球帝 浏览 4242

委内瑞拉防长:特朗普封锁加勒比海域是“妄想”

每日经济新闻 浏览 3409

冬天的毛衣,越“大”越好看!

LinkFashion 浏览 2930

不一定能掀桌男主,但一定是个好演员!

伊周潮流 浏览 2980

新华鲜报|引导AI发展!网络安全法完成修改

新华社 浏览 4053

倾家荡产120万上星光大道,她如今怎样了

青橘罐头 浏览 4310

男子精神分裂砍死同学的弟弟 第二次精神鉴定结果变了

红星新闻 浏览 8292

2025年净利至少增超78%!减肥药价格战凶猛,甘李药业:相关产品未上市,价格策略待定

时代周报 浏览 2992

被张坤抛弃,又一巨头跌懵了!

财经锐眼 浏览 2899

广汽功臣肖勇让位,埃安、杨龙能否相互成全?

车友观察 浏览 4860

Snap联手多所高校突破:静态模型实现动态化动画生成

科技行者 浏览 3178

熊园:“十五五”大方向已定,如何跟踪?

首席经济学家论坛 浏览 4140

阿维塔科技:五载深耕中的坚守与进化

网易汽车 浏览 1100

何超莲秀恩爱,晒与窦骁看表演吃日料视频

笑一个吧 浏览 2137

机器人,又杀出了第一股

投资家 浏览 3537

埃迪-豪:弗兰克的球队无球时很有侵略性;英联杯对我们很重要

懂球帝 浏览 4027

死了么APP征集新中文名

扬子晚报 浏览 3107

腾讯回应元宝崩了

第一财经资讯 浏览 2858

富勒姆怒斥曼联第一球不应存在,炮轰天大误判!英超官方解释原因

罗米的曼联博客 浏览 2905

或于2026年推出 比亚迪大汉谍照曝光

车质网 浏览 3433
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1