关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2928人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

离婚真相曝光不到2月,“一言不发”的唐嫣,给娱乐圈上了一课

金风说 浏览 3020

张家界荒野求生热门选手退赛 连下一周雨致腿部冻伤

极目新闻 浏览 15749

泽连斯基向特朗普展示俄境内潜在打击目标地图

环球网资讯 浏览 4154

韩安冉自曝新男友为她花了十几万,两人交往仅一个多月

扒虾侃娱 浏览 842

今年冬天最时髦保暖的4组搭配,照着穿美出新高度!

LinkFashion 浏览 2948

尼克斯112-100力克湖人豪取6连胜,东契奇30分,詹姆斯22分

懂球帝 浏览 2872

明年起5纳米以下先进制程至少涨3%?台积电回应:定价策略不以机会导向

澎湃新闻 浏览 3962

四维图新孟庆昕:全面AI转型,2027年或可盈亏平衡

网易汽车 浏览 4141

阿Sa闪婚原因曝光,曾冻卵计划40多岁生小孩

萌神木木 浏览 1115

E句话|李雨桐又来锤薛之谦了?

仙女事件簿 浏览 2489

德约雅典冲击生涯第101冠,为什么突然成了网圈的一件大事?

网球之家 浏览 3789

深蓝汽车房楠:四载深耕、技术破局、全球化竞争

网易汽车 浏览 1105

或叫欧拉5?欧拉全新SUV要来了!

车叫兽 浏览 4954

ChatGPT跟进阿福,AI健康按下快进键

海克财经 浏览 3082

卡塔尔:加沙可能陷入“无战无和”局面

国际在线 浏览 3991

石药集团185亿美元合作背后

YOUNG财经 浏览 2932

具身智能开启汽车产业万亿新赛道

车质网 浏览 4030

第138届广交会10月15日开幕,约3600家企业首亮相,首设智慧医疗专区

红星资本局 浏览 4270

质疑公牛集团广告语存误导被索赔420万 涉事公司反诉

澎湃新闻 浏览 21194

2025公益热度排名:肖战压过王一博登顶公益榜

未曾青梅 浏览 3137

60+女性穿搭“高级感”秘诀:4个日常技巧,轻松美出优雅气质

静儿时尚达人 浏览 3109
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1