关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者1564人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

B股,最后的金矿?

36氪财经 浏览 1666

山东海阳老人扎堆领结婚证现场挤满人 有村庄包车去办

极目新闻 浏览 8768

坏了,看到剧本杀鼻祖了!

时尚COSMO 浏览 2075

傅聪团队新作:OnePiece!通用生成式推荐模型新范式

学术头条 浏览 2577

通航城市超260个 我国四大世界级机场群建设初具规模

央视财经 浏览 2839

腾势汽车12月销售18139辆 全年累计157134辆

网易汽车 浏览 1782

特朗普遇到"反关税"广告:再给加拿大加10%关税

红星新闻 浏览 8216

村支书逆袭:如何把集体的“包袱”变成个人的“聚宝盆”?

壹只灰鸽子 浏览 1460

许传智被查:在中纪委工作超30年 曾任宁夏纪委书记

界面新闻 浏览 7646

理财的,注意这两个风险!

米筐投资 浏览 2047

2025款零跑B10车主原音回放 再现调查现场

车质网 浏览 2557

你觉得美,可能是大脑在偷偷节能|光锥读论文

未来光锥 浏览 2187

一年暴涨1663%的牛股,玩砸了!

深蓝财经 浏览 1450

小米汽车又一重要专利公布!

电动知家 浏览 2347

巴基斯坦防长警告阿富汗:任何袭击都将招致50倍强度的回应

环球网资讯 浏览 2625

小米智能门锁 4 Pro 双摄版发布,预售价 2464.15 元

IT之家 浏览 2841

美国国会的监督机构对联邦住房金融管理局局长Pulte展开调查

华尔街见闻官方 浏览 2103

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者 浏览 2575

牛弹琴:180度转弯 和特朗普"你死我活"的狠人去了白宫

北京日报客户端 浏览 3561

Here we go!罗马诺:切尔西将签下谢周三17岁边后卫阿拉奥

懂球帝 浏览 1608

李在明:韩美贸易谈判僵持 美不能给韩带来灾难性后果

新京报 浏览 7404
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1