关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者3925人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

资深天使投资人肖庆平在西藏车祸离世 朋友圈内容披露

都市快报橙柿互动 浏览 4264

美财长批中国实施稀土出口管制是"对抗世界" 中方驳斥

环球网资讯 浏览 9824

天籁出新款,鸿蒙座舱+燃油车,合资新出路来了?

Nice好车 浏览 4794

媒体:日本出口护卫舰 不能和中国出口武器混为一谈

新民周刊 浏览 34109

美国政府进入史上"停摆"最长时间 特朗普表态

红星新闻 浏览 16629

AI时代,寻找超级创业者!徐汇区发布政策扶持一个人赛过一群人的“大牛”

上观新闻 浏览 2643

成都锦里古街树木倾倒砸伤游客 目击者:树木是空心的

上游新闻 浏览 10010

专访陶一伟:离开特斯拉,用300美元“开源手”挑战老东家

蓝鲸新闻 浏览 4071

高市早苗曾主张修改日本宪法 企图让日本重获宣战权

上游新闻 浏览 9114

为明年的 iPhone 设计的“A20”芯片价格可能会大幅上涨

威锋网 浏览 4029

AI的“相变”时刻:为什么我们现在的想象力都太贫乏了?

澎湃新闻 浏览 3042

26岁男子从杭州徒步回重庆过年 途经湖北获邀吃杀猪饭

极目新闻 浏览 6986

京沪高铁:一道复杂的算术题

锦缎研究院 浏览 3315

坦克300泰国版外观酷似“大G”!预计售价亲民,搭载2.4T柴油+9AT

小史谈车 浏览 2923

4.0T V8发动机 阿斯顿·马丁DB12 S官图发布

车质网 浏览 4288

李昀锐和孟子义恋情爆热搜,新剧直接无人在意了

陈意小可爱 浏览 4246

中国停购后 美国大豆真"爆仓"了人们四处逃散

澎湃新闻 浏览 12023

最好的相互救赎,我在《秋雪漫过的冬天》看见了

仙女事件簿 浏览 3035

英特尔与谷歌围绕至强CPU与定制IPU深化双方多年合作

IT之家 浏览 1522

与美主持人激烈辨论后被闭麦 万斯怒了

环球网资讯 浏览 8236

中国武器出售清单大曝光:有了这些你就是大爷

浏览 7857
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1