关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者2915人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

镜报:格拉利什对阵曼城需要回避,这让英超的公平性受到损害

懂球帝 浏览 4352

山东济宁一商家芒果礼盒藏试卷、课本 商家回应

极目新闻 浏览 5795

百日破十万!比亚迪海狮06改写爆款规则,海洋网的成长密码

大象新闻 浏览 3958

特朗普:俄乌应按当前战线划界停火、各自撤兵

新华社 浏览 4248

伊姐元旦热推:电视剧《人之初》;电视剧《轻年》......

伊周潮流 浏览 3251

谁说冬天不能穿裙子?照着搭美出新高度

LinkFashion 浏览 2698

媒体人:国足主帅应让中青年土帅担纲,说不定杀出一位霍去病

懂球帝 浏览 4889

贝弗利:安东尼曾因不想跟林书豪同队而没跟哈登和霍华德组三巨头

懂球帝 浏览 3932

暴涨的白银有色,白银竟是地名!股民懵逼

财通社 浏览 2994

拒15亿,Andrew Tulloch重返Meta,Thinking Machines Lab痛失联创

机器之心Pro 浏览 4283

阿里前主席张勇,花5354万港元买了套香港半山豪宅

财通社 浏览 4047

拜登似是怕特朗普与中国“合作”?

浏览 27265

一个时代审美的终结:美人何晴,温柔亦有筋骨

仙女事件簿 浏览 3418

美国43岁母亲在学校舞会拐走女儿14岁男友 还和他生子

潇湘晨报 浏览 9680

今年最好的大银幕电影,没有之一

电影最TOP 浏览 3257

大陆制裁3家涉对台军售美企 国台办回应

界面新闻 浏览 4381

郑晓龙监制!杨紫主演耗资3.5亿的史诗级传奇剧

娱乐圈笔娱君 浏览 2343

娃哈哈精密机械公司启动解散清算,员工称已收到终止劳动合同通知

红星资本局 浏览 2483

福建女商人林惠荣提国赔申请获立案 曾服刑7年获无罪

澎湃新闻 浏览 7646

Stellantis,“分”或许比“合”好

禾颜阅车 浏览 4048

AI杀入美股,DeepSeek又是第一!港大90后开源,AI股神人人都能造

新智元 浏览 4023
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1