关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者2919人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

9.79万起 2026款比亚迪海狮05压迫感有多强?

网易汽车 浏览 1288

把玄戒O1念成“玄戒零一”,雷军认错:确实是讲错了

三言科技 浏览 3196

今年,北京要把奥林匹克塔打造成机器人餐厅!

北京商报 浏览 2968

英伟达联手诺基亚,能否复制“Wintel神话”

经济观察报 浏览 3975

这娱乐圈顶级渣男,居然翻身了

独立鱼 浏览 2979

尹锡悦看守所内收超6.5亿韩元代管金 系总统年薪2.5倍

鲁中晨报 浏览 8602

我们为什么需要节日穿搭?

时尚COSMO 浏览 2577

左手并购芬兰Dispelix,右手合作全球头部大厂瑞声科技加速XR布局

爱集微 浏览 3749

不愧是舒淇,好“生猛”的一部剧

时尚COSMO 浏览 3483

光模块双雄:高增长审美疲劳 高估值面临压力

21世纪经济报道 浏览 3958

“花式”揽储:有银行送鸡蛋吸引他行储户,多家中小银行上调存款利率……

中国基金报 浏览 3168

小米米家空调迎“智能诊断”功能,可联网远程识别设备异常状态

IT之家 浏览 4052

德约六王赛退赛向观众道歉遭网友怒喷来捞钱,球迷用成绩狠狠打脸

网球之家 浏览 4187

同样是悼念亡妻,把具俊晔和辛柏青放一起比较,差别怎么这么大!

娱乐圈笔娱君 浏览 4068

零跑销量相当于小米与理想之和——属于老实人的胜利

DearAuto 浏览 3860

佩德里:我们没参与抗议,开场也静默15秒是出于对同行的尊重

懂球帝 浏览 4294

介绍一个如果你用了,你就看不到这篇文章的产品

时尚COSMO 浏览 3437

黄仁勋放豪言:到2027年Blackwell和Rubin芯片至少创收1万亿美元

华尔街见闻官方 浏览 2122

德天空:迪朗维尔预计将在1月以租借形式离开多特

懂球帝 浏览 3168

特斯拉Model3/ModelY Standard正式发布

网易汽车 浏览 4186

官方:狼堡签下20岁日本中场盐贝健人;据悉转会费900万欧

懂球帝 浏览 3110
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1