关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者2913人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

被问与特朗普关系是否已"破裂" 斯塔默回应

环球网资讯 浏览 59973

无止境,梅西常规赛28场贡献29球16助攻

懂球帝 浏览 4123

冬天穿衣要避免老气横秋!这些穿搭简单不过时,适合普通人

静儿时尚达人 浏览 2418

窦泽成下赛季重返美巡赛

体坛周报 浏览 4200

今年春天最流行的4件卫衣,照着穿就很好看

LinkFashion 浏览 2459

从嬉皮士到硅谷教父,他写了一本关于“维修”的书

DeepTech深科技 浏览 1306

稀土是啥?为啥是中国王牌?

混知财经 浏览 3441

特斯拉第三季度财报亮点:交付创新高,能源业务强势领跑

不看车bukanche 浏览 3959

普京官邸遭91架乌无人机袭击 特朗普:我很生气

每日经济新闻 浏览 3247

重新定义边界,吉利全域安全进入 2.0 时代

网易汽车 浏览 3458

特朗普称庞大舰队驶向伊朗 已超委内瑞拉

财联社 浏览 2923

罗斯、威少、沃尔、莫兰特,四大野兽控卫谁的身体天赋最逆天?

仰卧撑FTUer 浏览 2249

专家:自民党与公明党谈崩了 给高市早苗当头一记闷棍

澎湃新闻 浏览 4684

2.8亿债务逾期,良品铺子实控人收执行通知,公司去年预亏超1.2亿

红星资本局 浏览 2913

米兰未来3-0斯坎佐罗夏特,伊布儿子为米兰未来首开记录

懂球帝 浏览 4856

NBA战报:活塞122-117步行者取NBA12连胜,西亚卡姆24分

懂球帝 浏览 3706

强化AI编程能力迎战谷歌!OpenAI发布GPT-5.2-Codex,软件工程和网安一把抓

华尔街见闻官方 浏览 3490

泽连斯基:前线局势愈发艰难

界面新闻 浏览 3453

冬季穿衣千万别花枝招展,这些基础穿搭,越简单才越高级耐看

静儿时尚达人 浏览 3073

不是第一次了,穆斯卡特两年前曾率队在天皇杯输给町田泽维亚

懂球帝 浏览 4058

三代蔚来ES8最让车主感到遗憾的事情,就是砍掉老款的75kwh电池包

大志聊车 浏览 3045
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1