关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者2424人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

恩里克:这场比赛对登贝莱有帮助;我们希望继续赢得更多奖杯

懂球帝 浏览 2935

特斯拉 FSD V14 Lite 将上线,老车主率先体验

三言科技 浏览 486

特朗普拉9国组成联盟要废除中国王牌 中方回应有深意

博览历史 浏览 8516

《堡垒之夜》放弃日本iOS,Epic硬刚苹果指控违法

环球网资讯 浏览 2918

鲁尼:阿森纳还没有赢得冠军,现在的这些庆祝有些过了

懂球帝 浏览 247

一加Ace 6T宣布12月3日发布!全球首发第五代骁龙8、超8000mAh大电池

快科技 浏览 3178

拒绝对涉案做出反省 内塔尼亚胡请求特赦遭强烈抗议

环球网资讯 浏览 3213

荣耀 MagicPad3 Pro 13.3 英寸平板上架官网

IT之家 浏览 4196

新年资金入市!超450亿公募资金到位,“万亿活水”在路上

券商中国 浏览 2625

“有病去医院,有事找法院”!王老吉和加多宝又“打起来了”

国际金融报 浏览 3751

马筱梅不再隐瞒!直播掀上衣展示孕肚

老塕是个手艺人 浏览 2910

不到24小时,央视2次点名于和伟,释放3大信号

查尔菲的笔记 浏览 3650

智元,想跟宇树争第一

定焦One 浏览 445

阿特金森帅位岌岌可危!上季当选年度最佳教练 曾获骑士老板力挺

罗说NBA 浏览 2934

秋冬发色天花板!5款显白温柔发色拿图给Tony,染完被夸到过年

Yuki女人故事 浏览 2374

对话黑芝麻高管:不烧钱造新芯,机器人平台发布前已经创收

车东西 浏览 3215

特朗普:美对委军事计划"泄密者"已被抓

扬子晚报 浏览 2540

64岁男演员春节在景区打工,暴瘦引担忧!

扬子晚报 浏览 1985

玩物造心 | 指尖上的治愈与反骨

时尚COSMO 浏览 3012

学生喊"包的" 语文老师抵制网络烂梗发起"语言保卫战"

封面新闻 浏览 31345

合纵连横更进一步,本赛季双子星同参赛无一冠军旁落!

网球之家 浏览 3434
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1