关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12453人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

消息称新款苹果iPad Pro的OLED屏本周投入生产,设备4月发售

IT之家 浏览 12651

卡西欧推出《回到未来》40周年联名计算器手表,包装盒形似磁带

IT之家 浏览 1059

多视角直击战车驾驶训练

环球网资讯 浏览 19230

2025最狠理财,惊呆百万散户!

米筐投资 浏览 699

法国总统马克龙:成为盟友不意味着成为附庸

新京报 浏览 19015

你们猜谁会迷失在电动浪潮中?

汽车公社 浏览 862

恋情实锤!杨洋王楚然被拍到在酒店幽会四天三夜

盖饭娱乐官方号 浏览 18809

中国航母前出行动相对固定,战术意图是什么?

浏览 10986

何意?拉塞尔更推:如果我得不了分 那我能得到一个助攻

直播吧 浏览 15211

证监会:中止大连万达商管债券注册发行

网易号外 浏览 16121

活塞99-98险胜老鹰,杜伦21分11板,杰伦-约翰逊空砍29+13

懂球帝 浏览 268

中国可向欧盟《人工智能法案》借鉴什么?

澎湃新闻 浏览 12839

谷歌工程师硬核长篇预测,证实黄仁勋观点:AGI或在2029年出现,AI五年内通过人类测试

新智元 浏览 12569

歼-15新年度开飞超震撼

环球网资讯 浏览 12807

记者:巴黎引进维加交易取得进展,希望球员本周末完成体检

直播吧 浏览 15195

中年女人学会这3个技巧,帮你轻松掌握穿衣之道

静儿时尚达人 浏览 13398

人到中年要摆脱油腻感,冬季学会这些技巧,清爽减龄、优雅有气质

Yuki时尚酱 浏览 13410

美军上将:中美几乎同时发射航天器 可能不是巧合

环球时报新闻 浏览 13202

欧盟打脸撤回“燃禁令”9个月 各方表现堪比大片上演

第五冲程 浏览 12292

匹克被指要求拒绝降薪员工写检讨否则就停薪 当地回应

上游新闻 浏览 6326

5月开车撞利物浦球迷的司机承认故意撞人,预计12月15日宣判

懂球帝 浏览 393
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1