(相关资料图)
预训练大语言模型(LLM)在特定任务上的性能不断提高,随之而来的是,假如 prompt 指令得当,其可以更好的泛化到更多任务,很多人将这一现象归功于训练数据和参数的增多,然而最近的趋势表明,研究者更多的集中在更小的模型上,不过这些模型是在更多数据上训练而成,因而在推理时更容易使用。 举例来说,参数量为 7B 的 LLaMA 在 1T token 上训练完成,尽管平均性能略低于 GPT-3,但参数量是后者的 1/25。不仅如此,当前的压缩技术还能将这些模型进一步压缩,在保持性能的同时还能大幅减少内存需求。通过这样的改进,性能良好的模型可以在终端用户设备(如笔记本)上进行部署。 然而,这又面临另一个挑战,即想要将这些模型压缩到足够小的尺寸以适应这些设备,怎样才能兼顾生成质量。研究表明,尽管压缩后的模型生成的答案准确率还可以,但现有的 3-4 位量化技术仍然会让准确性降低。由于 LLM 生成是顺序进行的,依赖于先前生成的 token,小的相对误差不断累积并导致严重的输出损坏。为了确保可靠的质量,关键是设计出低位宽的量化方法,与 16 位模型相比不会降低预测性能。 然而,将每个参数量化到 3-4 位通常会导致中等程度、甚至是高等程度的准确率损失,特别是那些非常适合边缘部署的 1-10B 参数范围内的较小模型。 为了解决准确性问题,来自华盛顿大学、苏黎世联邦理工学院等机构的研究者提出了一种新的压缩格式和量化技术 SpQR(Sparse-Quantized Representation,稀疏 - 量化表征),首次实现了 LLM 跨模型尺度的近无损压缩,同时达到了与以前方法相似的压缩水平。 SpQR 通过识别和隔离异常权重来工作,这些异常权重会导致特别大的量化误差,研究者将它们以更高的精度存储,同时将所有其他权重压缩到 3-4 位,在 LLaMA 和 Falcon LLMs 中实现了不到 1% 的困惑度相对准确率损失。从而可以在单个 24GB 的消费级 GPU 上运行 33B 参数的 LLM,而不会有任何性能下降,同时还能提高 15% 的速度。 SpQR 算法高效,既可以将权重编码为其他格式,也可以在运行时进行有效地解码。具体来说,该研究为 SpQR 提供了一种高效的 GPU 推理算法,可以比 16 位基线模型更快地进行推理,同时实现了超过 4 倍的内存压缩收益。 该研究提出一种混合稀疏量化的新格式 —— 稀疏量化表征(SpQR),可以将精确预训练的 LLM 压缩到每个参数 3-4 位,同时保持近乎无损。 具体来说,该研究将整个过程分为两步。第一步是异常值检测:该研究首先孤立了异常值权重,并证明其量化会导致高误差:异常值权重保持高精度,而其他权重以低精度(例如 3 位的格式)存储。然后,该研究以非常小的组大小实现分组量化(grouped quantization)的变体,并表明量化尺度本身可以被量化为 3 位表征。 SpQR 极大地减少了 LLM 的内存占用,而不会降低准确性,同时与 16 位推理相比,LLM 的生成速度快了 20%-30%。 此外,该研究发现,权重矩阵中敏感权重的位置不是随机的,而是具有特定的结构。为了在量化过程中突出显示其结构,该研究计算了每个权重的敏感度,并为 LLaMA-65B 模型可视化这些权重敏感度。下图 2 描绘了 LLaMA-65B 最后一个自注意力层的输出投影。 该研究对量化过程进行了两个改变:一个用于捕捉小的敏感权重组,另一个用于捕捉单个的异常值。下图 3 为 SpQR 的总体架构: 下表为 SpQR 量化算法,左边的代码片段描述了整个过程,右边的代码片段包含了二级量化和查找异常值的子程序: 该研究将 SpQR 与其他两种量化方案进行了比较:GPTQ、RTN(rounding-to-nearest),并用两个指标来评估量化模型的性能。首先是困惑度的测量,所用数据集包括 WikiText2、 Penn Treebank 以及 C4;其次是在五个任务上的零样本准确率:WinoGrande、PiQA、HellaSwag、ARC-easy、ARC-challenge。 主要结果。图 1 结果显示,在相似的模型大小下,SpQR 的性能明显优于 GPTQ(以及相应的 RTN),特别是在较小的模型上。这种改进得益于 SpQR 实现了更多的压缩,同时也减少了损失退化。 表 1、表 2 结果显示,对于 4 位量化,与 GPTQ 相比,SpQR 相对于 16 位基线的误差减半。 表 3 报告了 LLaMA-65B 模型在不同数据集上的困惑度结果。 最后,该研究评估了 SpQR 推理速度。该研究将专门设计的稀疏矩阵乘法算法与 PyTorch(cuSPARSE)中实现的算法进行了比较,结果如表 4 所示。可以看到,尽管 PyTorch 中的标准稀疏矩阵乘法并没有比 16 位推理更快,但本文专门设计的稀疏矩阵乘法算法可以提高约 20-30% 的速度。 ©THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@
推荐内容
-
将330亿参数大模型「塞进」单个消费级GPU,加速15%、性能不减 今日关注
-
蔚来将推出售价高达7000元的手机
-
味精加热后对健康有害吗?
-
全球速读:世界首台换运架一体机“太行号”投用 4小时换梁效率提升3倍
-
【全球新视野】清炖羊肉如何祛异味?
-
2023纵览高招会 | 西交利物浦大学:本科毕业生可获中英双学位 今年计划在河北招生135人
-
世界今头条!中国工程院院士:职业健康人才供给不足
-
花生油沉淀下来的油渣怎么使用?_天天动态
-
报道:独具匠心的礼物选择:好莱坞明星装扮创意,送给50岁男性的完美生日礼物
-
全球资讯:用Stata进行量化分析_关于用Stata进行量化分析介绍
-
比小米13更小巧,骁龙8 Gen2+直屏,心动了吗?-世界实时
-
世界实时:迎端午 居民群众“粽”享美好生活
-
江西南昌深化政校企合作助推新能源产业发展 焦点滚动
-
【世界新要闻】山东天气预报一周天气预报 山东天气预报查询一周15天
-
再熬3天 龙,鸡,牛3生肖横财喜事追着跑,钱财多的花不完!|资讯
-
美国得州电网管理部门ERCOT警告称
-
环球热议:送男生新年礼物推荐:DIY“亚当斯家族”表弟Itt万圣节装饰,让TA的房间充满怪异独特的气息
-
玛多县乡镇干部业务能力提升培训班圆满结束
-
爱尔眼科高考后“扎堆摘镜热潮”点燃整个夏天
-
伤友模特、学生模特同登T台“秀”出生命的精彩
-
天天速讯:清风头条丨衡阳南岳区:紧盯假日“节点”,靶向纠治“四风”顽疾
-
智通ADR统计 | 6月23日|环球观点
-
新疆兵团:曲子戏百年传唱 老调新唱展新魅力 天天新消息
-
二二四团:桃子丰收采摘忙 树梢缀满“致富果”
-
第二十届新疆社会科学界学术年会开幕 全球观点
-
汇率7.19,熊归!沪指狂泻1.31%,击穿3200 热消息
-
女篮新领袖出炉!李梦上官方海报C位,打WNBA成神射,被普遍认可
-
连云港东海县星级养老院名单
-
最适合“当老婆”的3大星座女:心软又貌美,娶到是福气!
-
安徽合肥:守护舌尖上的安全_天天简讯
-
热点评!再添千人起诉!美军这个丑闻越闹越大
-
欧盟呼吁科索沃北部地区重新举行选举-环球速看
-
当前最新:教师节,给老师的十二种礼物,你喜欢哪一种礼物?教师节,给老师的十二种礼物,你喜欢哪一种?
-
“驾游安徽”谋划焕新升级 业内代表建言献策_当前视点
-
中央驻皖企业:助力中考 为梦护航_当前报道
-
2023全球数字经济大会首设主宾国 提高国际社会参与度-当前视点
-
渝昆高铁重庆至宜宾段最长隧道贯通-全球即时
-
冠军稳了吗?保罗库里终联手,勇士或将帮助保罗实现冠军梦|环球视讯
-
正式归队!男篮在青岛开启2周封闭集结,12人名单竞争白热化
-
张良点金:1936做空暴跌抵达1920!后市反弹仍空! 焦点热文
-
“中国鞋都·莆田”鞋业供应链集采节开幕
-
天天快看点丨福建进入“龙舟水”季 海事部门守牢端午水上“安全线”
-
台胞在福州过端午:浓浓粽香情 两岸共同传承同根文化-今日讯
-
“守艺”同根文脉 共证两岸文艺繁荣
-
盐池湾人物群像:守望祁连34载,他说“唯有热爱,才能坚持” 全球观察
-
环球实时:“铁路工程师摇篮”兰州博文科技学院:为交通强国育才
-
欧盟正式通过对俄第11轮制裁 全球今亮点
-
网坛:费德勒在哈雷公开赛上谈史上最佳的问题,还是让人有点失望
-
2023暑期档总票房破20亿
-
年内多只基金产品清盘,管理规模增速缓慢,“老十家”大成基金掉队
-
胜科纳米:逾六成采购额依赖第一大供应商,实控人不惜举债近亿保控制权 |IPO观察 天天热闻
-
皇马收回成命,曝1.2亿1签!悲喜夜,梅西被上课,西甲豪门酿易主|天天动态
-
没有羞耻心!落后2球,国足球员竟然在全球直播镜头下大笑_世界简讯
-
银川市第七届农业嘉年华活动举行 热消息
-
美的加速跨界新能源!储能会是“第二增长曲线”吗? 当前热点
-
每日短讯:《梦中的那片海》从三对夫妻的结局,看人生百态
-
洪都拉斯发生监狱暴乱 至少41人死亡
-
环球资讯:喝醉了怎么办才能解酒?
-
白色手机消失了?安啦,数量不多,但还是有的
-
煤气钢瓶莫卧倒!关干煤气罐这些安全知识要了解 世界聚焦
-
不要对李凯尔,抱有太高期望 焦点速看
-
海口这处街区将打造互动灯光景观 世界新消息
-
观察:北大光华与腾讯云共建AI通识课:加速大模型落地产业场景创新
-
全球看热讯:连演三天!30余场国际音乐演出,点亮梧桐树下文艺夜生活
-
房价大跌,韩国全租房模式受拷问
-
“300个月大的宝宝,都在偷偷报名小饭桌”
-
【学思想 强党性 重实践 建新功】省林草局:助企暖企春风行动落实落细 世界消息
-
世界快讯:云南曲靖:经开公安“六个一”措施夯实平安建设基础,筑牢校园安全屏障
-
看热讯:亿都(国际控股)(00259)6月21日回购23.6万股
-
全球数字经济大会7月4日在京开幕 新加坡将担任主宾国
-
淘天、抖音争夺“微信流量池”?丨南财号联播 全球观速讯
-
天天精选!重大利好 澳洲内政部宣布191签证转191永居更容易
-
湖南高考评卷已近尾声 6月25日公布高考成绩
-
好消息!渝昆高铁华福特大桥建设进度条更新了 焦点速递
-
小小足球 大大梦想 铜陵市第八届校园足球联赛正式开赛|天天视讯
-
头条焦点:校地合作共建共享 青春助力乡村振兴 徽商职业学院开展志愿实践活动
-
遇真爱秒怂不敢表白的星座_全球即时
-
当前短讯!中国最大海上油田——渤海油田累计生产原油突破5亿吨
-
中企渤海租赁旗下公司拟向空客采购20架飞机
-
每日看点!南宁友谊白沙路口到澳门街怎么坐公交车去
-
创维数字跌停 西部证券月内维持买入评级
-
中大力德跌3.69% 机构净卖出1.79亿元
-
海光信息跌9.02% 中信证券在其高点喊买入
-
世界热文:向华强说以后珠宝都给郭碧婷 就是人生赢家吧
-
江西南康:“旱改水”改出良田沃土
-
【天天热闻】龙虎山风景名胜区税务局:浓浓端午情 慰问暖人心
-
长春二道区安全生产百日攻坚指挥部开展道路交通安全专项调研
-
全球速讯:渤海银行长春分行开展系列金融知识宣传活动
-
每日关注!四川省“青年红色筑梦之旅”活动启动
-
启科量子再登“中国潜在独角兽企业”榜单
-
朱一龙:是冒险,就来吧!丨人物
-
速讯:内蒙古基本医保参保率持续稳定在95%左右
-
国网科右中旗供电公司狠抓供电服务质量 突出问题整治
-
湖南发布今年首个暴雨红色预警
-
中央气象台:南方地区有大范围持续性强降水过程 华北黄淮等地将出现持续性高温 天天日报
-
中国科学家量子领域新突破!可实现城际实时“量子通话”-快播报
-
并购重组 新疆天然气加工三聚氰胺基地崛起
-
结婚微信通知范本 结婚微信通知范本女方
-
家里为什么不能种板栗树 家里能不能种板栗树
-
家里为什么不能种芭蕉(为什么院子里不能种芭蕉)
-
哪些植物不能放鸡蛋壳 鸡蛋壳可以直接放花盆里吗-环球即时看
-
别有洞天可以形容什么(别有洞天的什么)-每日速递
-
置信区间怎么算(统计学中置信区间怎么算)
-
焦点速读:绚辉龙弱什么属性(绚辉龙 弱点)
-
欲打造“千亿级人参产业” 2023中国吉林人参健康论坛在沪召开
-
【当前独家】微软誓要收购动视暴雪 索尼急了!PS6主机将封杀之
-
全球观天下!各地出台政策加快市场复苏 创新思路拓展消费空间
-
韩星推荐辱华漫画,多个官方账号点名痛批,本人还在晒度假照挑衅
-
UFC新鬼量级全员出动,宋亚东能否脱颖而出!_全球快讯
-
战场超低空突袭,简直就是玩命,刚下战机,飞行员就瘫倒在停机坪|全球微头条
-
每日资讯:今年四川省将新建56个平安渡运项目 撤销渡口60个以上—中国新闻网·四川新闻
-
世界微头条丨离婚两年后,赵丽颖和冯绍峰处境千差万别,她活成了真正的大女主
-
今日超20家上市公司披露股东减持计划 公牛集团实控人拟减持不超2%股份
-
最终幻想16二段跳怎么操作 焦点短讯
-
归化国脚阿兰有望重返中超,加盟青岛海牛, 薪资成最大障碍
-
骆驼换“夏装” 牧民采绒忙
-
世界看热讯:昆明西坝南社区:粽叶飘香迎端午 幸福和谐邻里情
-
中量大实施双导师制 创新人才培养体系 全球消息
-
数说国之重器“海洋石油201” 世界时快讯
-
当前速递!如果美国将土耳其从北约组织中剔除,谁会是最大受益者?
-
基金分红:红塔红土瑞景纯债基金6月29日分红
-
焦点观察:广东高考放榜在即志愿要怎么填报 权威专家来支招
-
时装周举办也有些时日,终于看到“双姐妹”模特同框,和她的走秀
-
打造自己的特别礼物——轻松DIY照片雪球装饰品
-
今日热讯:一季度信用卡卡量“缩水”!人均持有量同比下降1.75%,POS机减少超245万台
-
销售额21万元 文昌消费助农大集市走进公坡镇水北村 全球观速讯
-
发生什么事?华为Mate 50 RS成热议焦点
-
《2023端午奇妙游》开播 舞蹈《定风波》满满四川元素 环球消息
-
广东省科技厅开展科技助力乡村荔枝保鲜增收行动
-
天天日报丨NBA又一巨星退役!脚踏两只船,为他生5娃处成闺蜜,37岁人生赢家
-
年轻人热衷刮彩票,“这就是一种娱乐”_世界报道
-
2023年仙琚制药分析报告 坚持原料药、制剂一体化的经营模式_每日看点
-
天玑曲面屏之王!vivo X90s上架:首批搭载天玑9200+
-
家里养猫的禁忌有哪些?养猫的5个“禁忌”,不要随便触犯,会伤害到猫
-
公开透明地展示施工过程 西安远洋未央华府举办工地开放日 环球观热点
-
三盘苦战过关!小将商竣程险胜前世界第7,跻身八强排名创新高 每日视点
-
深圳今年首个青年交流团赴港 开启深港青年同心筑梦之旅
-
摆上饺子宴 祝福中考生 全球快看
-
3-2!国乒单打大获全胜,17岁新星逆转韩国主力,连赢三场传喜讯
-
2023年06月22日06时40分土耳其里拉/人民币汇率最新报价
-
每日消息!2023年06月22日06时40分英镑/人民币汇率最新报价
-
债基“牛回头”,调整不改长期趋势 播报
-
最新资讯:光大证券:煤炭未来增产空间几何 扩产的变数在哪里?
-
轨道上的列车跑出天津制造“加速度”|环球观天下
-
焦点关注:一问“医”答丨高温热浪又双叒叕来了!如何防护?
-
要闻速递:油麦菜有什么营养(热量表哪家比较好?)
-
楼去掉木字旁读什么(把“楼”的木字旁换成金字旁是什么字)
-
四川火锅香油碟怎么调 今日热闻
-
当前速看:2023端午档新片总票房破4亿
-
巴菲特再捐46亿美元股票 承诺99%以上的遗产将用于慈善|环球报道
-
比毫米小的单位是什么
-
全球热文:宝馨智慧能源与郑州航空港区兴港电力达成战略合作
-
环球快资讯:就业新风口!这类人才紧缺→
-
【天天聚看点】怎么减少皮肤油光?
-
湖人官宣季前赛赛程!两战勇士成焦点 詹姆斯杜兰特有望上演对决_环球微头条
-
【全球独家】美记预测奇才将留下保罗!湖人补强需靠交易:5意中人谁驰援詹眉?
-
【世界聚看点】山外山:一次性使用血液灌流器取得医疗器械注册证
-
快讯|因违规从事未批准的业务活动等 中国银行上海人民币交易业务总部被罚没近697万元 世界新要闻
-
鲁媒:刘洋“领跑”国足左后卫竞争,泰山队5名国脚23日归队_全球时快讯
-
2023日照市岚山区教体系统招聘教师21人报名入口 全球播资讯
-
2023上半年新疆喀什地区疏勒县第二批中小学和幼儿园教师资格认定补充公告 环球微动态
-
2023苏州银行总行运营管理部招聘1人公告|世界今日讯
-
乡村龙舟赛 好看接地气
-
农村养殖中草药(中药养殖项目有几种)
-
天天百事通!中国十大名牌猪饲料 (中国十大名牌猪饲料电话)
-
环球快看点丨鹰之航将于6月29日上会:募资7亿元【附航空装备行业分析】
-
特色教育、贴心养老……禅城打造“最幸福”中心城区有成效
-
惊险!端午节男孩溺水口吐白沫昏迷不醒,警民携手紧急施救_观天下
-
【甘肃建投成立70周年系列活动】以实干精神打造地企合作典范
-
每日观点:包粽子、砸金蛋,端午小长假济南楼市“稳中有温”
-
江西临川发生一重大刑事案件,警方悬赏5万,最新进展:人已抓获
-
中卫市气象台发布雷电黄色预警
-
环球最资讯丨视频丨天青色 等雨停
-
小龙虾尾肉多少钱一斤?|全球短讯
-
环球时讯:云尚哈尼集市在京开市
-
焦点!通讯:将核污染水排海是对地球上所有生物的犯罪——日本民众集会反对核污染水排海
-
端午快乐出游,“两小时旅游圈”受青睐
-
滁州11.13亿元挂牌3宗地块 均设保留底价_天天日报
-
日韩股市开盘低开|天天速讯
-
精彩看点:雪中送炭者少,锦上添花者多,科创金融供需不均待破局
-
当前快讯:孝义:附条件不起诉挽救迷途少年 不公开听证点亮返航星光
-
环球实时:内蒙古新井煤矿事故失联者全部遇难
-
[湖北日报]潜江火车站告别雨季“看海”_世界即时看
-
线上教课用什么软件-线上授课软件哪个比较好|微资讯
-
【天天速看料】办得好|露天停放车辆频繁被贴小广告 河南郑州:发现即查 全链条打击
-
下月起,获评乡村工匠将享受大幅优惠政策
-
外交部领事司司长:已恢复60个国家中国公民出境团队游业务-天天热点
-
男子杭州绿化带迷路3天 吃野花求生 这是绿化带还是森林?
-
环球头条:2023青海海北州事业单位面向社会招聘工作人员面试工作温馨提示
-
全球快看点丨2023江苏宿迁市宿豫区招聘村卫生室工作人员综合成绩及进入体检程序人员公告
-
CPO领衔上攻,多股大涨创新高!科技ETF(515000)涨逾1.5%,连升5日
-
快讯|常熟银行:因工作调动,副行长、财务总监尹宪柱辞职-世界信息
-
北京:“延庆东南山·九沟十八湾”工作推进会召开
-
6月21日东明石化石油焦价格平稳
-
清朝有昏君吗?昏庸的皇帝有谁?
-
大跌6%!防水一哥东方雨虹频频参与土拍,什么情况?
-
每日时讯!〖孔明·解密〗6月21日涨停个股揭秘
-
环球视讯!最小单元、最柔产线——“柔性制造岛”打造智能化产业生态(下期)
-
保利抱走员村地块,改善盘表现强势!附24周广州市场周报
-
吉林省气象局与华云集团签订协议 深化国省部门合作|前沿热点