【8月16日北大团队提出iFairy方案压缩大模型权重】目前,大模型推理时耗存储和计算,因其权重采用FP16存储,占用空间大。北大团队首次提出iFairy方案,将模型权重量化到复数集合{+1,-1,+i,-i}。这四个值可用2比特表示,相当于将权重压缩到原本的1/8。
本文由 AI 算法生成,仅作参考,不涉投资建议,使用风险自担
本文来自和讯财经,更多精彩资讯请下载“和讯财经”APP
更新时间:2025-08-19
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By 71396.com 闽ICP备11008920号
闽公网安备35020302034903号