08
16

北大提出首个复数大模型,2比特量化,推理仅加法,可手机部署

2025-08-16 15:04分享至
目前大模型在推理时通常都非常耗存储和计算,这是因为权重采用FP16存储,占用空间大。北大团队首次提出iFairy方案,把模型权重量化到复数集合 {+1, -1, +i, -i}。这四个值刚好可以用2比特表示,相当于压缩到原本的1/8。(量子位)原文链接

下一篇

8月16日,华为常务董事、终端BG董事长余承东与上汽集团总裁贾健旭共同试驾测试尚界H5,作为华为与上汽合作的首款车型,尚界H5明确上市即搭载HUAWEI ADS 4辅助驾驶系统,具有全域通行、泊车辅助、多重感知等科技属性,分纯电与增程双动力版本,将于9月上市。(人民财讯)

5小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业