【TechWeb】5月25日,面壁智能携手清华大学及OpenBM正式推出并开源其最新的1.58-bit端侧大模型——BitCPM-CANN。这标志着中国首个完全基于华为昇腾平台实现端到端训练的三值大模型的问世。

此次发布是自5月23日在华为鲲鹏昇腾开发者大会(KADC 2026)首次展示后,BitCPM-CANN全系列模型正式向公众开放。
据介绍,BitCPM-CANN在推理阶段相比传统的BF16精度,能够实现约6倍的存储优势,同时模型的能力保持率可维持在90%至97.2%。这意味着在同等设备下,用户可以运行更大规模的模型,或者在同一终端上运行相同模型时,仅需过去1/6的存储空间。这为未来在手机上运行60B的大模型提供了可能,显著提升智能手机的智能化水平。
“2-bit”成为过去一年端侧芯片行业的热门研究话题,成为在手机上运行更大参数模型的关键技术瓶颈。2-bit量化技术能够将模型权重压缩6到8倍,使其适合存储在手机闪存中。例如,在4GB的存储空间中可以容纳16B模型,通过结合MoE与激活范围约束可扩展至32B;若内存增加到8GB,则模型参数可提升至60B。
面壁智能指出,BitCPM-CANN的发布不仅标志着其在端侧大模型领域的技术进步,也通过开源为中国端侧大模型的发展注入了新的活力。