91精品色婷,日韩少妇中出,国产 精一区二区三,欧美视频精品在线二区,婷婷久久日韩欧美,亚洲天堂性爱视频,亚洲香蕉一区,国产自产观看精品一区,日本 大胆成人

設置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

面壁智能聯(lián)合清華等開源中國首個基于華為昇騰訓練的 1.58-bit 端側(cè)大模型 BitCPM-CANN

2026/5/25 11:48:30 來源:IT之家 作者:沁滄(實習) 責編:沁滄
感謝IT之家網(wǎng)友 三體宇宙 的線索投遞!

IT之家 5 月 25 日消息,面壁智能聯(lián)合清華大學、OpenBMB 開源社區(qū),今天正式發(fā)布并開源其在低比特大模型訓練方向的最新成果 ——BitCPM-CANN。

官方表示,這是中國首個完全基于國產(chǎn)算力平臺(華為昇騰)實現(xiàn)端到端訓練并開源的三值(1.58-bit)大模型。從量化算子、訓練算法到全鏈路框架,BitCPM-CANN 均在華為昇騰上原生完成,包含 0.5B、1B、3B、8B 四個模型尺寸,與同尺寸 MiniCPM4 全精度家族逐項對照評測,性能表現(xiàn)優(yōu)異。

相比傳統(tǒng) BF16 精度,BitCPM-CANN 在推理階段釋放約 6 倍顯存紅利,同時將模型能力保留率維持在 90%–97.2%。

官方表示,對手機產(chǎn)業(yè)來說,6 倍的顯存紅利意味著,一個 8B 參數(shù)的 BitCPM-CANN 大模型,可以輕松運行在當前主流旗艦手機之上。

此外,面壁智能基于 MindSpeed × Megatron-LM 主干搭建了完整的低比特訓練底座,包含環(huán)境適配、32K 長序列支持、并行策略、融合算子等完整工程體系。從此,所有面向昇騰的低比特訓練工作,都可建立在同一套公共基礎設施之上。

BitCPM-CANN 0.5B / 1B / 3B / 8B 全系列模型權重現(xiàn)已開源,IT之家附鏈接如下:

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。

相關文章

關鍵詞:面壁智能,清華,開源,華為昇騰,大模型

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知

同江市| 长海县| 乌兰县| 广宗县| 新闻| 图木舒克市| 新沂市| 盐亭县| 建水县| 苍南县| 扎兰屯市| 南丰县| 平罗县| 阿拉善左旗| 兴山县| 黑河市| 景宁| 临江市| 吴桥县| 金门县| 外汇| 乐清市| 井陉县| 洪泽县| 灵宝市| 纳雍县| 大埔县| 图片| 余姚市| 沂源县| 名山县| 丹寨县| 朝阳区| 平定县| 武乡县| 高台县| 承德市| 阳山县| 北辰区| 乌海市| 卓资县|