91精品色婷,日韩少妇中出,国产 精一区二区三,欧美视频精品在线二区,婷婷久久日韩欧美,亚洲天堂性爱视频,亚洲香蕉一区,国产自产观看精品一区,日本 大胆成人

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

英偉達(dá) Blackwell GPU 刷新 AI 推理速度世界紀(jì)錄,實現(xiàn) 1000 TPS / User 里程碑

2025/5/24 12:29:52 來源:IT之家 作者:問舟 責(zé)編:問舟

IT之家 5 月 24 日消息,當(dāng)?shù)貢r間周四,英偉達(dá)宣布其 Blackwell GPU 在 4000 億參數(shù)的 Meta Llama 4 Maverick 模型上成功打破了 LLM 推理速度世界紀(jì)錄。

據(jù)介紹,AI 基準(zhǔn)測試機(jī)構(gòu) Artificial Analysis 通過配置 8 塊 Blackwell GPU 的 DGX B200 節(jié)點,首次實現(xiàn)每用戶每秒生成 1000 個 token(TPS)的性能里程碑。

英偉達(dá)表示,技術(shù)團(tuán)隊通過 TensorRT-LLM 軟件棧實施深度優(yōu)化,并采用 EAGLE-3 技術(shù)訓(xùn)練推測解碼草稿模型,使其性能較優(yōu)化前基準(zhǔn)提升 4 倍。整套服務(wù)器系統(tǒng)在峰值吞吐配置下可達(dá)每秒 72,000 token。

英偉達(dá)解釋稱:“推測解碼是通過小型快速草稿模型預(yù)測 token 序列,再由大型目標(biāo) LLM 并行驗證的加速技術(shù)。其優(yōu)勢在于單次迭代可能生成多個 token,代價是額外的草稿模型計算開銷?!?/p>

為實現(xiàn)該突破,工程師團(tuán)隊采用基于 EAGLE3 的軟件架構(gòu)。該架構(gòu)專為大型語言模型推理加速設(shè)計,與 GPU 硬件架構(gòu)形成協(xié)同效應(yīng)。IT之家注意到,測試結(jié)果顯示 Blackwell 架構(gòu)已完全適配 Llama 4 Maverick 級別的超大規(guī)模語言模型。

英偉達(dá)還表示,他們在保持響應(yīng)準(zhǔn)確性的同時大幅提高了性能。在許多指標(biāo)上,使用 FP8 數(shù)據(jù)格式的準(zhǔn)確性與人工分析 BF16 相當(dāng)。

參考資料:

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:英偉達(dá)Meta, Llama 4

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知

云南省| 始兴县| 开鲁县| 兖州市| 天气| 双鸭山市| 紫阳县| 紫金县| 郑州市| 大安市| 富民县| 龙口市| 华宁县| 乌兰县| 抚远县| 大理市| 阿巴嘎旗| 乌兰浩特市| 林甸县| 玛沁县| 毕节市| 井陉县| 布拖县| 汉寿县| 塔河县| 通道| 县级市| 梅河口市| 龙山县| 岫岩| 阿拉善盟| 中西区| 乐都县| 八宿县| 久治县| 师宗县| 清河县| 郎溪县| 桂东县| 张家界市| 得荣县|