我的頻道

* 拖拉類別可自訂排序
恢復預設 確定
設定
快訊

財源不能斷?各國政府要求打詐 Meta粉飾太平手法曝光

圖輯/時報廣場水晶球滿滿美國元素 亞當斯最後一次主持

預告12日發布…傳華為AI推理大突破 或減對HBM技術依賴

傳中國科技巨頭華為12日將發布AI推理領域的突破性技術成果。據透露,這項成果或能降低中國AI推理對HBM(高帶寬內存)技術的依賴。(路透)
傳中國科技巨頭華為12日將發布AI推理領域的突破性技術成果。據透露,這項成果或能降低中國AI推理對HBM(高帶寬內存)技術的依賴。(路透)

中國科技巨頭華為據報12日將在「2025金融AI推理應用落地與發展論壇」上發布AI推理領域的突破性技術成果。據透露,這項成果或能降低中國AI推理對HBM(高帶寬內存)技術的依賴,提升中國國內AI大模型推理性能,完善中國AI推理生態的關鍵部分。

綜合科創板日報、中國基金報、IT之家等媒體報導,業內人士表示,當前AI產業已從「追求模型能力的極限」轉向「追求應用價值的最大化」,推理成為AI下一階段的發展重心。而HBM是解決「數據搬運」的關鍵。HBM不足時,用戶使用AI推理的體驗會明顯下降,導致出現任務卡頓、響應慢等問題。

美國於2024年12月初限制向中國出口先進的高帶寬記憶體晶片(HBM)。美國禁令下,包括HBM2和HBM3、HBM3e等更先進HBM晶片,以及製造這些HBM晶片的設備都禁止出口中國。SK海力士、美光和三星是三大HBM供應商,都禁止出口中國HBM2以上HBM晶片。此舉對於華為發展先進AI技術形成阻礙。

HBM晶片對於AI執行數據密集型任務至關重要。投資者對這種晶片高度關注,因為它通常被用於Nvidia輝達(另稱英偉達)的AI圖形處理器。過去幾屆美國政府都對向中國出口先進晶片實施了不同程度的限制,目的是遏制和減緩中國在人工智慧和國防科技領域的發展。

不過,華為此前在AI推理領域的技術已有部分突破。北京大學在3月聯合華為發布DeepSeek全棧開源推理方案,該方案基於北大自研SCOW算力平台系統和鶴思調度系統,整合了DeepSeek、openEuler、MindSpore與vLLM / RAY等社區開源組件,實現了華為昇騰上的DeepSeek高效推理。

此外,華為昇騰也有突破,比如CloudMatrix 384超節點部署DeepSeek V3 / R1時,在50ms時延約束下單卡Decode吞吐突破每秒1920Tokens;Atlas 800I A2推理服務器在100ms時延約束下單卡吞吐達到每秒808Tokens。

據了解,8月12日召開的「2025金融AI推理應用落地與發展論壇」上,來自中國信通院、清華大學和科大訊飛的專家,華為此次攜手中國銀聯共同發布AI推理的最新應用成果,共同探索AI推理技術在金融領域的規模化落地路徑。

傳中國科技巨頭華為12日將發布AI推理領域的突破性技術成果。據透露,這項成果或能...
傳中國科技巨頭華為12日將發布AI推理領域的突破性技術成果。據透露,這項成果或能降低中國AI推理對HBM(高帶寬內存)技術的依賴。(路透)

AI 華為 DeepSeek

上一則

北京封路、商場全閉…93閱兵首演練 2.2萬人參與

下一則

香港海洋公園「狂野龍捲風」故障 17遊客受困近2小時

超人氣

更多 >