華為AI算力大突破 利用率將增至70% 較勁Nvidia旗下公司
有消息指出,中國科技巨頭華為將在本周五(21日)發布AI領域的突破性技術,該技術延續以「軟體補硬體」的創新思路,可將GPU(圖形處理器)、NPU(神經網絡處理器)等算力資源利用率,從行業平均30%至40%大幅提升至70%,顯著釋放算力硬體潛能。
綜合觀察者網、中國基金報等報導,知情人士提到,華為這項新技術將對標Nvidia(輝達,又名英偉達)2024年底收購的以色列公司Run:ai的核心技術,旨在透過軟體創新,實現輝達、華為昇騰及其他三方算力的統一資源管理與利用,屏蔽算力硬體差異,為AI訓練推理提供更高效的資源支撐。不過,目前華為官方並未公開證實前述資訊。
華為今年以來推出多項技術以突破對輝達的依賴,比如推出昇騰384超節點(Superpod),以華為在通信、存儲和基礎軟體等方面的大雜燴優勢,突破了互聯瓶頸,在算力規模的趕超;此外,推出並開源一款名為「推理數據記憶管理器」(Unified Cache Manager,UCM)的全新軟體工具,目標是在不依賴HBM(高頻寬記憶體)的情況下,大幅提升大型語言模型(LLM)的訓練與推理速度,還能降低成本。
以色列公司Run:ai於2018年成立,其產品只圍繞一核心:如何高效使用GPU。核心產品是基於kubernetes(開源容器編排平台)構建的軟體平台,用於調度GPU的計算資源,透過動態調度、池化、分片等技術,實現GPU資源利用率的優化,讓深度學習訓練與推理任務在企業級環境中高效運行。
有媒體報導稱,Run:ai的用戶包括全球列印機巨頭斑馬技術、自動駕駛公司Wayve等。其中Wayve通過Run:ai提供的工具,將原先不足25%的GPU集群效率,提升到80%以上。
Run:ai在2024年12月以7億美元被輝達收購。收購的同時,輝達還宣布開源Run:ai的所有平台技術,買輝達GPU就能免費用。外界認為輝達CEO黃仁勳之所以收購Run:ai的目的,是要進行AI行業的垂直整合,從晶片到工具再到軟體應用,打造一個能滿足任何AI用戶的一站式商店,讓客戶對其生態形成依賴。
觀察者網分析,對當下中國來說,要避免對輝達的過度依賴,尤其是在先進製程受限、單卡算力存在劣勢的情況下,中國國內產業界更需要「系統補單點」、「軟體補硬體」,支撐AI產業發展。
此外,分析指,AI是一項系統工程,算力更是一個高成本的代表。在中國先進晶片受限的情況下,華為即將發布的新技術,將如何提升算力資源利用的效率,值得關注。
