我的頻道

* 拖拉類別可自訂排序
恢復預設 確定
設定
快訊

從無感到嚇壞 伊朗彈襲以色列核武庫門戶 居民曝逃生過程

日本外相:自衛隊可能在美伊停戰後到荷莫茲海峽掃雷

華為Atlas 350加速卡亮相:單卡算力超H20 支持FP4低精度推理

聽新聞
test
0:00 /0:00
華為日前在華為中國合作夥伴大會2026上發布搭載昇騰950PR處理器的Atlas 350加速卡。華為稱,該加速卡單卡算力達輝達H20的近3倍,並為目前中國唯一支援FP4低精度推理的產品。圖為Atlas 350加速卡。(取自觀察者網)
華為日前在華為中國合作夥伴大會2026上發布搭載昇騰950PR處理器的Atlas 350加速卡。華為稱,該加速卡單卡算力達輝達H20的近3倍,並為目前中國唯一支援FP4低精度推理的產品。圖為Atlas 350加速卡。(取自觀察者網)

華為推出新一代AI算力產品。日前在華為中國合作夥伴大會2026上,華為發布搭載昇騰950PR處理器的Atlas 350加速卡。華為稱,該加速卡單卡算力達輝達H20的近3倍,並且是目前中國唯一支援FP4低精度推理的產品。

據觀察者網,華為副總裁、ICT產品組合管理與解決方案部總裁馬海旭宣布,Atlas 350加速卡正式上市銷售,象徵去年首次介紹的昇騰950PR晶片如期上市。

華為昇騰運算業務總裁張迪煊介紹,Atlas 350的單卡算力達輝達H20的2.87倍,「是目前中國國內唯一支援FP4低精度的推理產品」;記憶體HBM容量是H20的1.16倍,達112GB,多模態生成速度可提升60%;內存訪問顆粒從512字節減少到128字節,小算子訪存效率提升4倍。

至於支援FP4低精度代表什麼?觀察者網提到,輝達現在想往中國銷售的H200不支援原生FP4,僅有更先進的Blackwell才引入。而支援FP4,本質上是用精度換效率的極致推理方案,這表示70B參數的模型僅需35GB顯存,單卡即可加載,推理延遲大幅降低,而FP16需要140GB顯存。快科技指,Atlas 350的FP4算力為1.56P,帶寬1.4TB/s,功耗600W,約為H20的1.5倍。

IT之家則指出,該加速卡算力與內存雙升級、訪存更靈活、開發更易用,面向推薦推理、多模態生成和LLM推理三大場景,華為的合作夥伴可基於Atlas 350打造更具競爭力的產品。

同時,在此次大會上,昆侖、華鯤振宇、神州鯤泰、長江計算、寶德、軟通華方及百信等7家合作夥伴同步發布基於Atlas 350的整機產品,顯示昇騰950代際推理算力已進入商用階段。科大訊飛亦表示,新一代星火大模型將與昇騰910/950系列算力底座適配。

報導指出,華為昇騰系列晶片自2018年推出以來持續升級,從昇騰310、910至950系列逐步完善算力布局。此次Atlas 350為950代際首款上市硬體產品,在算力、訪存及架構均有提升。

此外,馬海旭表示,截至目前昇騰已支援50多個第三方開源社群與專案,貢獻650多項關鍵特性,軟體已完成架構解耦,提升開發與部署效率。華為亦提出分級算力方案,涵蓋百億級、千億級與萬億級模型場景,並與合作夥伴推出多種一體機產品,目前已聯合打造400多款行業一體機,服務超過2,700家客戶。隨著「養龍蝦」等AI代理(AI Agent)應用興起,近期已有十多家合作夥伴推出基於昇騰的一體機產品。

華為

上一則

現貨油價遠高於布蘭特期貨價 凸顯油供危機比表面更加嚴峻

超人氣

更多 >