暗助中企?DeepSeek新AI模型被指未分享Nvidia等美商
聽新聞
test
0:00 /0:00
中國人工智慧實驗室DeepSeek據報在重大模型更新前打破了產業標準慣例,並未向美國晶片製造商展示其即將推出的旗艦模型。分析認為,此舉目的是要讓美國的硬體和模型在中國處於不利地位。
路透引述兩位知情人士稱,AI開發商通常會將主要模型的預發布版本,分享給Nvidia輝達(另稱英偉達)和超微等領先晶片製造商,以確保其軟體能在廣泛使用的硬體上高效運作。先前,DeepSeek曾與輝達的技術團隊密切合作。
消息人士稱,對於預計在農曆新年假期前後發布的新模型,DeepSeek並未向輝達和超微提供存取權,而是讓華為等中國晶片製造商提前數周取得資料,以便針對其處理器優化軟體。
研究公司Creative Strategies執行長巴加林(Ben Bajarin)表示,這對輝達和AMD在通用數據加速器方面的影響微乎其微,因為大多數企業並未運行DeepSeek,它更多是作為基準測試模型。
巴加林指出,該舉措的目的可能是中國政府更廣泛策略的一部分,想讓美國的硬體和模型在中國處於不利地位。
川普政府一名高級官員日前透露,DeepSeek最新的AI模型,是在中國境內、使用輝達最先進的Blackwell晶片集群進行訓練,此舉顯然違反了美國的出口管制。DeepSeek可能會試圖移除顯示其使用美國AI晶片的技術指標,並計劃公開聲稱其模型使用華為晶片訓練。
去年,美國政府允許輝達的H20、AMD的MI308晶片恢復向中國出貨,這些晶片主要適用於AI模型推論,但更先進處理器的許可仍受限制。目前尚不清楚DeepSeek是否已獲得購買這些美國晶片的批准。

