我的頻道

* 拖拉類別可自訂排序
恢復預設 確定
設定
快訊

美智庫:新版安全戰略脫離大國競爭 對中態度不一

POLITICO專訪 川普:歐洲衰弱、基輔須把握止損

改用華為晶片訓練遇難題 DeepSeek-R2延後問世

聽新聞
test
0:00 /0:00
中國媒體報導指出,DeepSeek的R2模型可能最快在未來數周內發布。(路透)
中國媒體報導指出,DeepSeek的R2模型可能最快在未來數周內發布。(路透)

中國人工智慧(AI)公司深度求索(DeepSeek)使用華為晶片訓練發生困難,被迫延後發表新模型,可見中國推動自家技術來取代美國面臨瓶頸。

英國金融時報(FT)引述知情人士報導,DeepSeek今年1月推出R1模型後,在主管機關鼓勵下改用華為昇騰處理器(Ascend)取代輝達(NVIDIA)晶片。

但DeepSeek以昇騰晶片訓練R2模型時持續遭遇技術問題,不得不改用NVIDIA輝達晶片來訓練,另把華為晶片用於推論(inference)。報導指出,這正是DeepSeek新模型原定5月發表、卻延後的主因。

報導引述中國產業人士指出,中國晶片在穩定性、晶片間連線速度和軟體水準方面都不如輝達的產品。

據報導,華為曾派出工程團隊進駐DeepSeek辦公室,協助該公司使用昇騰晶片開發R2模型。但知情人士說,即使華為駐點支援,DeepSeek仍未能在昇騰晶片上成功完成一次訓練。

知情人士透露,DeepSeek創辦人梁文峰曾在公司內部對R2進展表達不滿,並力促團隊投入更多時間打造更先進的模型,以維持該公司在AI領域的優勢。

據報導,R2延後問世,也跟新版模型數據標記(data labeling)作業超過預期有關。媒體報導指出,R2模型可能最快在未來數周內發布。

▼收聽一洲焦點播客版(Podcast):

DeepSeek 華為 輝達

上一則

屈公病從廣東蔓延 閩浙桂列一級高風險區 滬蘇緊張

下一則

中招攬外國年輕科技人才 新增K字簽證

超人氣

更多 >