我的頻道

* 拖拉類別可自訂排序
恢復預設 確定
設定
快訊

布朗大學槍手身分曝光 租車目擊者與Reddit帖文是關鍵

台北市地鐵站丟彈隨機砍人 4死6傷 嫌犯跳樓亡

被禁還是買 Deepseek傳用Nvidia Blackwell打造新模型

The Information引述知情人士報導,中國AI新創Deepseek正使用被美國禁止出口的輝達Blackwell晶片,打造新模型。  路透
The Information引述知情人士報導,中國AI新創Deepseek正使用被美國禁止出口的輝達Blackwell晶片,打造新模型。 路透

The Information引述知情人士報導,中國人工智慧(AI)新創Deepseek,正使用數千顆美國禁止輸往中國的輝達Blackwell晶片,打造下一款大型模型。這些最新的輝達晶片,將助Deepseek在國內和全球的AI競賽中保持競爭力。

根據報導,Deepseek已透過一套複雜的走私流程,取得這些先進晶片,部分員工希望能在明年2月的農曆春節前推出下一代模型。不過,知情人士表示,Deepseek創辦人梁文峰比較重視效能,因此沒有硬性規定新模型的截止日期。

這套走私流程包含先將晶片運往獲准購買這些晶片國家的資料中心,再拆解含有這些晶片的伺服器,並將設備拆解後進口至中國。Deepseek可向一家或多家中國資料中心公司取得這些晶片。

報導指出,Deepseek今年1月憑藉其R1深度推理模型一舉成名後,至今都只對現有模型進行小幅升級,尚未推出過全新模型。一個可能原因是該公司採用一種名為「稀疏注意力」(sparse attention)的方法,這種方法只使用一部份的模型來回答問題,而非整個模型,可降低推理成本,但也提高了模型開發的挑戰性。

不過,Blackwell晶片特別適用於這種技巧,因為此晶片包含的專門設計硬體可加速稀疏運算,運算速度比傳統方法快兩倍。

輝達 AI 春節

上一則

美股早盤/Fed利率決議在即 三大指數狹幅波動

下一則

輝達H200晶片批准銷中 阿里、字節傳有意購買

超人氣

更多 >