DeepSeek價格屠夫新模型採華為晶片 黃仁勳預言災難成真

中國新聞組/北京25日電

中國AI新創公司深度求索(DeepSeek)全新系列模型V4的預覽版本,24日上線並同步開源;該模型跨入「百萬級超長上下文」普惠時代,也是DeepSeek首度採用華為AI晶片;V4分為Pro和Flash兩個版本,媒體認為,其定價仍是一貫的「價格屠夫」風格。

DeepSeek V4在華為昇騰AI 處理器上完成適配和部署——國產大模型+國產算力的標誌性組合,且價格具競爭力;而Nvidia創辦人暨執行長黃仁勳15日接受Dwarkesh Patel的播客專訪時,說了一句分量很重的話:「如果DeepSeek先在華為平台上發布,那對我們國家來說將是災難性的。」僅僅9天,這句話精準應驗。

V4模型上下文處理長度由原有的128K顯著擴展至1M,首次增加了KVCache滑窗和壓縮算法,減少Attention計算和訪存開銷。該模型在Agent代理(智能體)執行力、世界知識儲備及邏輯推理性能上均取得顯著突破。

華爾街見聞報導,就在前一天,OpenAI剛上線GPT-5.5,每百萬輸出token定價30美元。DeepSeek V4-Flash的輸出定價是人民幣2元,折合不到0.3美元,也就是百分之一的價格。

路透報導,DeepSeek過去主要依賴Nvidia(輝達,又譯英偉達)晶片訓練模型,但這次V4版本轉向與華為合作。華為昇騰、天數智芯、寒武紀等芯片廠商已經支持DeepSeek-V4新模型。不過DeepSeek並未公開說明訓練V4所使用的具體處理器晶片型號。這距離DeepSeek去年1月的大版本更新已時隔15個月。

值得一提的是,業界一直在關注DeepSeek-V4是否會用國產算力,從推文來看確實是與華為昇騰合作。

V4 擁有百萬字超長上下文,在AgenticCoding評測中,V4-Pro已達到當前開源模型最佳水平,並在其他Agent相關評測中同樣表現優異。在數學、STEM、競賽型代碼的測評中,V4-Pro超越當前所有已公開評測的開源模型,取得比肩世界頂級閉源模型的成績。

第一財經日報報導,V4模型按大小分為Pro和Flash兩個版本,其中,Pro版參數為1.6兆,啟動參數490億,預訓練資料量33兆;Flash版參數為2840億,啟動參數130億,預訓練資料量32兆。均支持100萬token上下文,MIT協定完全開源。

國家超算互聯網24日發布消息,DeepSeek-V4預覽版已上線該平台AI社區。目前,企業、科研機構和個人開發者均可在其AI社區下載DeepSeek-V4模型文件,並依託平台進行快速部署、推理和開發。

DeepSeek首度採用華為AI晶片,分為Pro和Flash兩個版本。(路透)

黃仁勳 華為 DeepSeek

推薦文章