DeepSeek將推出新一代模型V4 傳捨棄Nvidia採華為晶片
中國AI企業深度求索(DeepSeek)即將推出的新一代模型V4,傳將捨棄Nvidia(輝達)改採華為設計的最新晶片。為籌備V4發布,包括阿里巴巴、字節跳動和騰訊控股在內的多家中國科技巨頭,已對華為即將推出的晶片下達大規模訂單,總量達數十萬枚。
行業觀察人士指出,若消息屬實,這代表中國AI產業在算力自主化方面取得實質性進展,可能重塑全球AI技術競爭格局。特別是在當前國際科技環境日趨複雜的背景下,這種技術路線選擇具有特殊的戰略意義。
科技媒體「The Information」報導,消息人士透露,DeepSeek團隊在過去半年間與華為及寒武紀科技展開深度合作,重點優化模型底層架構以適配國產晶片環境。研發團隊不僅重構了部分核心代碼,還針對國產硬體特性進行了多輪壓力測試,確保模型在國產算力平台上的運行效率。
值得關注的是,該企業此次技術路線出現重大調整。不同於行業慣例將新模型送交輝達等美國廠商優化,DeepSeek選擇提前向華為等中國供應商開放模型測試許可權。這種策略轉變被解讀為對國產晶片生態的實質性支持,也反映出中美科技競爭背景下企業供應鏈多元化的趨勢。
知情人士進一步指出,DeepSeek-V4系列將包含三個不同定位的模型版本,每個版本都針對特定應用場景進行專項優化。所有模型均採用國產晶片架構設計,這意味著從硬體到軟體的完整技術棧實現自主可控。這種全棧式創新模式在人工智慧領域尚屬首次嘗試。
市場之所以高度關注DeepSeek-V4,主要來自前代產品的影響力。先前推出的V3與R1以低成本架構切入市場,曾引發全球科技股震盪,並讓投資人重新評估AI發展是否需要持續大規模投入算力資本支出。因此這種顛覆性創新,使得尚未面世的V4模型備受期待,市場普遍關注能否延續低成本突破的技術路線。
不過,目前中國先進製程已知大致仍停留在5奈米水準,與主流先進製程仍存在差距,相關晶片在實際AI大模型運作下的效能表現,仍有待進一步觀察。
中國科技媒體「晚點LatePos」先前報導,V4有可能將在今年4月發布,並稱它很大機率仍是開源最強模型,「但很難是碾壓級的強」。
