中國國產AI大模型正在「拚升級」。（路透）

中國雲端服務供應商（CSP）阿里巴巴 2日更新圖片生成及編輯模型Qwen-Image，且新版本已首發接入千問App；DeepSeek 也在1日發布兩款新模型DeepSeek-V3.2和DeepSeek-V3.2-Speciale，號稱達到GPT-5水準。中國國產AI 模型大戰正在「拚升級」，但一般認為要追趕美國閉源模型仍有差距。

阿里更新版Qwen-Image解決了中文圖內處理、亞洲人像真實度等痛點，且支持多語言。而接入千問App，意味阿里正透過高頻迭代與低門檻體驗，加速AI技術從實驗室走向大眾的步伐。

與此同時，DeepSeek推出的兩款新模型有不同的定位：一款DeepSeek-V3.2的目標是平衡推理能力與輸出長度，適合日常使用；另一款DeepSeek-V3.2-Speciale則是重頭戲，其目標是「將開源模型的推理能力推向極致，探索模型能力的邊界」，具備出色指令跟隨、嚴謹數學證明與邏輯驗證能力。

不過，DeepSeek在技術報告中承認，與Google最新一代大型語言模型（LLM）Gemini 3 Pro等前沿閉源模型相比，自家模型仍存在一定的局限性：一是V3.2的世界知識廣度仍落後於領先的專有模型；二是在安全權杖（Token）效率方面，V3.2通常需要更多的權杖才能達到像Gemini3 Pro這樣的模型輸出質量。在解決複雜任務方面也不如前沿模型。也承認開源與閉源模型差距未縮小，反而在拉大，閉源性能增長速度更快。

快手AI團隊「可靈AI」2日也發布全新產品「可靈O1」，號稱全球首個大一統的多模態視頻、圖片創作工具。可靈O1基於MVL（多模態視覺語言）理念，打破傳統單一視頻生成任務的模型邊界，整合文字、視頻、圖片、主體等多模態輸入等。用戶無需在多個模型及工具間跳轉，即可一站式完成從生成到修改的全部創作流程。

富比士中國（Forbes China）引述分析報導，不同於美國以閉源模型和API服務為主導的發展路徑。中國AI模型正透過應用生態、終端硬體滲透「雙線作戰」：應用生態方面，字節跳動的豆包手機助手選擇了系統級融合的路徑；硬體滲透上，阿里巴巴推出夸克AI眼鏡、將AI能力延伸至可穿戴硬體。