中國AI模型水準 馬斯克按讚:與美國差距縮小
馬斯克認為中國AI大模型與美國差距正快速縮小,智譜GLM-5.2在長程任務測試接近頂級閉源模型,並帶動市場與產業高度關注。AI摘要
文章摘要整理:
特斯拉CEO馬斯克在社群平台X上發文回覆網友提問表示,中國AI大模型可能在2027年第一季,能夠達到Anthropic最強的AI大模型Fable水準,並點名「中版Open AI」之稱的智譜公司的GLM-5.2已縮小了差距。意外釣出智譜CEO唐傑回覆,「不需要那麼久」。
觀察者網報導,對於馬斯克的言論,有AI業內人士認為,馬斯克的預測相對保守,中美模型水準的時間差可能短於七個月。谷歌DeepMind首席執行官哈薩比斯先前也曾經表示,中國的AI模型在能力上,可能「只差幾個月」就能趕上海外。
智譜日前上線並開源了新一代旗艦AI大模型GLM-5.2。該模型在FrontierSWE程式設計基準測試中得分74.4,接近美國大模型企業Anthropic另一個頂級模型Claude Opus 4.8的水準,此前Anthropic於今年6月初推出的Claude Fable 5模型被公認為最強的AI模型,但由於美國政府的出口管制要求,此模型已暫停全球使用而下線。
GLM-5.2可以完整載入幾百萬字的長文檔、幾百頁PDF,或者一個中型軟體專案的全部代碼。此前的開源模型不是做不到長上下文,而是在長程任務中表現不穩定,讀到後面就開始遺漏前面的資訊。GLM-5.2在FrontierSWE、SWE-Marathon等長程任務測試裡,得分僅次於Claude Opus 4.8,差距僅0.7%。
這是開源模型第一次在工程級的長任務上接近閉源頂級模型的水準。包括華為昇騰、平頭哥、摩爾線程、寒武紀、昆侖芯、沐曦、海光、壁仞等中國國產算力平台都已實現適配。
智譜在發布時提到:「前沿智慧不應只屬於少數人,也不應被少數規則隨時收回。」這次沒有附加任何使用限制。
跑分數據最初由智譜自行發佈,市場態度謹慎。隨後Artificial Analysis、Code Arena等第三方機構陸續發佈獨立測試結果,與官方數據基本吻合。
新浪財經報導,從1月8日上市到現在不到半年,智譜股價累計漲幅超過18倍。2025年營收人民幣7億元、虧損人民幣47億元的公司,當前最新市值已經達到9336億港元。這個數字超過了中芯國際,是百度的近三倍,騰訊的五分之一。
他在X上表示,中國AI大模型可能到2027年第一季,可達Anthropic最強模型水準;但智譜CEO唐傑回應,認為不需要等那麼久。 GLM-5.2可載入超長文檔與大型程式碼專案,在FrontierSWE等測試中表現接近Claude Opus 4.8,且在長任務上僅落後約0.7%。 智譜上市不到半年股價累計大漲逾18倍,市值升至9336億港元,並獲多家第三方測試與國產算力平台適配,市場因此高度關注。精華 FAQ
