算力將像電力穩定…北京首家詞元工廠投用 日產能1.4萬億
北京正全力建設「人工智能(AI)之城」,北京首家Token(即詞元,AI處理文字最小單位)工廠「北京壹號詞元工廠」9日落地亦莊,項目一期每日Token產能高達1.4萬億個,此後算力將像電力一樣成為穩定、普惠的公共資源。
綜合媒體報導,該工廠首創對標電網穩定運行標準,實現7×24小時不間斷運行,使算力能像電力一樣即開即用。目前,工廠已實現一半任務在6秒內響應、九成任務低於10秒,並同步向全球開源「詞元工廠性能基準」,標誌著大模型算力供給正式邁入工業化、標準化的流水線時代。
這座面向智能體時代的「新型電廠」由軟通動力信息技術股份有限公司建設,未來遠期目標將達到日產10萬億Token。軟通動力高級副總裁、軟通智算總裁劉怡指出,AI任務的算力消耗極大,例如科研人員梳理25年來的數千萬份文獻撰寫學術綜述,僅單項任務就要消耗1億Token。對此,詞元工廠給出明確的服務質量承諾,包括服務可用性≥99.9%、首字延遲P90<10秒等指標,全面適配各類複雜AI場景。
伴隨工廠落地而開源的「詞元工廠性能基準」,是行業首次針對智能體長時運行特徵建立的統一性能度量標準。過去,行業普遍缺少面向智能體場景的算力服務評測標準,容易導致「高分低能、參數虛標、用戶選擇困難」等痛點。該基準的開源,將實現對算力集群真實服務能力的精準評估與公平對比。未來,工廠還將推出「實時監測」等動態監控方法,全面監控Token生成的幻覺率與語義一致性。
此項進展背後,是中國大模型從「一問一答」式的簡單對話,加速演進為長周期、多輪次、高不確定性運行的智能體系統,帶動Token消耗量急速飆升。數據顯示,中國單日Token消耗量在九個月內暴漲四倍,從萬億級躍升至千萬億級;摩根大通更預測,2025年至2030年,中國Token消耗量年複合增長率將高達330%。目前中國國產詞元定價約為海外的1/10,價格優勢極為明顯。
未來,北京壹號詞元工廠還將聯動張家口、烏蘭察布等綠電基地,構建京津冀一體化算力集群,進一步大幅降低各行各業使用AI算力的門檻。
該工廠位於北京亦莊,項目一期每日Token產能達1.4萬億個,目標是把算力做成像電力一樣穩定、普惠、可即時調用的公共資源。 工廠首創對標電網運行標準,實現7×24小時不間斷服務,並提出可用性99.9%、首字延遲P90小於10秒等指標,強化複雜AI場景支援。 未來它將聯動張家口、烏蘭察布等綠電基地,形成京津冀一體化算力集群,同時透過開源性能基準,推動算力評測標準化與成本下降。精華 FAQ
