比石油還缺 算力趕不上AI淘金潮 企業人工智慧發展受限
人工智慧(AI)淘金潮正加速耗盡開發者不可或缺的資源:運算能力。
算力吃緊讓重度使用者恐慌,且導致企業被迫撤回產品,也出現穩定性的問題。這些狀況對AI熱潮而言是一大警訊,因為就在大家已經習慣靠 AI 來提升工作效率時,算力不足會讓這些超強工具變得很難用,發揮不了原本該有的實力。
洛杉磯工程師兼科技投資人普拉迪安(Ben Pouladian)說:「大家都在談論石油,但我認為世界現在最缺的詞元(tokens)」。在 AI 領域,「token」是用來衡量執行任務耗費多少運算資源的單位。
用於訓練並執行 AI 模型的圖形處理器(GPU),每小時租賃價格自去年秋季以來大幅上漲。熱門聊天機器人Claude 和編寫程式軟體 Claude Code 的開發商 Anthropic,近日頻繁為當機所苦。該公司已開始在尖峰時段對使用者的運算供應進行用量管制,但這項措施卻引發客戶抱怨,認為太快就達到使用上限。
華爾街日報報導指出,OpenAI 撤回 Sora 影片生成應用程式,部分原因就是為了騰出運算資源,以支援代號為「Spud」的新型 AI 模型所驅動的程式設計和企業級產品。
OpenAI 上周向投資人表示,該公司致力大幅增加算力,已掌握超越 Anthropic的關鍵優勢。
彭博報導,OpenAI 在一份給投資人的照會中說:「這差距關係重大,因為算力現在已成為產品發展的限制因素。」
OpenAI 在這這份文字中引用了 Stratechery 部落格作者、分析師湯普森(Ben Thompson)的報告,他說算力受限可能影響了 Anthropic 決定僅向特定合作夥伴限量開放 Mythos 模型的決策。
OpenAI 表示,2025年可用的算力為 1.9 百萬瓩(GW),是前一年的三倍,並預計明年容量將達到兩位數,並在 2030 年達到約 30 GW。相較之下,OpenAI 估計 Anthropic 去年底算力為 1.4 GW,明年則將介於 7 至 8 吉瓦之間。
主要由軟體企業用戶使用的 OpenAI API 平台,token 使用量已從 10 月的每分鐘 60 億個,激增至 3 月下旬每分鐘 150 億個。
去年年底,AI 雲端公司 CoreWeave 將價格調漲了 20% 以上,並開始要求小型客戶簽下至少三年的長約,而先前的要求僅為一年。
根據 Ornn 運算價格指數(Ornn Compute Price Index)顯示,租賃輝達(Nvidia)最先進 Blackwell 系列晶片的一小時費用為 4.08 美元,較兩個月前的 2.75 美元上漲了 48%。
2月中旬以來,Anthropic 旗下各系統當機已成家常便飯,部分企業客戶不得不轉向其他 AI 模型廠商。
