「中國AI撕開市場」MiniMax 語音模型Speech-02雙料登頂
上海AI獨角獸MiniMax帶著新一代語音大模型Speech-02亮相。Speech-02在國際權威的Artificial Analysis 和 Hugging Face TTS Arena兩大語音評測榜單上拿下雙料冠軍,將OpenAI、ElevenLabs甩在身後。行業分析師指出,當中國AI開始用「技術突破+極致性價比」撕開市場,全球競爭的格局真的要變了。
網易新聞報導,Speech-02在字錯率WER和相似度SIM等客觀指標上取得了SOTA結果,用戶盲聽主觀評價反饋也更自然、真實。具體來看,與Seed-TTS、CosyVoice 2和真實音頻相比,Speech-02在中英文的零樣本語音克隆中均實現了更低的WER,表明其發音錯誤率更低且更清晰穩定。在SIM方面,Speech-02在所有24種測試語言中均顯著優於ElevenLabs的multilingual_v2模型,前者生成的語音更逼近真人輸出。
MiniMax海外生態負責人Linda介紹,這次發布的Speech-02能夠輕鬆駕馭32個語種的不同口音和不同情緒,我們相信通過AI對稀缺小語種的支持,未來將多語種的聲音以當地最地道的發音傳向全世界,幫助全球每一種語言都被聽見、每一種文化都被理解。
從年初的Speech-01支持17種語言,到現在Speech-02覆蓋32個語種,MiniMax只用了短短幾個月,就完成了「技術迭代+全球落地」的雙重跨越。
最讓人不能忽視的優勢還有它的Speech-02商用定價僅為全球頭部模型ElevenLabs的四分之一。
目前,MiniMax已經和閱文集團、高途教育、香港電視台等公司達成合作,在AI玩具、汽車智能座艙等硬件場景玩出了新花樣。

FB留言