我的頻道

* 拖拉類別可自訂排序
恢復預設 確定
設定
快訊

Fed 決策/鮑爾說評估伊朗戰爭影響為時過早 五要點一次看

加州是退休度晚年好地方 富人為這些福利回來

神秘中國AI模型引熱議 疑為DeepSeek新一代系統

聽新聞
test
0:00 /0:00
中國AI新創公司深度求索(DeepSeek)。路透
中國AI新創公司深度求索(DeepSeek)。路透

一個強大的人工智慧(AI)模型上周以匿名方式在開發者平台上出現,引發外界揣測,中國AI新創公司深度求索(DeepSeek)是否打算在正式發布前,低調測試新一代系統。

路透報導,這個免費模型名為Hunter Alpha,本月11日在AI模型聚合平台OpenRouter出現,但未標註開發者身分。

在路透的測試中,Hunter Alpha聊天機器人自稱是「一款主要以中文訓練的中國AI模型」,並表示其訓練資料所涵蓋時間範圍截至2025年5月,與DeepSeek自家聊天機器人的知識截止點(knowledge cutoff point)一致。

DeepSeek和OpenRouter均未說明Hunter Alpha模型的開發者身分,也沒有回應置評請求。

Hunter Alpha的介紹頁面顯示,其模型具有1兆個參數,這意味著它約是以1兆個可調參數訓練,可調參數用於決定系統如何處理語言並產生回應。

該系統也標榜擁有最高可達100萬個詞元(token)的上下文視窗,這是用以衡量AI模型能在單次互動中處理或保留多少文本。1個詞元大致對應一小段文本,例如1個單字的片段。

這些規格符合中國媒體對DeepSeek新一代V4模型的期待,根據中媒報導,V4模型最快可能於4月推出。

儘管這些相似處無法直接證實Hunter Alpha與DeepSeek的關聯性,開發者間仍熱烈揣測,這套匿名系統可能是DeepSeek即將公布的新模型的早期測試版。

不過,也有部分開發者提醒,將Hunter Alpha模型與DeepSeek連結的證據仍不足。

獨立評測AI性能的奧茲庫爾(Umur Ozkul)指出,根據他的分析,「Hunter Alpha可能不是DeepSeek的V4模型」,因為與DeepSeek現行系統相比,兩者在詞元相關行為及架構模式上均存在差異。

人工智慧

上一則

重慶市長胡衡華傳落馬 首度缺席重要會議

下一則

美國情報圈評估:中國目前沒有打算2027年侵略台灣

超人氣

更多 >