我的頻道

* 拖拉類別可自訂排序
恢復預設 確定
設定
快訊

赫塞斯:確保中方無法主宰美及盟友 無意改變台現狀

烏克蘭媒體:中國秘密購買俄軍備 為入侵台灣做準備

破天荒 DeepSeek梁文鋒論文登「自然」封面

深度求索創始人梁文鋒。(取材自微博)
深度求索創始人梁文鋒。(取材自微博)

DeepSeek團隊研發、梁文鋒擔任通訊作者的DeepSeek-R1推理模型研究論文,近日榮登國際權威期刊「自然」(Nature)封面。這是全球首個經過同行評審的主流大語言模型,填補了業內空白。

香港中通社報導,「自然」評價「目前幾乎所有主流大模型尚未經過獨立同行評審,這一空白終於被DeepSeek打破」,相較今年1月發布的初版論文,新論文披露了更多模型訓練細節,並正面回應了模型發布初期質疑。

據報導,DeepSeek-R1採用創新的大規模推理模型訓練方法,包含人類監督下的深入訓練階段,以優化推理過程。梁文鋒團隊表示,該模型通過強化學習而非依賴人類示例來開發推理步驟,顯著降低了訓練成本和複雜性。模型在接觸優質問題解決案例後,會生成推理模板,通過解決問題獲得獎勵,從而提升學習效果。

分析指,DeepSeek-R1的突破源於其獨特訓練方法。研究顯示,該模型在推理任務中表現出色,尤其在複雜問題解決方面展現了高效性和準確性。這不僅推動了AI技術發展,也為開源AI社區提供了寶貴參考。論文的發表標志著DeepSeek在全球AI領域的領先地位。

DeepSeek由梁文鋒於2023年在中國杭州創立,團隊成員來自頂尖高校及國際機構。梁文鋒,1985年出生於廣東湛江,是幻方量化及DeepSeek創始人。去年12月,其團隊發布大模型「DeepSeek-V3」,展現了持續創新能力。今年4月,梁文鋒入選美國「時代」周刊「2025年全球最具影響力100人」榜單。

AI新創企業DeepSeek團隊完成、梁文鋒擔任通訊作者的DeepSeek-R1...
AI新創企業DeepSeek團隊完成、梁文鋒擔任通訊作者的DeepSeek-R1推理模型研究論文,登上了國際期刊「自然」(Nature)的封面。(取材自「 是說芯語」)

DeepSeek AI 升學

上一則

要求網紅飛行員刪作品?南航疑打壓員工 最新情況來了

下一則

央視:阿里巴巴AI晶片 媲美Nvidia H20 已獲中聯通大單

延伸閱讀

超人氣

更多 >