我的頻道

* 拖拉類別可自訂排序
恢復預設 確定
設定
快訊

消費者報告2026最佳汽車品牌 特斯拉首度上榜

中國富豪被爆在美找代孕生上百子女 鬧上美國法庭

DeepSeek提升寫程式能力 R1-0528媲美OpenAI o3

聽新聞
test
0:00 /0:00
DeepSeek R1模型已完成小版本升級,目前提升最為明顯的是代碼能力,性能幾乎媲美OpenAI重量級的o3-high模型。(路透)
DeepSeek R1模型已完成小版本升級,目前提升最為明顯的是代碼能力,性能幾乎媲美OpenAI重量級的o3-high模型。(路透)

DeepSeek今年初造成全球震撼,外界關注新模型進度。DeepSeek在官方交流群中通知,DeepSeek R1模型已完成小版本升級,緊接著於29日凌晨,官方在開源平台HuggingFace上發布DeepSeek-R1-0528。

經初步測試,該版本目前提升最為明顯的是寫程式能力,在代碼測試平台Live CodeBench中,其性能幾乎媲美OpenAI重量級的o3-high模型。

綜合上證報、第一財經報導,深度求索29日表示,其以DeepSeek V3 Base模型作為基座,模型思維深度與推理能力顯著提升,整體表現上已接近其他國際頂尖模型,如o3與 Gemini-2.5-Pro,其中,將「幻覺」降低40%至50%,同時對創意寫作進行優化。

不少開發者已在第一時間進行了測試,發現這個「小版本升級」並不小。有業內人士稱,DeepSeek升級後的模型,思維鏈 (CoT) 的行為似乎發生了顯著變化。

此前,業界紛紛推測,DeepSeek推出R2模型的具體時間。

本次迭代,有網友測試評論稱,此次,DeepSeek-R1-0528更新核心亮點包括能像谷歌模型一樣深度推理;文本生成優化:更自然,格式更佳;獨特的推理風格:不僅快,而且更縝密;支持長時思考:單任務處理時長可達30分鐘至60分鐘。

外界企盼R2模型的推出,但DeepSeek官方針對此前的V3模型和R1模型都做了一次迭代,但仍未釋出大家期待的R2模型的消息。

DeepSeek於3月在hugging face低調釋出DeepSeek-V3-0324迭代版本模型,DeepSeek介紹,新版V3模型借鑒R1模型訓練過程中所使用的強化學習技術,大幅提高了在推理類任務上的表現水平,此外在前端開發、中文寫作等方面進行了能力優化。

業內人士猜測,是否模型架構不更新,只是增加或調整了訓練數據,DeepSeek就不將更新定義為大版本升級,而業內其他模型給出明顯的版本號迭代則是一種品牌營銷需求。

DeepSeek 谷歌 OpenAI

上一則

關稅戰 Z世代年輕人如何面對財務挑戰?

下一則

飲料大吹健康風 「補水商品」上看數十億元商機

延伸閱讀

超人氣

更多 >