DeepSeek提升寫程式能力 R1-0528媲美OpenAI o3
DeepSeek今年初造成全球震撼,外界關注新模型進度。DeepSeek在官方交流群中通知,DeepSeek R1模型已完成小版本升級,緊接著於29日凌晨,官方在開源平台HuggingFace上發布DeepSeek-R1-0528。
經初步測試,該版本目前提升最為明顯的是寫程式能力,在代碼測試平台Live CodeBench中,其性能幾乎媲美OpenAI重量級的o3-high模型。
綜合上證報、第一財經報導,深度求索29日表示,其以DeepSeek V3 Base模型作為基座,模型思維深度與推理能力顯著提升,整體表現上已接近其他國際頂尖模型,如o3與 Gemini-2.5-Pro,其中,將「幻覺」降低40%至50%,同時對創意寫作進行優化。
不少開發者已在第一時間進行了測試,發現這個「小版本升級」並不小。有業內人士稱,DeepSeek升級後的模型,思維鏈 (CoT) 的行為似乎發生了顯著變化。
此前,業界紛紛推測,DeepSeek推出R2模型的具體時間。
本次迭代,有網友測試評論稱,此次,DeepSeek-R1-0528更新核心亮點包括能像谷歌模型一樣深度推理;文本生成優化:更自然,格式更佳;獨特的推理風格:不僅快,而且更縝密;支持長時思考:單任務處理時長可達30分鐘至60分鐘。
外界企盼R2模型的推出,但DeepSeek官方針對此前的V3模型和R1模型都做了一次迭代,但仍未釋出大家期待的R2模型的消息。
DeepSeek於3月在hugging face低調釋出DeepSeek-V3-0324迭代版本模型,DeepSeek介紹,新版V3模型借鑒R1模型訓練過程中所使用的強化學習技術,大幅提高了在推理類任務上的表現水平,此外在前端開發、中文寫作等方面進行了能力優化。
業內人士猜測,是否模型架構不更新,只是增加或調整了訓練數據,DeepSeek就不將更新定義為大版本升級,而業內其他模型給出明顯的版本號迭代則是一種品牌營銷需求。

FB留言