我的頻道

* 拖拉類別可自訂排序
恢復預設 確定
設定
快訊

川普簽令課10%全球稅率 適用已達成貿易協議國家

關稅遭擋川普稱多數貿易協議仍有效 再點名台灣「偷晶片」

突破性研究成果/北京產Emu3大模型 給AI萬能學習法

聽新聞
test
0:00 /0:00

北京智源人工智慧研究院的一項突破性研究成果,近日在國際頂級學術期刊《自然》(Nature)上線,這是中國科研機構主導的大模型成果首次在《自然》正刊發表。

智源這項名為「通過預測下一個詞元進行多模態學習的多模態大模型」的成果,採用自回歸路線,可以統一多模態學習,訓練出優秀的原生多模態大模型,這對於確立自回歸成為生成式人工智慧統一路線具有重大意義。

據瞭解,長期以來,AI在學習不同類型的「感官」資訊時,往往需要「分科而治」,理解文字用一套方法,生成圖片用另一套,處理影像又需要不同的專業模型,過程複雜且協同起來較為困難。而智源研究院研發的Emu3模型,借鑒了GPT成功的關鍵思路「預測下一個詞元」,成功統一了對文本、圖像及影像的理解與生成能力。打個比方,就如同給AI找到了一個「萬能學習法」,無論面對的是一段文字、一張照片,還是一段動態影像,AI都用同一種邏輯去分析和創造。

實驗表明,這種統一方法在圖片生成、圖文理解和視頻影像創作等多個任務上,達到了與當前各類專用模型相當的水準,且具備更強的擴展潛力和通用性。

《自然》編輯點評這項研究時表示,基於「預測下一個詞元」,Emu3實現了大規模文本、圖像和影像的統一學習,其在生成與感知任務上的性能可與使用專門路線相當,這一成果對構建可擴展、統一的多模態智慧系統具有重要意義。

此外,基於這一核心路徑的反覆運算版本Emu3.5模型,已展現出對物理世界運行規律的初步學習與模擬能力,能夠嘗試預測場景的下一步變化,為發展更通用、更接近人類認知方式的大模型與智慧體奠定了基礎。

AI 人工智慧

上一則

刺激文旅、科技消費 中國推新春活動 期待開門紅

下一則

證詞成「黎智英定罪重要關鍵」 5從犯證人減刑逾半

超人氣

更多 >