我的頻道

* 拖拉類別可自訂排序
恢復預設 確定
設定
快訊

美國面臨「車貸泡沫」民眾賣車不夠還貸款

「一邊尖叫 一邊逃命」德州公寓派對槍擊 2死10傷 槍手在逃

日本東大入學考 AI進化2年從落榜變狀元 碾壓人類考生

聽新聞
test
0:00 /0:00
2026年東京大學與京都大學入學考試,OpenAI的最新模型表現遠超預期,展現超...
2026年東京大學與京都大學入學考試,OpenAI的最新模型表現遠超預期,展現超越人類考生的應試能力。(圖/AI生成)

人工智慧的進化速度,再次刷新外界對科技能力的想像。東京人工智慧新創公司LifePrompt近日發布一項震撼性報告,OpenAI旗下最新模型「ChatGPT-5.2 Thinking」在2026年度東京大學與京都大學入學考試模擬測驗中,不僅全數達標,更以壓倒性分數超越所有人類考生,被外界形容為「AI版東大狀元」。

日經新聞報導,OpenAI的「ChatGPT-5.2 Thinking」模型在總分550分的東大理科考試中拿下503分,遠高於歷年理科錄取最高分453分;人文科則獲得452分,同樣超越434分的錄取高標。尤其在被認為難度極高的數學科,AI更直接取得滿分成績,英文得分率達九成,展現驚人的邏輯推理與語言理解能力。

更引發關注的是,這套系統在短短兩年間完成了近乎跨世代的躍升。2024年同類測試中,當時版本在東京大學各科目皆未達錄取門檻;然而到了2026年,卻已從「全線落榜」進化為足以刷新紀錄的頂尖應試者。研究團隊為其取名「Chappy」,並視其為人工智慧能力爆發的重要里程碑。

此次測試方式也更貼近真實考試環境。研究團隊並未將題目以文字形式輸入,而是直接轉換為影像資料,由AI自行辨識與解題,藉此檢驗其視覺理解與綜合分析能力。

除了OpenAI,Google旗下Gemini 3.0 Pro也參與測試,在15個主要科目中取得平均91.4分,同樣大幅超越一般考生平均表現。這顯示大型語言模型在標準化測驗中的優勢已不再是單一案例,而是整體能力的集體突破。

不過,報告也指出,AI並非在所有領域都無懈可擊。以世界史長篇論述題為例,AI僅拿下25%的分數,暴露其在人文分析、歷史脈絡理解與價值判斷上的不足。換言之,AI雖能高效處理知識型與邏輯型題目,但面對需要深層思辨與觀點建構的內容,仍存在明顯限制。

這份測試報告在日本社會引發廣泛討論。部分教育界人士認為,當AI能輕易征服知識型考試,未來教育制度勢必重新調整方向。人類的核心競爭力,將不再只是記憶與解題速度,而是判斷力、創造力,以及對AI結果進行質疑與承擔責任的能力。

從落榜到狀元,AI僅用了兩年。這場考試不只是技術展示,更像是一記提醒:當機器逐步超越人類在既有標準中的表現,真正需要重新定義的,或許不是AI的能力,而是人類未來的價值所在。

日本 人工智慧 OpenAI

上一則

墨西哥邊境州長遭美控走私毒品 自請暫時離職配合調查

下一則

伊朗油輪躲過美軍封鎖 載190萬桶石油神隱1個月 突現蹤斯里蘭卡外海

超人氣

更多 >