日本東大入學考 AI進化2年從落榜變狀元 碾壓人類考生
人工智慧的進化速度,再次刷新外界對科技能力的想像。東京人工智慧新創公司LifePrompt近日發布一項震撼性報告,OpenAI旗下最新模型「ChatGPT-5.2 Thinking」在2026年度東京大學與京都大學入學考試模擬測驗中,不僅全數達標,更以壓倒性分數超越所有人類考生,被外界形容為「AI版東大狀元」。
日經新聞報導,OpenAI的「ChatGPT-5.2 Thinking」模型在總分550分的東大理科考試中拿下503分,遠高於歷年理科錄取最高分453分;人文科則獲得452分,同樣超越434分的錄取高標。尤其在被認為難度極高的數學科,AI更直接取得滿分成績,英文得分率達九成,展現驚人的邏輯推理與語言理解能力。
更引發關注的是,這套系統在短短兩年間完成了近乎跨世代的躍升。2024年同類測試中,當時版本在東京大學各科目皆未達錄取門檻;然而到了2026年,卻已從「全線落榜」進化為足以刷新紀錄的頂尖應試者。研究團隊為其取名「Chappy」,並視其為人工智慧能力爆發的重要里程碑。
此次測試方式也更貼近真實考試環境。研究團隊並未將題目以文字形式輸入,而是直接轉換為影像資料,由AI自行辨識與解題,藉此檢驗其視覺理解與綜合分析能力。
除了OpenAI,Google旗下Gemini 3.0 Pro也參與測試,在15個主要科目中取得平均91.4分,同樣大幅超越一般考生平均表現。這顯示大型語言模型在標準化測驗中的優勢已不再是單一案例,而是整體能力的集體突破。
不過,報告也指出,AI並非在所有領域都無懈可擊。以世界史長篇論述題為例,AI僅拿下25%的分數,暴露其在人文分析、歷史脈絡理解與價值判斷上的不足。換言之,AI雖能高效處理知識型與邏輯型題目,但面對需要深層思辨與觀點建構的內容,仍存在明顯限制。
這份測試報告在日本社會引發廣泛討論。部分教育界人士認為,當AI能輕易征服知識型考試,未來教育制度勢必重新調整方向。人類的核心競爭力,將不再只是記憶與解題速度,而是判斷力、創造力,以及對AI結果進行質疑與承擔責任的能力。
從落榜到狀元,AI僅用了兩年。這場考試不只是技術展示,更像是一記提醒:當機器逐步超越人類在既有標準中的表現,真正需要重新定義的,或許不是AI的能力,而是人類未來的價值所在。

