AI取代章魚哥成世界盃預測利器 這3國最被看好
今年世界盃足球賽是生成式人工智慧(AI)聊天機器人普及後首屆比賽,球迷和研究人員紛紛試用這類系統來預測冠軍,熱潮堪比2010年世足賽的章魚哥保羅(Paul the Octopus)。
法新社報導,OpenAI的聊天機器人ChatGPT是在2022年11月30日對大眾推出,當時除了矽谷之外很少人關注生成式AI,且那時上屆世界盃比賽正在卡達(Qatar)如火如荼進行。如今從銀行到大學,各類不同機構都在測試生成式AI系統對足球賽的預測能力。
例如美國銀行(Bank of America)的分析師用微軟(Microsoft)的Copilot預測,結果西班牙和法國最被看好。美國科技產品消息網站Tom's Guide用Google(谷歌)的Gemini、ChatGPT及Perplexity預測,全都是西班牙奪冠機率最高,其次是法國。
另個美國新科技情報網站Decrypt則發現,用ChatGPT和Anthropic的Claude等西方開發的聊天機器人預測,得到類似上述結果;但用中國開發的聊天機器人DeepSeek和Qwen,卻都預測冠軍會是阿根廷。
德國慕尼黑大學(LMU,Ludwig Maximilian University Munich)的研究人員進行更科學的分析,他們用各個AI模型對每場比賽進行預測,並將所有準確度數據公布在1個名為「大型語言模型足球場」(LLM SoccerArena)的網站。
這群研究人員除了測試AI根據其既有知識所做的預測,還測試AI把在網路上搜尋到的相關資訊加入預測的能力,例如球員傷勢、出賽陣容甚至賭盤數據等。
慕尼黑大學管理學研究人員費爾里格爾(Stefan Feuerriegel)透過聲明解釋,現實生活中遇到要做決定的情況,語言模型是否能提供可靠的支援,這個問題至關重要。
他進一步表示:「這也是為何我們需要的基準不只測試過抽象任務,還測試過對於動態資訊、不確定性及日後能(與實際結果)相驗證等情形,AI模型會如何因應。」
報導指出,這是生成式AI聊天機器人普及後的首屆世界盃,球迷、媒體與研究人員都開始用它們預測冠軍,熱度幾乎重現當年章魚哥保羅的話題效應。 美國銀行以Copilot預測,Tom's Guide則用Gemini、ChatGPT與Perplexity測試,結果大多一致看好西班牙,其次是法國,顯示多數西方模型對這兩隊評價最高。 研究團隊不只看模型憑既有知識的預測,還測試它能否納入即時網路資訊,例如傷兵、先發陣容與賭盤數據,以評估AI面對動態、不確定情境時是否可靠。精華 FAQ
