AI大模型術語「Token」譯名爭論不休 官方終於定名了
AI中文為人工智能,AI工具又被稱為「大模型」;大模型中的術語Token該如何翻譯,爭論已久。中國政府網24日轉發人民日報援引自國家數據局的文章顯示,「我們日均詞元調用量突破140萬億」,正式將Token的中文名譯為「詞元」。
香港01報導,Token該如何命名?爭論已久。根據國家數據局發布的數據、人民日報發布、中國政府網轉發,官方政府機構與官方媒體雙重發布,現在統一將Token稱為「詞元」。
此前騰訊研究院發表的文章中,清華大學教授楊斌提出將「模元」這個詞作為「token」的中文譯法,他表示,其中「模」意為大模型、多模態,錨定AI場景的核心屬性;「元」代表最小基本單元,承續「字節」這類中文經典度量單位的命名邏輯,簡潔直白、通俗易懂。
楊斌的這一建議,立刻引發各路AI界人士在社交平台和行業群組中紛紛給出自己的答案,除了「模元」外,「智元」這個名字浮出水面,並迅速獲得廣泛認同。
新加坡國立大學校長青年教授、潞晨科技創始人尤洋表示,「Token中文叫做『智元』,不知道『新智元』創始人是不是時空穿梭回來的。」
自由學者、原清華大學科學史系副教授胡翌霖則提出,「真不如『智元』。計算機的單元是字節,Token是人類智識的計算單元。Token不是通用計算的概念,是『通用智能』的概念,『智』比『通』更切中要害。」百川智能創始人王小川表示,「叫做『智元』挺好的。」資深開源人士陳緒也稱,「這幾天提出各種x元,就覺得『智元』能打動我,符合信達雅的要求。」
最終,官方給出定論,正式譯名為「詞元」。據人民網的解釋,「詞元」是AI理解人類語言的最小單位,Token切分出的單位有時是字,有時是詞,而詞更能覆蓋這種範圍。
另據極目新聞報導,根據國家數據局,截至今年3月,中國日均Token調用量超140萬億,比2024年初增長超千倍。國家發展改革委黨組成員、國家數據局局長劉烈宏表示,日均Token調用量的大量增加,充分表明中國的人工智能發展進入了快速增長階段,應用場景在不斷深化,從能對話到能決策執行的智能體,中國人工智能產業的競爭力也顯著增強。
