台版ChatGPT TAIDE可寫作 中研院擬開放資料提供訓練
中研院與國科會等單位合作推台版ChatGPT「TAIDE」,國科會主委吳政忠表示,最快今年4月中釋出商用TAIDE-7B開放業者用於研發,屆時有望將TAIDE模型內建於電腦、手機等裝置內。中研院長廖俊智20日在立院答詢時則提到,為豐富繁體中文版ChatGPT資料庫,將努力排除法規限制,盡可能開放院內資料提供ChatGPT語言模型訓練。
國際大型語言模型(LLM)時常產生偏誤或不符本土文化的回應,國科會於去年4月啟動TAIDE計畫,欲打造台灣專屬大型語言模型,目前已開發商用版本TAIDE-7B,以及學研用版本TAIDE-13B模型。
國科會提供媒體實測,由TAIDE-13B試寫學測國文寫作題,進而撰寫具備起承轉合的文章;現場亦由媒體出題,由TAIDE撰寫邀訪信。
國科會副執行秘書楊佳玲表示,國際上訓練LLM時,中文仍以簡體資料庫為主,內容便容易偏離台灣文化和價值觀,因此台灣必須打造自己的大型語言模型。
楊佳玲說,目前TAIDE-13B在撰寫文章、信件、摘要、中翻英以及英翻中時,表現已和ChatGPT3.5相當,且擁有更豐富的在地知識。
廖俊智昨赴立院業務報告時,立委陳秀寶提到,生成式AI需要大量資料做訓練,但現階段繁體中文的資料庫遠少於簡體,加上抖音、小紅書,讓台灣學子接收大量簡體中文,擔憂繁體中文未來會淪為弱勢,要求中研院協助整合繁體中文的語言資料。另有立委關心台灣AI立法進度。
廖俊智表示,台灣AI立法精神應該是「以人為本」,為豐富繁體中文版ChatGPT的資料庫,會在不違智財權法規的限制下,盡量開放中研院資料庫訓練AI。
FB留言