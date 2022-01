江天琪愛好音樂吹黑管。(學生提供)

當選2022雷傑納隆學者(Regeneron STS Scholars)意義非同尋常,少年學子們需要克服疫情 帶來的壓力和風險,完成課業學習,投入項目實驗。江天琪(Theodore Jiang)研究如何破譯遺傳變異語言模型,不僅膺選雷傑納隆學者,也被麻省理工學院(MIT )提前錄取。

江天琪(Theodore Jiang)是洛杉磯Palisades Charter高中學生,獲獎項目「破譯遺傳變異的語言:使用轉換器語言模型來識別與人類遺傳疾病和癌症 相關的致病性錯義突變」(Deciphering the Language of Genetic Variants: Using a Transformer-Based Language Model to Identify Pathogenic Missense Mutations Associated With Human Inherited Diseases and Cancer),但外行人很難理解。

江天琪膺選雷傑納隆學者同時被麻省理工提前錄取。(學生提供)

江天琪解釋,錯義突變(missense mutation)是導致蛋白質序列中氨基酸被替換的點突變。目前,錯義突變約占導致人類遺傳疾病的已知變異的一半,但準確預測錯義變異的致病性仍然具有挑戰性。在這個領域中,江天琪參與研發一種新的語言模型MutFormer,用於預測致病性錯義突變。

他說,人們對MutFormer語言模型,進行了關於參考蛋白質序列和由常見遺傳變異產生的替代蛋白質序列的訓練,他和研究團隊的同事們測試了用於致病性預測的不同的微調方法。最新研究結果表明,MutFormer語言模型在錯義突變的致病性預測方面,優於現有工具。MutFormer語言模型和預先計算的變體分數,可以在GitHub上公開獲得。

江天琪愛好運動高山滑雪。(學生提供)

江天琪指出,在COVID-19大流行下,參加科學研究比之前艱難得多。然而,他非常榮幸能夠入選享有盛譽的STS學者,這種認可進一步激勵自己繼續研究MutFormer語言模型。因為目前的研究仍然是概念證明,MutFormer的最終目標是成為蛋白質語言模型,爭取能夠預測從蛋白質功能到蛋白質結構的特性。

如同其他優秀的高中畢業生一樣,江天琪透過「提前行動計畫」(Early Action)申請麻省理工學院(MIT)並且順利錄取。他預期的大學專業是生物工程,畢業後希望從事醫學研究。不過在整個大學期間,他對未來的職業生涯仍保持開放的態度。