近年生成式 AI 的發展突飛猛進,但你是否會發現,在使用如 ChatGPT 等國外開發 AI 服務時,在繁體中文的表達上,有些文句似乎不太通順,甚至還有回答到一半變成簡體中文的情形,這也是國外研發 AI 多以簡體中文資料加以訓練的結果。但 AI 的開發上,臺灣並沒有缺席!今(2024)年 4 月,由臺灣推出的大型語言模型(large language model, LLM)——TAIDE(Trustworthy AI Dialog Engine)LX-7B(可商用版本),能提供內容更契合臺灣需要、更多元的服務。同時,臺灣在 AI 方面的進展,也吸引國際合作,達到科技外交,提升臺灣的國際能見度。臺灣在 AI 產業有哪些國際優勢?為何國外會想與臺灣合作?在面對中國可能透過 AI 輸出其意識形態時,臺灣又如何因應?本文訪問中研院資通安全專題中心執行長、TAIDE 計畫總召集人李育杰,請他談談臺灣在 AI 領域,如何發揮優勢,進行科技外交。
TAIDE 計畫總召集人李育杰。(圖/何宇軒攝)
臺灣與國外先進國家在 AI 領域合作,早已是現在進行式。從 2020 年至今,在臺灣與美國、德國、加拿大等國進行的部會層級科研合作協定、協議中,都有與AI有關的項目,例如國家科學及技術委員會(國科會)與德國聯邦教育及研究部(Bundesministerium für Bildung und Forschung , BMBF)在 2023 年 3 月簽署了臺德科技合作協議(Science and Technology Arrangement, STA);在今年 4 月,德國人工智慧研究中心(Deutsches Forschungszentrum für Künstliche Intelligenz, DFKI)創辦人及執行委員會首席顧問、臺德人工智慧雙邊合作計畫召集人 Wolfgang Wahlster,來臺拜會國科會吳政忠主任委員,討論臺德雙邊在人工智慧領域的合作。
德國人工智慧研究中心(DFKI)創辦人及執行委員會首席顧問 Wolfgang Wahlster 教授(左)拜會國科會吳政忠主任委員,討論臺德雙邊在人工智慧領域之合作。(圖/擷自國科會)
1953 年生、現年 71 歲的 Wahlster 是第一次來到臺灣;李育杰回顧當時的交流時表示,大家除了談生成式 AI,也談了不同的 AI 應用場域,包括德國方談到農業機具的自動化等,過程很有收穫。
為什麼其他國家要在 AI 領域與臺灣合作?李育杰認為,由於臺灣具有硬體製造的實力,當 AI 的應用需要與硬體結合時,國外廠商就很自然地想與臺灣合作。例如掃地機器人,為了確保房間中的角落都有清掃到,需要透過 AI 計算路徑,就是在生活中 AI 結合硬體的例子。而結合硬體更是確保收益的方式,當 AI 與硬體結合、變成一項產品時,變現率會高很多;因為當廠商賣出了硬體產品,有一部分收益也會來到 AI 開發者手中。假如是純軟體的服務,例如像 Google、Facebook,雖然在運作時也運用到很多 AI 技術,但若要直接向使用者收費會比較困難,主要還是透過廣告等方式獲利。
臺灣具有硬體製造的實力,當 AI 的應用需要與硬體結合時,國外廠商就很自然地想與臺灣合作。(圖/Freepik)
臺灣能吸引國際合作的另一項重要關鍵,李育杰認為,是臺灣發展的 AI,符合西方民主國家尊重隱私、保護人權的價值。反觀中國在使用 AI 時,非常不重視人權、隱私。最有名的案例就是「社會信用體系」,透過大量監視器,對違規穿越馬路的路人扣點;或是在公廁中,以節約用紙為理由,要先刷臉辨識之後才提供衛生紙;他也曾遇過有中國醫院把醫師與病人間的對話都錄音下來,以訓練 AI 問答,他認為這都是傷害人權的〉做法。用上述的方式發展 AI,與經濟合作暨發展組織(Organisation for Economic Co-operation and Development, OECD)國家所堅持的人權價值,完全背道而馳。
談到臺灣開發 TAIDE 的初衷,李育杰認為,這與以中國為主的簡體中文環境帶來的挑戰有關。就以日前推出 ChatGPT 服務的美國公司 OpenAI 為例,它的訓練資料是透過大量的網路爬蟲來獲取,但因為臺灣與中國在幅員、人口比例、網站數量上,原本就有相當大的差距,來自臺灣的資料,能夠進到 OpenAI 的訓練資料庫的比例,相對少很多,結果就是 ChatGPT 在中文環境下的回答語氣、用詞、語感等方面,都會與中國的習慣比較接近。
更進一步來說,中國發展這類的大型語言模型已經有一段時間;在 ChatGPT 推出不久,百度也推出了「文心一言」。李育杰直言,看到現在臺灣的抖音用戶一直在增加,假如之後臺灣人也都去用文心一言,「那中國除了知道臺灣人在想什麼,還會(透過 AI)告訴你怎麼做,這不是一件很恐怖的事嗎?」
另一方面,也有人認為,因為中國比較不注重人權、隱私,所以在訓練資料的取得上,會比民主國家來得「便利」。但李育杰認為,雖然臺灣與西方國家在發展 AI 時,更注重隱私,看起來似乎有難度,但這其實是「短空長多」,長期會更有利;原因在於,為了要保障隱私、保護資料不被任意流通, AI 演算法在設計上,就必須更完善、更有智慧。
臺灣能吸引國際合作的另一項重要關鍵,是臺灣發展的 AI,符合西方民主國家尊重隱私、保障人權的價值。(圖/Freepik)
李育杰也認為,中國發展 AI 的另外一項挑戰,來自言論審查。因為在使用生成式 AI 時,很難事先預料產生的結果,因此生成的內容,可能會違反中國的言論審查機制,這讓中國必須花更多成本,對 AI 生成的內容進行審查,甚至加以限制民間的使用範圍。
回到 TAIDE,又能在國際間給臺灣帶來哪些能見度?李育杰表示,例如運用在翻譯、中文學習方面時,TAIDE 的訓練資料,除了語料庫本身就是正體中文,其中的素材本身也與臺灣高度相關。例如取得公共電視的 Taiwan Plus 中,以臺灣為內容主體的英文節目,來加以訓練 AI,這就讓 TAIDE 能夠對全世界介紹臺灣,或進一步來作像是規劃臺灣旅遊等用途時,能夠提供更可靠的服務。
國科會舉辦「TAIDE成果發表會」,產學研界代表出席深表肯定。(左起)人工智能張榮貴董事長、Google DeepMind 紀懷新博士、中央研究院孔祥重院士、國科會吳政忠主委、國科會科技辦公室沈弘俊執行秘書、國科會科技辦公室楊佳玲執行秘書、TAIDE 計畫總召集人李育杰教授。(圖/擷自國科會)