為了快速且正確地解答農業難題,飽讀學術論文的生成式 AI「神農 TAIDE」,在中興大學團隊開發下於今(2024)年 5 月上線。「言之有物、文有所本」是其特色,也顯現生成式 AI 正逐步從模糊走向聚焦、專業與客製化的趨勢。
神農 TAIDE 架構。(圖/神農TAIDE)
「神農 TAIDE」 由中興大學智慧永續新農業研究發展中心團隊開發,出發點是農業專業學者希望掌握全球日新月異的農業知識,因此運用 AI 科技研發的資訊管理系統。使用的技術包括了文件檢索模型(Neural Dense Retriever)、萃取式閱讀模型(Extractive Reading Model),在 2023 年 4 月 TAIDE 面世後也加入其中。
「這就像我給你一本書,你回答問題時可以 Open Book,而且要附上出自哪一頁。」相較於「ChatGPT」的生成方式等同看完一本書並闔上以後憑印象作答,因此有時會憑空產生有如「幻覺」的文字,可能帶來錯誤資訊的風險,「神農 TAIDE」 的工作方式則是先由萃取式閱讀模型從檢索與萃取知識庫內容「劃重點」,再由 TAIDE 據此過濾和摘要內容後生成為文字,而附上出處更是為了方便使用者取得進一步知識。
「這就像我給你一本書,你回答問題時可以 Open Book,而且要附上出自哪一頁。」(圖/蔡雨婷攝)
「這不是個農業問題!」若是向「神農 TAIDE」 輸入無關農業的問題,將得到「神農 TAIDE」 的無情拒絕,同時表態專業的角色,因為「神農 TAIDE」 的設計宗旨是為使用者提供真正有用的農業資訊,而不是空泛的回答。
團隊成員資訊工程學系范耀中老師解釋說,目前許多民眾對於生成式 AI 多有「聊天機器人」的想像,但事實上,為了做好知識管理系統的任務,「神農 TAIDE」屬於封閉式系統,只會根據資料庫內容生成文章,因此只能回答農業知識,反言之,使用者輸入的任何問題,也不會「污染」、「教壞」它。因為目前設計就是只讓「神農 TAIDE」閱讀農業部的典藏和資料,及中興大學碩博士論文等農業文獻與專業資料。
「很抱歉,這不是個農業問題,神農 TAIDE 身為一個針對農業知識問答強化的語言模型,無法處理這樣的問題。」(圖/神農 TAIDE)
「神農 TAIDE」 團隊已規劃下一步擴展資料庫,涵括國內各大學的農業學術論文與紙本書典藏。後台則會增強功能,可以看到使用者查詢記錄,除了常見的種植技術、疾病防治等農業知識外,「神農 TAIDE」觀察到還有超出傳統範疇的詢問,例如農業政策、空拍機等智慧機具的使用,還有居家園藝等也是使用者感興趣的,未來這也可能成為評估納入的資料。
在技術部分,計劃進一步擴展閱讀表格的能力,以納入更多統計與各地不同的種植數據。此外還計畫擴充辨識語音、圖片的功能,預估能讓使用者更方便發問。另外「多輪對話」也是范耀中想要開發的新功能,這將讓神農 TAIDE 能讓使用者透過反問、追問的過程,共同找到更適切的解答,甚至協助媒合適合的機構協助處理問題。
目前「神農 TAIDE」 雖然可在網路上搜尋並發問,但尚未廣泛地被青年農民使用,范耀中直言「神農 TAIDE」還不能算是完全落地,除了上述的的功能升級外,更需要相關部門的推廣,在更多使用者操作後提供更多反饋,才能進一步協助「神農 TAIDE」 「成長」。目前有些新南向國家經交流後表示有意仿效,范耀中樂觀其成,但認為較可行作法會是借用「神農 TAIDE」 的架構,再以當地農業知識發展出各自版本。
神農 TAIDE 未來將擴充辨識語音、圖片的功能,預估能讓使用者更方便發問。(圖/Freepik)
范耀中預估,生成式 AI 走向專業化是必然。這不僅是 TAIDE 與 ChatGPT 的不同之處,也是國內 AI 發展的未來趨勢。范耀中指出,目前國人將 TAIDE 視為「臺灣的 ChatGPT」,其實兩者的資料庫大小與算力等級不同,不適合這樣的比較。他更指出,目前生成式 AI 的使用者、即便是具備資工背景,普遍最在乎「怎樣下指令」,若 AI 給的結果不如預期,通常認為是自己給的指示不夠正確。但他認為,應該跳脫迷思,除了適應如何使用市面上既有生成式 AI 外,資工人更發揮長才,協助百工百業調教出專業專屬的 生成式 AI ,從而提供更多的協助與運用。
尤其 TAIDE 的特色在於理解臺灣文化與繁體中文,且是開源資源,能讓其真正發揮特長的作法在於進行再開發、訓練,鼓勵各界根據不同領域的需求,打造專業且具特色的語言模型,才能進入百家爭鳴的時代。
中興大學資訊工程學系范耀中老師。(圖/蔡雨婷攝)