TAIDE台灣大型語言模型釋出!TAIDE如何下載、有哪3大特色?

2024-05-06 | 國科會、TAIDE官網

「TAIDE」來了!結合台灣文化的大型語言模型TAIDE有哪些特色?如何下載與使用?未來城市為你整理。

認識TAIDE:

  • TAIDE是什麼?
  • TAIDE有哪些特色?
  • 如何下載TAIDE?
  • TAIDE有哪些應用?

2022年,OpenAI推出大型語言模型「ChatGPT」,使用者能透過對話,從ChatGPT獲得解答;今年四月,台灣也推出台版繁中、納入台灣文化的聊天機器人TAIDE(Trustworthy AI Dialog Engine)。

國家科學及技術委員會主委吳政忠15日宣布,開源釋出可商用的TAIDE-LX-7B模型。未來,政府發展生成式AI模型時,TAIDE能提供更多元的服務,並幫助企業、學校、研究等機構導入生成式AI。

TAIDE-國科會-AI應用-AI-生成式AI-大型語言模型-人工智慧-台灣AI-科技-聊天機器人-AI-人工智慧-TAIDE怎麼用-TAIDE使用-TAIDE下載

吳政忠表示,國科會經過一年的努力,推出兼具台灣文化與繁體中文的TAIDE。圖片來源:國科會

TAIDE是什麼?

TAIDE是台灣第一個本土AI引擎,過去,大型語言模型常以簡體中文的文本訓練,欠缺繁體中文資料,並常出現偏誤。所以,國科會透過TAIDE計畫,完成能呼應本土化需求,並確保生成式AI的可信任性和適用性的大型語言模型。

TAIDE團隊指出,TAIDE能實現五大目標:

  1. 專為台灣訂製
  2. 多元化訓練素材
  3. 奠定應用基礎
  4. 健全AI發展環境
  5. 公私協力創造雙贏

此外,TAIDE也能提高台灣的資訊素養、資訊安全與防禦能力,並防堵假消息與認知作戰。

還有哪些大型語言模型?

除了TAIDE,還有哪些大型語言模型?它們能做到哪些事?點擊以下連結,未來城市帶你認識:

  1. OpenAI ChatGPT
  2. Microsoft Copilot
  3. Google Gemini

TAIDE有哪些特色?

TAIDE是台灣第一個本土AI引擎,最大的特色在於:

  1. 繁體中文文本生成能力
  2. 內容具有台灣特色
  3. 強調可信任性

國科會說明,TAIDE與其他大型語言模型不同之處,在於TAIDE-LX-7B模型有繁體中文的文本生成能力;TAIDE在Meta Llama-2-7B的基礎上,再補充繁中字元、字詞,讓文本能更精準、流暢且具台灣特色。

國科會-AI應用-AI-生成式AI-大型語言模型-TAIDE-AI-人工智慧-TAIDE怎麼用-TAIDE使用-TAIDE下載

當使用者詢問違反台灣法律的問題時,TAIDE會以台灣法規說明並建議。圖片來源:截自國科會影片

為了實現TAIDE的可信任性,訓練的文本資料都是合法授權的文本、數據。

大型語言模型團隊為了獲得大量、高品質的訓練資料,常從書籍、新聞報導取得可靠素材;不過,不少大型語言模型沒有獲得授權,常有違反智慧財產權的疑慮。例如,Gemini擅用媒體內容,被判違反歐盟規定,處以2.5億歐元(約新台幣87億元)罰款;《紐約時報》則指控OpenAI擅用報導內容。

而TAIDE則從各政府部會合法取得各類資料。今年三月,中研院院長廖俊智也在立法院說明,中研院盡力排除法規限制,積極開放中研院資料、加速訓練TAIDE,讓資料庫更豐富。

目前,TAIDE有自動摘要、寫信、寫文章、中翻英與英翻中等五大功能,且測試分數與GPT 3.5模型接近;TAIDE也能多輪問答並排除不恰當回應,持續透過使用者指令,提供使用者更確切的答案。

國科會-AI應用-AI-生成式AI-大型語言模型-TAIDE-台灣AI--AI-人工智慧-TAIDE怎麼用-TAIDE使用-TAIDE下載-ChatGPT

AIDE與GPT 3.5模型的測試分數接近,平均分數甚至更高,成效優異。圖片來源:截自國科會影片

如何下載TAIDE?

想立刻使用TAIDE嗎?可按照以下步驟開始體驗:

  1. 進入TAIDE官方網站
  2. 點入「TAIDE模型」連結
  3. 進入頁面中的Huggingface連結下載
  4. 完成後即可開始使用TAIDE

TAIDE有哪些應用?

政府與企業能在專屬需求與領域下,應用TAIDE對話模型。目前,TAIDE已有以下應用:

  1. 農業知識檢索系統「神農TAIDE」:中興大學團隊開發的「神農TAIDE」,使用者可利用轉換後的TAIDE模型,過濾並摘要準確的農業知識,且可減少查詢資料的新苦;此外,使用者不必付費查詢,也可減少費用。
  2. 台英語對話機器人:台南大學將TAIDE模型導入中、小學生的台語教學,不僅結合本土語言教材,也適合全球中、小學生學習多元化語言。2024年,台英語對話機器人已在日本、馬來西亞、香港及台灣進行場域驗證。
  3. 台客語TAIDE大語言模型、語音AI介面:陽明交大團隊讓電腦具備華台客英語聽說讀寫,並能翻譯口譯成多國語言,包括英、日、印尼、越南語等能力,也能進行即時任意對話。
  4. Kuwa GenAI OS:這是本土開發且開放源碼的新一代生成式AI應用平台。高雄大學運用預載的TAIDE模型,讓個人及各行各業都能輕鬆在地端使用TAIDE生成式AI服務或開發創新應用。
  5. aiDAPTIV+平台:群聯獨家專利研發的平台已與TAIDE模型驗證整合;此外,此專案攜手十家以上的國際電腦大廠聯手,推出平民化的生成式AI地端運算平台,大幅加速台灣及全球的生成式AI應用普及。
  6. 叡揚資訊查詢知識庫:叡揚資訊在不同產品間整合TAIDE模型,讓使用者以直白語句查詢知識庫;此外,公文系統提供自動例稿生成,提高公文撰寫效率。
  7. AI CUP競賽報告檢查系統:教育部推出基於TAIDE的AI CUP競賽報告檢查系統,此系統將自動審查參賽報告,確保符合學術標準。過去,只有前25%報告進行實質審查;現在,透過TAIDE技術,所有報告均獲全面審查,能提升報告品質、加強競賽的公平性與專業性。此系統未來也能提供其他教育競賽使用,作為文件檢核的參考模型。

資料來源:https://futurecity.cw.com.tw/article/3407

Related posts