2023/10/19 Howie Su
近半年來,大型語言模型 (LLM) 已經成為產業熱門話題,從社交媒體到新聞再到日常對話,這些已經成為各地的熱門話題,一般而言,人工智慧泛指機器學習技術,可以生成與人類能撰寫的內容非常相似的影像、音樂和文本等內容;另一方面,大型語言模型是具有數十億參數的神經網路,經過大量文本數據的訓練,這使它們能夠理解、處理和生成類似人類的語言。
這些技術共同提供廣泛的應用、重塑不同的產業樣貌,並提高人與機器之間的互動能力。企業若能挖掘相關機會,能獲得靈感與潛在應用案例、加速業務成長、並透過快速原型設計達到產品與服務快速更迭的效果。而生成式人工智慧的額外優勢是,多數應用程式只需要很少的專業知識就能運作,且不需要進一步的模型訓練。
一、將大型語言模型連結外部數據
檢索增強生成(RAG)是一個框架,用於利用外部數據源的大型語言模型支持的系統,RAG 使大型語言模型能夠讀取在預訓練期間不會看到的數據,但這對於正確提供相關且準確的結果是必要的,RAG 透過將自然語言處理 (NLP) 能力與外部知識相結合,使 ChatGPT 等語言模型能夠為特定領域的問題提供更好的答案。
這種方法使大型語言模型在各個領域中更有效,包括問答、內容生成和取得即時數據的對話。
舉例而言,Podurama 是一款 Podcast 應用程式,它運用 RAG 來建立聊天機器人,這些機器人能夠根據用戶查詢熟練地推薦相關節目,從 Podcast 記錄中生成洞見來推薦更完整的功能。
二、將大型語言模型連接到外部應用程式
就像利用外部數據源一樣,大型語言模型可以與針對特定任務訂製的外部應用程序建立連接。當模型偶爾由於過時的資訊而不準確時,這一點尤其有價值。
例如,在詢問現任英國首相時,ChatGPT 可能會繼續提及強森,即使他已於 2022 年底離任。出現這種限制是因為模型的知識固定在預訓練期間,不包含後期訓練的知識。為了應對這些挑戰,大型語言模型可以透過「代理人」與外部環境整合來增強,這些代理應用程式可以緩解 LLM 不能獲取最新網路資訊的問題,使他們能夠使用天氣 API(用於即時天氣數據)或 SerpAPI(用於網路搜尋)等工具。
比如 Expedia 的聊天機器人,它可以帶領用戶探索並預訂酒店、回覆相關住宿的查詢,以及客製化的旅行建議。
三、連結多個大型語言模型
大型語言模型通常單獨用於大多數應用程式。然而,最近讓不同 LLM 連結的應用程式中正受到關注,它牽涉到多個大型語言模型以執行更複雜的任務。每個 LLM 都專注於一個特定的領域,他們合作產生全面和精緻的成果。
這種方法已應用於語言翻譯,連續使用大型語言模將文本從一種語言轉換為另一種語言,而像微軟這樣的公司已經提出了在資源匱乏的情況下為翻譯服務提供多個語言模型連結,進而能夠對特定單字進行更準確的判讀與上下文翻譯。在製造業中可透過連結專門的大型語言模型來優化點到點供應鏈流程,以進行需求預測、庫存管理、供應商選擇和風險評估等工作。
四、透過 ReAct 提高大型語言模型的透明度
人工智慧運作經常產生「黑盒子」,這種不透明性常常引起使用者的疑慮,極少人知道模型是如何運作的,以及是否產生潛在危害,因此,這正是理性與行動 (ReAct) 框架發揮作用的地方,ReAct 強調逐步推理,使大型語言模型能夠像人類一樣生成解決方案,目標是讓模型像人類一樣思考任務並使用語言解釋其推理。
生成 ReAct 提示是一項簡單的任務,涉及人類註釋者用自然語言表達他們的想法以及操作,因此成為讓社會大眾了解大型語言模型的重要做法。舉例而言,Khan Academy 開發名為「Khanmigo」的聊天機器人,目的在指導學生解決數學問題和練習程式碼,Khanmigo 不只是根據要求提供答案,而是透過引導學生完成推理過程來鼓勵深思熟慮地解決問題。這種方法不僅有助於防止抄襲,還能幫助學生獨立掌握概念。
資料來源:https://www.inside.com.tw/article/33102-llm-apllications