LLM 成本太高!「SLM」小型語言模型將成為企業 AI 應用新寵

此篇文章深入探討了企業在應用生成式 AI 方案時,面臨的成本、效能與可行性等問題,特別聚焦於「大型語言模型」(LLM, Large Language Model)與「小型語言模型」(SLM, Small Language Model)的比較與應用情境。

文章首先指出,自從 ChatGPT 等 LLM 問世後,各大企業紛紛投入資源開發自主 AI 系統,因為 LLM 擁有龐大的參數量與強大的語言處理能力,能夠執行複雜且細緻的任務。然而,LLM 也帶來高昂的成本和運營挑戰。根據 Info-Tech 於 2024 年的調查顯示,企業在選擇生成式 AI 解決方案時,最重視的因素包括隱私與安全(65.43%)、成本效益(59.57%)以及準確性和可靠性(57.71%)。然而,LLM 在這些方面存在明顯短板:

  1. 高昂的成本:文章指出,訓練和維護 LLM 需要大量的運算資源、高速網路和記憶體,導致整體成本極為可觀。例如,Forrester 的分析師 Rowan Curran 指出,先進 LLM 的訓練成本可能高達數百萬美元。此外,LLM 應用程式的訂閱費用也持續上升,例如 OpenAI 推出的 Pro 計畫月費高達 200 美元。
  2. 準確性與可解釋性問題:LLM 雖然強大,但其生成的內容不一定能完全符合企業需求。文章引用 SaaS 平台 Responsive 執行長 AJ Sunder 的觀點指出,LLM 常被視為「黑盒子」,使用者難以理解模型是如何產生特定回應的,這對需要高準確性和可追溯性的企業領域是一大隱憂。

鑑於這些挑戰,文章提出「小型語言模型」(SLM)作為一種更具成本效益、靈活性與可控性的解決方案。SLM 的主要優勢包括:

  • 專業化與資料隱私:SLM 通常針對特定領域進行訓練,能更精準地處理專業領域需求。此外,SLM 可以部署在企業內部的防火牆環境中,確保資料隱私不被外洩。
  • 高效能與可解釋性:由於 SLM 專注於較小的任務範疇,其輸出結果更容易被解釋,特別適合對可追溯性要求較高的行業,如金融與醫療。
  • 成本低、部署靈活:SLM 的模型規模較小,不僅運算速度更快,對硬體需求也更低,使其可以部署在個人電腦或手機等終端設備上,甚至能在離線環境中運行,增加工具的可用性與普及率。

文章也提到,2024 年起,許多科技巨頭已開始投入 SLM 的開發。舉例來說:

  • 微軟推出的「Phi-3」小型語言模型,專為執行簡單任務設計,降低了資源有限企業的進入門檻。
  • Meta 正積極開發與手機設備相容的 SLM,旨在減少推理過程中的能耗,同時提升效能。
  • 蘋果則專注於開發「OpenELM」模型,希望能在筆電與智慧型手機等消費性電子產品上順暢運行。

文章強調,SLM 並不是 LLM 的替代品,而是補充。在實際應用場景中,企業可以根據需求靈活選擇 LLM 和 SLM 的組合。例如,LLM 可以用於提供廣泛的背景知識,而 SLM 則適合負責精準執行特定任務。這種混合使用的模式能最大化 AI 的效益,同時降低成本與風險。

最後,文章引用 IDC 的預測指出,2025 年企業將因應不同場景需求,更加靈活地運用 SLM。同時,未來也有望出現新的「大世界模型」(LWM, Large World Model),進一步豐富 AI 生態系。文章總結認為,多模型並行應用將成為未來企業發展 AI 的主流趨勢。

全文閱讀請至: https://fc.bnext.com.tw/articles/view/3786?

Related posts