LLM 成本太高!「SLM」小型語言模型將成為企業 AI 應用新寵

此篇文章探討了「小型語言模型」(SLM)如何成為企業在AI應用中日益重要的選擇,尤其是在「大型語言模型」(LLM)面臨高成本、效能不穩和隱私問題的背景下。自從ChatGPT等大型語言模型問世以來,企業對這些模型的需求大幅增長,認為更多的參數能帶來更好的效能。然而,隨著成本問題的加劇和準確度的不足,企業開始尋求替代方案,而SLM則因其高效能與低成本的優勢,成為新一波的AI應用趨勢。

首先,文章指出,LLM的主要局限之一就是成本過高。在訓練和管理這些大型模型時,企業需要耗費大量的計算資源、存儲空間以及高速網路,這使得這些模型的應用成本相當高昂。調研機構Forrester的分析師指出,先進的語言模型訓練成本超過數百萬美元,而最近如OpenAI等競爭者也提高了服務訂閱價格,這對於許多企業來說無疑增加了財務負擔。

此外,作者還提到,LLM的準確度和可靠性也存在問題。雖然這些模型具備強大的處理能力,但在生成的回答上,有時會偏離企業的實際需求,並且其「黑盒子」的特性使得答案的來源和推理過程無法被完全解釋,這對於需要確保準確性和一致性的行業來說,可能帶來重大隱憂。

相比之下,SLM因其針對特定領域訓練的特性,能夠提供更精確的結果,特別是在專業領域的應用上。本文強調,SLM能夠有效處理一些特定任務,且由於模型較小,運行速度更快、對硬體的需求較低,這使得它不僅能安裝在普通的個人設備上,還能在離線狀態下繼續運行,這對於無法持續連接網路的場景來說尤為重要。

此外,SLM還具有較高的數據保護性。由於這些模型通常在封閉環境中運行,企業資料不會輕易外洩,這在涉及敏感資料的行業中,尤其受到青睞。這使得SLM在處理需要高度隱私保護的任務時,比LLM更具吸引力。

大型科技公司如微軟、蘋果和Meta都已經開始投入SLM的研發,推出了多款小型語言模型。例如,微軟的Phi-3被設計用於執行簡單任務,使資源有限的企業也能使用;Meta則研發了一款與手機設備兼容的小型語言模型,旨在降低能耗並提升推理效能;蘋果的OpenELM則聚焦於筆記型電腦和智慧型手機的AI應用。

儘管SLM與LLM有不同的應用場景,兩者並不互相排斥。企業可以根據具體需求採取混合方式,將LLM用於提供廣泛的背景資訊,並使用SLM來確保任務的精確執行。這樣的方式將使企業在AI應用中獲得更多的靈活性,能夠根據不同場域的需求來選擇最適合的AI模型。

最後,根據IDC的預測,隨著企業需求的多樣化,SLM將在未來的AI應用中發揮更大的作用,並且大世界模型(LWM)將成為未來的發展方向,意味著多模型的應用將成為企業AI發展的新常態。

總結來說,本文展示了SLM作為一種成本效益高且靈活的解決方案,在企業AI應用中的潛力。隨著企業越來越重視數據隱私、成本控制以及模型準確性,SLM將在未來的AI發展中扮演舉足輕重的角色。

閱讀完整文章: https://fc.bnext.com.tw/articles/view/3786?

Related posts