整理包／2024 AI 大趨勢！AI 語言模型大車拚微軟會笑到最後？GPT4、Gemini、Phi-2、Llama 2 比一比

2023/12/27 范熒恬整理

微軟、Google、Meta、AWS 等業者在AI大模型研發競爭激烈，所謂大型語言模型（LLM）是什麼呢？微軟近期推出的小型語言模型（SLM）Phi-2的評測報告，聲稱大贏對手，Google、微軟、Meta 分別推出了 Gemini、Phi-2、Llama 2 ，他們之間有什麼不同？今天《經濟日報》帶你一起了解，2024年AI趨勢的大預測，以及這些AI語言模型有何不同。

2024 AI趨勢有哪些？AI 大預測一次看
根據科技媒體TechCrunch預測，明年AI將出現以下8大趨勢：

1.OpenAI 成為一家產品公司

2.代理、生成影音和生成音樂「大眾化」

3.混合小模型可能更有優勢

4.很多公司會放棄大規模應用AI

5.蘋果將加入戰局

6.人工智慧濫用致法律案件發生

7.新的AI合規行業將誕生

8.2024年美國選舉是一場混戰 AI火上添油

大語言模型戰國時代

NVIDIA（輝達）於12月發布對於2024年的預測，提到AI將成為新的太空競賽。而近來在大語言模型產業領域，呈現私有模型與開源模型陣營之爭。

私有模型：如OpenAI的ChatGPT商用版，提供企業端以串接API（應用程式介面）方式使用，企業需將自身數據上傳，並按照用量付費。

開源模型：基於免費取用、可修改程式原始碼原則，企業端可自由用於開發使用，代表性的開源模型包括臉書母公司Meta推出的Llmma 2、新創Hugging Face的BLOOM等。

大型語言模型（LLM，Large Language Model）：基於大量資料進行預訓練的超大型深度學習模型。基礎轉換器是一組神經網路，這些神經網路由具有自我專注功能的編碼器和解碼器組成。
文字導向 LLM 適用於各種自然語言處理工作，包括生成文字、機器翻譯、生成文字摘要、回答問題，以及建立可與真人對話的聊天機器人。LLM 也可以使用其他類型的資料進行訓練，包括程式碼、圖片、音訊、影片等。

大型語言模型有哪些優點？LLM 是透過大量資料預先訓練而成，可訓練來執行各種工作（諸如：文字生成、摘要和翻譯），因此相當靈活有彈性。由於這類模型可針對特定工作進行微調，如此一來可能提高效能，因此擴充性也非常高。

科技巨擘AI語言模型大比拚
微軟（Phi-2）

微軟（Microsoft）近日發表效能優於Google Gemini Nano 2的Phi-2語言模型，公司表示「Phi-2只有27億個參數，在多個總合基準上，表現比70億參數的 Mistral 和130億參數的 Llama-2 都還要好。」（Mistral 是法國新創AI公司的產品，Llama-2是臉書母公司 Meta 的模型。）

11月21日年度發布會，微軟以Copilot為核心提出眾多服務，Microsoft 365 Copilot企業版開始推出，並將推出AI助手Microsoft 365 Chat。微軟使用者可以直接在瀏覽器中直接使用GPT4、DALL E 3，而不用訂閱GPT Plus。

微軟研究部門12月中發表的小型語言模型（SLM）Phi-2 評測報告，以「小語言模型的驚人力量」為題，指出 Phi-2在各類測試中展現良好理解與聽懂語言的能力，表現勝過是它25倍大的其他對手模型。GPT、或是 Google 的 Gemini 等人工智慧（AI）系統，是使用大型語言模型（LLM）。SLM 跟他們不同，是以較少的參數、較少的電腦運算來運作。這樣的小型AI模型，雖然不能生成 LLM 那麼多的人工智慧，對於特定的任務，卻是很有效率。

Phi-2的訓練素材和Phi-1同樣基於「教科書等級」的概念，包含了特別創建的合成數據集，包括科學、日常活動、心靈理論等，並進一步篩選具有教育價值和內容質量的網絡數據擴充訓練語料庫。並將參數量從13億擴大至27億。

Google（Gemini）

谷歌（Google）12月6日推出自家的生成式AI模型「Gemini」，迎戰問世一年多的ChatGPT，然而發布才過一天，外界已經開始質疑谷歌展示的性能有「粉飾、造假」之嫌。歐新社
Google 12月6日推出新的生成式AI模型「Gemini」，將首度可直接在手機上運作，據金融時報報導，Google將Gemini形容為該公司「最大、最有能力、最通用」的AI系統，可分析影像和聲音資訊，並且具有複雜的推理和「規劃」能力。它從12月6日開始驅動Google的Bard聊天機器人，從明年起更廣泛地整合入Google的搜尋引擎中。

Gemini的其中一個版本「nano」，是專為在行動裝置上運作而設計的，而且將整合到Google最新的Pixel手機中。Google表示，這會在手機上「原生運作」，而nano模型是針對手機而優化的，因此Android開發人員能夠輕鬆地打造離線使用的AI應用程式（App）與功能，或者把個人資訊更加良好地儲存在私人手機中。」

Gemini號稱多項測試超越OpenAI的GPT4模型，而Gemini Nano 2是 Google 押注多模型 LLM，所發表的最新一款可在本地運作的AI系統，預計要取代 Google大部分服務中的 PaLM-2。

Bard Advanced
「Gemini 」正式上線時，Google 也同步說明將以Gemini Pro形式整合至人工智慧服務「Bard 」等Google產品，但初期僅對應英語互動，未來也會陸續支援更多語種。另外，Google後續會進一步推出整合Gemini Ultra、更進階的「Bard Advanced」，但是否會另外以計費形式提供使用，目前還無法確定。

Meta（Llama 2）
Llama 2是由Meta在7月釋出的開源可免費商用大型語言模型，幾個月內 Llama 2在開源LLM模型競賽中快速竄起，在Huggingface公布許多模型幾乎都是基於Llama 2衍生的模型。

Meta指出，自Llama2推出後，今年9月的下載量已達3千萬次，顯示Llama 2對全球開發者社群的重要性，Meta期待運用自身研究成果及企業資源，幫助全球對於科技應用及社會公益懷抱熱情的有志之士，為整體社會創造益處。

臉書母公司Meta執行長祖克柏在9月27日的Meta Connect大會中宣布串接Meta各應用程式與裝置的AI助理「Meta AI」將上線，是接近與真人互動的全新AI助理，支援WhatsApp、Messenger、Instagram，能在文字聊天即時獲取最新資訊，並提供圖像生成工具。Meta強攻AI，也帶動其資料中心AI伺服器代工業者廣達、緯穎的出貨。（延伸閱讀：Meta強攻AI 誰受惠？）

有人工智慧（AI）教父之譽的李開復接受彭博訪問時說：「Llama 2已經成為黃金標準，對開源社群貢獻很大。我們希望提供一個出色的選擇，不僅為中國，也為全球市場。」

台灣企業也以此推出商用模型服務，如台智雲開發了繁體中文版本的優化Llama 2模型，提供了70億、130億和700億參數的三種商用版本，以滿足企業客戶的需求。

Open AI（GPT-4）

OpenAI於2023年3月14日正式推出 GPT-4 大型語言模型。OpenAI 也提供描述 GPT-4 功能的論文，以及詳述其侷限性的系統模型 Card。

而OpenAI於2023年11月6日首次的開發者大會也帶來眾多的亮點，包括GPT-4能跟上時事到2023年4月、文本輸入限制放寬到128K、GPTs讓所有人都能依其需求打造GPT，而GPT版App商店也將展開服務。

11月底，OpenAI高潮迭起的換將風暴終於平息下來，CNBC報導，軟體新創公司Log10執行長Arjun Bansal接到許多客戶來電，要求協助他們減少使用OpenAI的GPT，原因是不穩定性。

Bansal說：「大家在詢問如何微調不同的模型或嘗試不同的服務供應商，儘量不影響到原本的代碼設置。」他提及這是前所未有的情況，OpenAI規模極大、治理結構卻極其罕見，幾天間經歷重大動盪。

而有創投公司合夥人對這波動盪表明，我們還處於市場的早期階段，這也表示還有更大空間，可供更多新創企業一展身手。

據外媒報導，前美國財長桑默斯（Larry Summers）以經濟學者之姿成為OpenAI新董事會成員，這個消息可能令人訝異。但桑默斯長久來跟華爾街和華府人脈關係既深且廣，而且篤信AI將影響白領工作。有他坐鎮監督OpenAI，既可降低監管疑慮，也有助鞏固OpenAI與華爾街的關係。

資料來源：https://money.udn.com/money/story/5612/7667961