整理包/2024 AI 大趨勢!AI 語言模型大車拚 微軟會笑到最後?GPT4、Gemini、Phi-2、Llama 2 比一比

2023/12/27 范熒恬整理

微軟、Google、Meta、AWS 等業者在AI大模型研發競爭激烈,所謂大型語言模型(LLM)是什麼呢?微軟近期推出的小型語言模型(SLM)Phi-2的評測報告,聲稱大贏對手,Google、微軟、Meta 分別推出了 Gemini、Phi-2、Llama 2 ,他們之間有什麼不同?今天《經濟日報》帶你一起了解,2024年AI趨勢的大預測,以及這些AI語言模型有何不同。

2024 AI趨勢有哪些?AI 大預測一次看
根據科技媒體TechCrunch預測,明年AI將出現以下8大趨勢:

1.OpenAI 成為一家產品公司

2.代理、生成影音和生成音樂「大眾化」

3.混合小模型可能更有優勢

4.很多公司會放棄大規模應用AI

5.蘋果將加入戰局

6.人工智慧濫用致法律案件發生

7.新的AI合規行業將誕生

8.2024年美國選舉是一場混戰 AI火上添油

大語言模型戰國時代

NVIDIA(輝達)於12月發布對於2024年的預測,提到AI將成為新的太空競賽。而近來在大語言模型產業領域,呈現私有模型與開源模型陣營之爭。

私有模型:如OpenAI的ChatGPT商用版,提供企業端以串接API(應用程式介面)方式使用,企業需將自身數據上傳,並按照用量付費。

開源模型:基於免費取用、可修改程式原始碼原則,企業端可自由用於開發使用,代表性的開源模型包括臉書母公司Meta推出的Llmma 2、新創Hugging Face的BLOOM等。

大型語言模型(LLM,Large Language Model):基於大量資料進行預訓練的超大型深度學習模型。基礎轉換器是一組神經網路,這些神經網路由具有自我專注功能的編碼器和解碼器組成。
文字導向 LLM 適用於各種自然語言處理工作,包括生成文字、機器翻譯、生成文字摘要、回答問題,以及建立可與真人對話的聊天機器人。LLM 也可以使用其他類型的資料進行訓練,包括程式碼、圖片、音訊、影片等。

大型語言模型有哪些優點?LLM 是透過大量資料預先訓練而成,可訓練來執行各種工作 (諸如:文字生成、摘要和翻譯),因此相當靈活有彈性。由於這類模型可針對特定工作進行微調 ,如此一來可能提高效能,因此擴充性也非常高。

科技巨擘AI語言模型大比拚
微軟(Phi-2)

微軟(Microsoft)近日發表效能優於Google Gemini Nano 2的Phi-2語言模型,公司表示「Phi-2只有27億個參數,在多個總合基準上,表現比70億參數的 Mistral 和130億參數的 Llama-2 都還要好。」(Mistral 是法國新創AI公司的產品,Llama-2是臉書母公司 Meta 的模型。)

11月21日年度發布會,微軟以Copilot為核心提出眾多服務,Microsoft 365 Copilot企業版開始推出,並將推出AI助手Microsoft 365 Chat。微軟使用者可以直接在瀏覽器中直接使用GPT4、DALL E 3,而不用訂閱GPT Plus。

微軟研究部門12月中發表的小型語言模型(SLM)Phi-2 評測報告,以「小語言模型的驚人力量」為題,指出 Phi-2在各類測試中展現良好理解與聽懂語言的能力,表現勝過是它25倍大的其他對手模型。GPT、或是 Google 的 Gemini 等人工智慧(AI)系統,是使用大型語言模型(LLM)。SLM 跟他們不同,是以較少的參數、較少的電腦運算來運作。這樣的小型AI模型,雖然不能生成 LLM 那麼多的人工智慧,對於特定的任務,卻是很有效率。

Phi-2的訓練素材和Phi-1同樣基於「教科書等級」的概念,包含了特別創建的合成數據集,包括科學、日常活動、心靈理論等,並進一步篩選具有教育價值和內容質量的網絡數據擴充訓練語料庫。並將參數量從13億擴大至27億。

Google(Gemini)

谷歌(Google)12月6日推出自家的生成式AI模型「Gemini」,迎戰問世一年多的ChatGPT,然而發布才過一天,外界已經開始質疑谷歌展示的性能有「粉飾、造假」之嫌。 歐新社
Google 12月6日推出新的生成式AI模型「Gemini」,將首度可直接在手機上運作,據金融時報報導,Google將Gemini形容為該公司「最大、最有能力、最通用」的AI系統,可分析影像和聲音資訊,並且具有複雜的推理和「規劃」能力。它從12月6日開始驅動Google的Bard聊天機器人,從明年起更廣泛地整合入Google的搜尋引擎中。

Gemini的其中一個版本「nano」,是專為在行動裝置上運作而設計的,而且將整合到Google最新的Pixel手機中。Google表示,這會在手機上「原生運作」,而nano模型是針對手機而優化的,因此Android開發人員能夠輕鬆地打造離線使用的AI應用程式(App)與功能,或者把個人資訊更加良好地儲存在私人手機中。」

Gemini號稱多項測試超越OpenAI的GPT4模型,而Gemini Nano 2是 Google 押注多模型 LLM,所發表的最新一款可在本地運作的AI系統,預計要取代 Google大部分服務中的 PaLM-2。

Bard Advanced
「Gemini 」正式上線時,Google 也同步說明將以Gemini Pro形式整合至人工智慧 服務「Bard 」等Google產品,但初期僅對應英語互動,未來也會陸續支援更多語種。另外,Google後續會進一步推出整合Gemini Ultra、更進階的「Bard Advanced」,但是否會另外以計費形式提供使用,目前還無法確定。

Meta(Llama 2)
Llama 2是由Meta在7月釋出的開源可免費商用大型語言模型,幾個月內 Llama 2在開源LLM模型競賽中快速竄起,在Huggingface公布許多模型幾乎都是基於Llama 2衍生的模型。

Meta指出,自Llama2推出後,今年9月的下載量已達3千萬次,顯示Llama 2對全球開發者社群的重要性,Meta期待運用自身研究成果及企業資源,幫助全球對於科技應用及社會公益懷抱熱情的有志之士,為整體社會創造益處。

臉書母公司Meta執行長祖克柏在9月27日的Meta Connect大會中宣布串接Meta各應用程式與裝置的AI助理「Meta AI」將上線,是接近與真人互動的全新AI助理,支援WhatsApp、Messenger、Instagram,能在文字聊天即時獲取最新資訊,並提供圖像生成工具。Meta強攻AI,也帶動其資料中心AI伺服器代工業者廣達、緯穎的出貨。(延伸閱讀:Meta強攻AI 誰受惠?)

有人工智慧(AI)教父之譽的李開復接受彭博訪問時說:「Llama 2已經成為黃金標準,對開源社群貢獻很大。我們希望提供一個出色的選擇,不僅為中國,也為全球市場。」

台灣企業也以此推出商用模型服務,如台智雲開發了繁體中文版本的優化Llama 2模型,提供了70億、130億和700億參數的三種商用版本,以滿足企業客戶的需求。

Open AI(GPT-4)

OpenAI於2023年3月14日正式推出 GPT-4 大型語言模型。OpenAI 也提供描述 GPT-4 功能的論文,以及詳述其侷限性的系統模型 Card。

而OpenAI於2023年11月6日首次的開發者大會也帶來眾多的亮點,包括GPT-4能跟上時事到2023年4月、文本輸入限制放寬到128K、GPTs讓所有人都能依其需求打造GPT,而GPT版App商店也將展開服務。

11月底,OpenAI高潮迭起的換將風暴終於平息下來,CNBC報導,軟體新創公司Log10執行長Arjun Bansal接到許多客戶來電,要求協助他們減少使用OpenAI的GPT,原因是不穩定性。

Bansal說:「大家在詢問如何微調不同的模型或嘗試不同的服務供應商,儘量不影響到原本的代碼設置。」他提及這是前所未有的情況,OpenAI規模極大、治理結構卻極其罕見,幾天間經歷重大動盪。

而有創投公司合夥人對這波動盪表明,我們還處於市場的早期階段,這也表示還有更大空間,可供更多新創企業一展身手。

據外媒報導,前美國財長桑默斯(Larry Summers)以經濟學者之姿成為OpenAI新董事會成員,這個消息可能令人訝異。但桑默斯長久來跟華爾街和華府人脈關係既深且廣,而且篤信AI將影響白領工作。有他坐鎮監督OpenAI,既可降低監管疑慮,也有助鞏固OpenAI與華爾街的關係。

資料來源:https://money.udn.com/money/story/5612/7667961

Related posts