GPT-4o與Claude3.5實測:它2項勝出!竟懂台語?

2024-06-26 | 郭宇璇

Anthropic 20日推出最新AI版本Claude 3.5,聲稱能打敗OpenAI備受關注的GPT-4o!對一般使用者而言,Claude 3.5和ChatGPT-4o,誰才是AI界的實用王者?本文精選5個日常AI應用情境,包括對這類歐美大模型來說,挑戰難度頗高的台語理解。這兩項工具到底最後差別與優缺點各在哪?誰在兩項中勝出,其餘平手?

【目錄】

● 如何使用Claude 3.5?
● 如何使用ChatGPT-4o?
● Claude 3.5 vs. ChatGPT-4o使用比較
– 實測1:發想創意料理
– 實測2:生成文章
– 實測3:擔任營養師
– 實測4:用python做小遊戲
– 實測5:翻譯台語
● 最終比較,兩者優缺點

如何使用Claude 3.5?

目前Claude 3.5已開放免費體驗,付費用戶則可擁有更高的使用額度。進入Claude網站並登入後,直接輸入問題即可使用最新的Claude 3.5模型。

Claude 3.5已開放免費使用。截取自Claude

Claude 3.5已開放免費使用。截取自Claude

如何使用ChatGPT-4o?

ChatGPT-4o也可免費使用,付費用戶同樣享有比免費用戶更高的使用額度。在ChatGPT使用介面的左上角,選擇最新模型GPT-4o後,便能開始使用。

ChatGPT-4o也可免費使用。截取自ChatGPT

ChatGPT-4o也可免費使用。截取自ChatGPT

Claude 3.5 vs. GPT-4o 實測1:發想創意料理

想在下廚時獲得一些創意料理靈感,可以問問AI。要求兩款AI將台灣特色料理和芒果結合,設計創意套餐。兩者提供的菜單皆有符合要求,不過Claude的說明較詳細,菜色也較有創意。

實測Claude 3.5發想創意料理。截取自Claude

實測Claude 3.5發想創意料理。截取自Claude

實測GPT-4o發想創意料理。截取自ChatGPT

實測GPT-4o發想創意料理。截取自ChatGPT

Claude 3.5 vs. GPT-4o 實測2:生成文章

要求兩款AI以「未來世界的人類與AI合作」為主題,寫一篇文章。結果發現,兩款AI生成的文章結構和內容類似,皆是以列點方式討論此主題的不同面向,包括教育、工作和環境領域的討論等。

實測Claude 3.5生成文章。截取自Claude

實測Claude 3.5生成文章。截取自Claude

在這裡可以看到ChatGPT生成的全文。

實測GPT-4o生成文章。截取自ChatGPT

實測GPT-4o生成文章。截取自ChatGPT

Claude 3.5 vs. GPT-4o 實測3:擔任營養師

AI也可以成為個人專屬的營養師!上傳一張午餐的照片,要求兩款AI辨識圖中的食物,分析各類營養攝取是否足夠,並提供一些飲食建議。結果發現,兩款AI皆能大致正確辨識出照片中的食物種類,提供的建議也合理完整。

實測Claude 3.5扮演營養師,提供飲食建議。截取自Claude

實測Claude 3.5扮演營養師,提供飲食建議。截取自Claude

實測GPT-4o扮演營養師,提供飲食建議。截取自ChatGPT

實測GPT-4o扮演營養師,提供飲食建議。截取自ChatGPT

Claude 3.5 vs. GPT-4o 實測4:用Python做小遊戲

為測試AI撰寫程式碼的能力,要求兩款AI用Python製作簡單的橫向捲軸遊戲,規則包括跳過障礙物和吃掉寶物。將兩者生成的程式碼複製進Visual Studio Code之後,皆能順利執行,不過Claude還多了計分版的設計。

實測Claude 3.5製作python小遊戲。截取自Claude

實測Claude 3.5製作python小遊戲。截取自Claude

在這裡可以看到ChatGPT生成的完整程式碼。

實測GPT-4o製作python小遊戲。截取自ChatGPT

實測GPT-4o製作python小遊戲。截取自ChatGPT

Claude 3.5 vs. GPT-4o 實測5:翻譯台語 

英文翻譯可說是AI的強項,但如果是請AI翻譯台語呢?記者輸入了鄭宜農的台語歌曲〈新世紀的女兒〉中的一段歌詞,並請兩款AI翻譯成華文。結果發現,兩者都能理解台語歌詞的含義,不過Claude的翻譯有經過改寫、ChatGPT則是逐字翻譯。

實測Claude 3.5翻譯台語歌詞。截取自Claude

實測Claude 3.5翻譯台語歌詞。截取自Claude

實測GPT-4o翻譯台語歌詞。截取自ChatGPT

實測GPT-4o翻譯台語歌詞。截取自ChatGPT

Claude 3.5 vs. GPT-4o 最終比較:兩者優缺點各在哪?

以下表格為本次實測五項功能中,Claude 3.5 和 GPT-4o 的優缺點比較。請注意,此表格僅為本次實測結果分析,實際表現可能因指令差異或模型更新而有所不同。

Claude 3.5GPT-4
發想創意料理能符合要求,菜色較有創意 【勝】能符合要求
生成文章文章切合主題、結構完整(平手)
擔任營養師能大致正確辨識食物、建議合理(平手)
用python做小遊戲能順利生成可執行遊戲的程式碼,較為完整【勝】能順利生成可執行遊戲的程式碼
翻譯台語正確大意翻譯(平手)正確逐字翻譯(平手)

資料來源:https://www.gvm.com.tw/article/113757

Related posts