xAI釋出Grok-2 Beta模型！效能更勝GPT-4o、Claude 3.5，支援在X平台上生成圖片

2024.08.15| 李先泰

𝕏 新聞稿指出 ，Grok-2是目前最先進的AI語言模型，具備卓越的推理、聊天與編碼能力，並在 LMSYS聊天機器人競賽中展現強大實力，擊敗 GPT-4 Turbo和 Claude 3.5 Sonnet。

而Grok-2 mini則是Grok-2的小型版本，雖規模較小，但依然能夠提供高效準確的回應。xAI將於本月稍晚通過企業API向開發者提供這兩個模型的服務。

效能更勝GPT4-o與Claude 3.5 Sonnet！

𝕏 指出，Grok-2 和 Grok-2 mini 在多個學術基準測試中表現出色，展現了領先的語言推理能力。這些測試包括 GPQA（研究生水準的科學知識）、MMLU（通用知識測試）和 MathVista（視覺數學推理）等。

在LMSYS領導榜上， Grok-2 以代號「sus-column-r」參加競賽，並在綜合分數上超越了 GPT-4 Turbo 和 Claude 3.5 Sonnet，成為目前領先的模型。

𝕏 指出， Grok-2 將提升 𝕏 平台的用戶體驗。𝕏 Premium 和 Premium+ 用戶現在可以透過最新版本的 𝕏 應用程式，使用Grok-2 作為AI助手，能夠在找答案、寫作或解決編碼問題上發揮作用。

xAI指出，GPT-4 Turbo和Claude 3.5 Sonnet在基準測試中被Grok-2所擊敗。

圖／ xAI

Grok-2 的圖像生成功能由 Black Forest Lab 的 Flux 1 AI 模型提供支持，允許用戶根據提示生成，並直接發布圖像至 𝕏 平台。

值得注意的是，由於目前 𝕏 平台沒有設置任何限制措施，導致創意爆棚的網友們不斷發布涉及知名人物的AI生成圖像。

例如，美國共和黨總統參選人川普，及現任副總統賀錦麗，這些圖像不但顯示他們持槍或使用非法藥物，且這些由 Grok 生成的圖像並未顯示任何 AI 生成的標識，這可能進一步加劇公眾的疑慮。截至目前，xAI 尚未就圖像生成功能的限制進行回應。