xAI釋出Grok-2 Beta模型!效能更勝GPT-4o、Claude 3.5,支援在X平台上生成圖片

2024.08.15| 李先泰

𝕏 新聞稿指出 ,Grok-2是目前最先進的AI語言模型,具備卓越的推理、聊天與編碼能力,並在 LMSYS聊天機器人競賽中展現強大實力,擊敗 GPT-4 Turbo和 Claude 3.5 Sonnet。

而Grok-2 mini則是Grok-2的小型版本,雖規模較小,但依然能夠提供高效準確的回應。xAI將於本月稍晚通過企業API向開發者提供這兩個模型的服務。

效能更勝GPT4-o與Claude 3.5 Sonnet!

𝕏 指出,Grok-2 和 Grok-2 mini 在多個學術基準測試中表現出色,展現了領先的語言推理能力。這些測試包括 GPQA(研究生水準的科學知識)、MMLU(通用知識測試)和 MathVista(視覺數學推理)等。

在LMSYS領導榜上, Grok-2 以代號「sus-column-r」參加競賽,並在綜合分數上超越了 GPT-4 Turbo 和 Claude 3.5 Sonnet,成為目前領先的模型。

𝕏 指出, Grok-2 將提升 𝕏 平台的用戶體驗。𝕏 Premium 和 Premium+ 用戶現在可以透過最新版本的 𝕏 應用程式,使用Grok-2 作為AI助手,能夠在找答案、寫作或解決編碼問題上發揮作用。

xAI測試.jpg

xAI指出,GPT-4 Turbo和Claude 3.5 Sonnet在基準測試中被Grok-2所擊敗。

圖/ xAI

𝕏平台未設限制措施,AI生圖狂歪樓

Grok-2 的圖像生成功能由 Black Forest Lab 的 Flux 1 AI 模型提供支持,允許用戶根據提示生成,並直接發布圖像至 𝕏 平台。

值得注意的是,由於目前 𝕏 平台沒有設置任何限制措施,導致創意爆棚的網友們不斷發布涉及知名人物的AI生成圖像。

例如,美國共和黨總統參選人川普,及現任副總統賀錦麗,這些圖像不但顯示他們持槍或使用非法藥物,且這些由 Grok 生成的圖像並未顯示任何 AI 生成的標識,這可能進一步加劇公眾的疑慮。截至目前,xAI 尚未就圖像生成功能的限制進行回應。

資料來源:https://www.bnext.com.tw/article/80195/inventai2024

Related posts