2024.08.15| 李先泰
𝕏 新聞稿指出 ,Grok-2是目前最先進的AI語言模型,具備卓越的推理、聊天與編碼能力,並在 LMSYS聊天機器人競賽中展現強大實力,擊敗 GPT-4 Turbo和 Claude 3.5 Sonnet。
而Grok-2 mini則是Grok-2的小型版本,雖規模較小,但依然能夠提供高效準確的回應。xAI將於本月稍晚通過企業API向開發者提供這兩個模型的服務。
效能更勝GPT4-o與Claude 3.5 Sonnet!
𝕏 指出,Grok-2 和 Grok-2 mini 在多個學術基準測試中表現出色,展現了領先的語言推理能力。這些測試包括 GPQA(研究生水準的科學知識)、MMLU(通用知識測試)和 MathVista(視覺數學推理)等。
在LMSYS領導榜上, Grok-2 以代號「sus-column-r」參加競賽,並在綜合分數上超越了 GPT-4 Turbo 和 Claude 3.5 Sonnet,成為目前領先的模型。
𝕏 指出, Grok-2 將提升 𝕏 平台的用戶體驗。𝕏 Premium 和 Premium+ 用戶現在可以透過最新版本的 𝕏 應用程式,使用Grok-2 作為AI助手,能夠在找答案、寫作或解決編碼問題上發揮作用。

xAI指出,GPT-4 Turbo和Claude 3.5 Sonnet在基準測試中被Grok-2所擊敗。
圖/ xAI
𝕏平台未設限制措施,AI生圖狂歪樓
Grok-2 的圖像生成功能由 Black Forest Lab 的 Flux 1 AI 模型提供支持,允許用戶根據提示生成,並直接發布圖像至 𝕏 平台。
值得注意的是,由於目前 𝕏 平台沒有設置任何限制措施,導致創意爆棚的網友們不斷發布涉及知名人物的AI生成圖像。
例如,美國共和黨總統參選人川普,及現任副總統賀錦麗,這些圖像不但顯示他們持槍或使用非法藥物,且這些由 Grok 生成的圖像並未顯示任何 AI 生成的標識,這可能進一步加劇公眾的疑慮。截至目前,xAI 尚未就圖像生成功能的限制進行回應。