AI編程大戰打響,OpenAI推出GPT-5.3-Codex,硬碰Anthropic新旗艦

在 AI 編程領域競爭日益白熱化的背景下,文章指出,OpenAI 與 Anthropic 之間的正面對決,已正式進入毫不掩飾的貼身肉搏階段。OpenAI 發布號稱史上最強編程代理的 GPT-5.3-Codex,而發布時間刻意選在 Anthropic 同步推出旗艦升級模型 Claude Opus 4.6 的當下,被業界視為一次高度策略性的宣示。

文章分析,這場同步發布不只是技術較勁,更象徵企業級軟體開發市場的爭奪戰全面升溫。OpenAI 在公告中強調,GPT-5.3-Codex 不僅在多項基準測試中取得領先成績,更達成一項關鍵里程碑──成為公司首個實現自我構建的模型。換言之,OpenAI 已開始使用 5.3-Codex 本身,來調試模型訓練流程、管理部署基礎設施,並分析評測結果。OpenAI 執行長奧特曼也在社群平台 X 上直言,親眼見證用 5.3-Codex 來開發 5.3-Codex,讓產品迭代速度產生質變,顯示 AI 正逐步成為打造下一代 AI 的核心工具。這種自我強化的開發模式,正是代理式 AI 真正進入成熟階段的重要象徵。

在性能表現上,文章整理了關鍵數據。GPT-5.3-Codex 在真實世界軟體工程評測 SWE-Bench Pro 中取得 57% 成績,在 Terminal-Bench 2.0 則達到 77.3%,且傳出明顯高於同日發布的 Claude Opus 4.6。這些數字雖仍需放在實際使用情境中解讀,但已足以凸顯雙方在工程任務上的短兵相接。更重要的是,OpenAI 對 GPT-5.3-Codex 的定位,已不再只是寫程式的 AI。新模型正朝向全方位的電腦操作代理演進,能力涵蓋自動化調試、部署、系統監控,甚至撰寫產品需求文件(PRD)與分析試算表資料。同時,它也被歸類為具備高能力的資安模型,可直接識別軟體漏洞。為此,OpenAI 更承諾投入 1,000 萬美元 API 額度,鼓勵開發者運用該模型加速資安防禦研究。

文章也未忽略競爭背後的火藥味。Anthropic 近期在超級盃期間播放廣告,影射 OpenAI 有意在 ChatGPT 免費版測試廣告,隨即引來奧特曼強烈反擊,指該廣告明顯不誠實,並反批 Anthropic 只服務付費菁英。這場口水戰,讓技術競爭延燒至品牌與價值觀層次。最後,文章引用 a16z 的最新調查指出,到了 2026 年,單一企業在大型語言模型上的平均支出預估將達 1,160 萬美元。儘管 OpenAI 目前仍握有約 53% 市占,但 Anthropic 與 Google 正憑藉實際生產環境的使用率快速逼近。整體而言,此篇文章呈現的,不只是一款新模型的發布,而是一場圍繞誰能成為企業數位勞動力核心的長期戰爭。

閱讀完整文章:https://tw.stock.yahoo.com/news/ai%E7%B7%A8%E7%A8%8B%E5%A4%A7%E6%88%B0%E6%89%93%E9%9F%BF-openai%E6%8E%A8%E5%87%BAgpt-5-3-codex-000235006.html

Related posts