OpenAI GPT-5 系列模型

這篇更新稿把GPT-5發佈(美國時間2025/8/7)放在產業轉折的座標上,主軸是:OpenAI以統一系統+即時路由器把高吞吐與深度推理納入同一個操作面板,並在推理、程式碼、寫作與安全性上全面拉升。此篇文章先釐清型號命名與訓練邊界,再往下展開到開發者接口與治理機制,力求代號、規格與實測脈絡都對齊官方說明。

在模型譜系上,文章說明GPT-5分成gpt-5-main/main-mini的高吞吐基礎線,與gpt-5-thinking(含mini、nano、以及面向Pro/Team/Enterprise/Edu的thinking-pro)負責長鏈條推理。上下文視窗上限被推到輸入272k、輸出128k、總處理40萬token,並明確交代知識截止日:main家族截至 2024/9/30,thinking的mini與nano截至2024/5/30。文章也點出定價策略:Input明顯變便宜、Output相對變貴,但在整體效能超過O系列前提下,作者判斷以GPT-5為預設選項的性價比更好。

所謂統一系統在此篇文章中被描述為一座自動分流的總控台:即時路由器會依照任務複雜度、工具需求與使用者意圖甚至一句「think hard」切換到深度推理路徑;當流量吃緊時則回落到mini以維持可用性與成本彈性。訓練資料面,文章交代了來源與嚴格的篩洗流程:以隱私過濾、Moderation與安全分類器把高風險內容擋在訓練外,同時針對thinking系列加入強化學習式的先思考再作答流程,降低被繞規的機率。

對開發者而言,這版重點在可控又不易壞。此篇文章補充兩個旋鈕:verbosity決定回應詳略、reasoning_effort決定是否啟用深推理。更具體的是自訂工具:不再強迫用JSON才能呼叫,改允許以純文字搭配正規表示式或上下文無關文法約束格式,減少長輸入下JSON轉義失誤;作者也註記,在SWE-bench上改用自訂工具與JSON工具結果相近。API快速上手的段落提供了Responses介面的簡例,並保留截稿時尚未全面開放的提醒。

效能章節把焦點落在三個工作場景:邏輯、數理推理、指令遵循與軟體開發。此篇文章指出,GPT-5在這三者均較前代有感上升,同時把函式呼叫、長上下文與多模態理解納入同一套路由機制,使企業可把API串接、自動化流程與長文檔決策整合在同一個平台上。對工程團隊而言,重點是更快收斂、較少返工。

安全性部分,文章不是只看拒絕率,而是以安全補全來兼顧可用性;並逐一匯整:不允許內容上的產線基準、馬屁行為顯著下降、對既有越獄集的穩健度、以及指令階層服從性的進退,thinking明顯進步,main在系統層遵從上仍需優化)。更進一步,文章採用欺瞞行為為切角,介紹了誠實放棄、Broken Tools、與資訊不足情境的對抗式訓練,目的在讓模型在做不到時老實說不知道,而不是編造。醫療(HealthBench)、多語(MMLU 多語)與公平性(BBQ)也被納入,呈現思辨與守規之間的平衡。

綜合來看,這是一份把產品體驗、工程落地與安全治理一次拉直的版本說明:統一系統讓模型選擇變成隱形,路由把成本與品質動態調度;開發端得到更穩定的工具呼叫與更細的推理控制;治理端用安全補全與反欺瞞訓練補足高風險場景。若你正評估導入,此篇文章後續值得深讀的頁面是:如何設計自訂工具語法、何時切換 reasoning_effort、以及在長文檔情境下讓路由發揮最大效益——讀完全文,差不多就能把PoC的路線圖排進下個衝刺週了。

閱讀完整文章: https://medium.com/@simon3458/openai-gpt-5-information-2025-9ec25ca4bf3b

Related posts