OpenAI GPT-5 系列模型

這篇更新稿把GPT-5發佈（美國時間2025/8/7）放在產業轉折的座標上，主軸是：OpenAI以統一系統＋即時路由器把高吞吐與深度推理納入同一個操作面板，並在推理、程式碼、寫作與安全性上全面拉升。此篇文章先釐清型號命名與訓練邊界，再往下展開到開發者接口與治理機制，力求代號、規格與實測脈絡都對齊官方說明。

在模型譜系上，文章說明GPT-5分成gpt-5-main／main-mini的高吞吐基礎線，與gpt-5-thinking（含mini、nano、以及面向Pro/Team/Enterprise/Edu的thinking-pro）負責長鏈條推理。上下文視窗上限被推到輸入272k、輸出128k、總處理40萬token，並明確交代知識截止日：main家族截至 2024/9/30，thinking的mini與nano截至2024/5/30。文章也點出定價策略：Input明顯變便宜、Output相對變貴，但在整體效能超過O系列前提下，作者判斷以GPT-5為預設選項的性價比更好。

所謂統一系統在此篇文章中被描述為一座自動分流的總控台：即時路由器會依照任務複雜度、工具需求與使用者意圖甚至一句「think hard」切換到深度推理路徑；當流量吃緊時則回落到mini以維持可用性與成本彈性。訓練資料面，文章交代了來源與嚴格的篩洗流程：以隱私過濾、Moderation與安全分類器把高風險內容擋在訓練外，同時針對thinking系列加入強化學習式的先思考再作答流程，降低被繞規的機率。

對開發者而言，這版重點在可控又不易壞。此篇文章補充兩個旋鈕：verbosity決定回應詳略、reasoning_effort決定是否啟用深推理。更具體的是自訂工具：不再強迫用JSON才能呼叫，改允許以純文字搭配正規表示式或上下文無關文法約束格式，減少長輸入下JSON轉義失誤；作者也註記，在SWE-bench上改用自訂工具與JSON工具結果相近。API快速上手的段落提供了Responses介面的簡例，並保留截稿時尚未全面開放的提醒。

效能章節把焦點落在三個工作場景：邏輯、數理推理、指令遵循與軟體開發。此篇文章指出，GPT-5在這三者均較前代有感上升，同時把函式呼叫、長上下文與多模態理解納入同一套路由機制，使企業可把API串接、自動化流程與長文檔決策整合在同一個平台上。對工程團隊而言，重點是更快收斂、較少返工。

安全性部分，文章不是只看拒絕率，而是以安全補全來兼顧可用性；並逐一匯整：不允許內容上的產線基準、馬屁行為顯著下降、對既有越獄集的穩健度、以及指令階層服從性的進退，thinking明顯進步，main在系統層遵從上仍需優化）。更進一步，文章採用欺瞞行為為切角，介紹了誠實放棄、Broken Tools、與資訊不足情境的對抗式訓練，目的在讓模型在做不到時老實說不知道，而不是編造。醫療（HealthBench）、多語（MMLU 多語）與公平性（BBQ）也被納入，呈現思辨與守規之間的平衡。

綜合來看，這是一份把產品體驗、工程落地與安全治理一次拉直的版本說明：統一系統讓模型選擇變成隱形，路由把成本與品質動態調度；開發端得到更穩定的工具呼叫與更細的推理控制；治理端用安全補全與反欺瞞訓練補足高風險場景。若你正評估導入，此篇文章後續值得深讀的頁面是：如何設計自訂工具語法、何時切換 reasoning_effort、以及在長文檔情境下讓路由發揮最大效益——讀完全文，差不多就能把PoC的路線圖排進下個衝刺週了。

閱讀完整文章: https://medium.com/@simon3458/openai-gpt-5-information-2025-9ec25ca4bf3b