同樣是 Agent Skill，Claude 和 OpenAI 實作方式大不同

此篇文章從一個很直覺卻常見的開發迷思切入：在 AI 代理（Agent）發展初期，大家總想把模型養成「無所不能」，於是把長達數千行的 System Prompt 一次塞滿，或是硬串一堆 API 工具，期待它什麼都會做。文章指出，這條路很快就撞牆，模型會因為資訊過載而變得混亂、指令遵循度下滑，甚至讓 Token 成本一路墊高。也因此，「Agent Skill」被提出作為解法。文章強調，Agent Skill 不是單純的「功能」或「工具呼叫」，而是一個封裝完整的能力單元，裡面同時包含特定指令、專業知識參考與可自動執行的腳本。文章用很貼切的比喻說明差別：傳統 Tools 或 MCP 比較像丟給新鮮人一把扳手或一台電腦，但不保證他知道怎麼用；Agent Skills 則像直接給他一套「高級技工培訓手冊」外加「專用工具箱」，讓他能在需要時迅速切換成某個領域的專家。

接著，文章把 Agent Skill 為什麼在近期突然變得關鍵，拆成幾個更具體的痛點來說。此篇文章先談「上下文膨脹」與「Lost in the middle」：即使模型的上下文視窗愈做愈大，把所有專業指令長期塞在系統提示詞裡，仍會讓模型反應遲鈍、抓不到重點、精準度下降。文章提出的對應策略是「漸進式揭露」，也就是只有當 Agent 判斷任務真的需要某項技能時，才動態載入那份技能的完整指令，讓系統平常保持輕巧、關鍵時刻才變深。此篇文章也把「通用行為」與「專家決策」拉開距離：一般模型回答往往中規中矩，但像程式碼審查、法律分析這類場景需要的是嚴格規範與可重現的作業邏輯，因此技能會透過像 SKILL.md 這樣的結構化文件，把專業流程、錯誤處理與約束條件寫清楚。再來文章點出安全面最容易被忽略的一環：永久給 Bash 權限或檔案寫入權限非常危險，所以技能應配合「最小化原則」，在技能啟動當下才短暫開權限、任務結束就收回。最後，此篇文章把視野拉到生態系，提到 OpenAI 與 Claude 在 SKILL.md 格式上的高度共識，意味著技能可以被「資產化」、可跨環境遷移，也可能走向社群共享與技能市集的模式。

在鋪陳完背景後，此篇文章的重點落在「同樣是 Agent Skill，Claude 和 OpenAI 的實作方式為何大不同」。指出兩者都在解同一題：如何不讓 System Prompt 爆炸，卻又能給 Agent 專家級能力；差別在於系統的核心驅動方式。文章先比對技能如何被啟動：Claude 偏向「推理驅動」，用一個名為 Skill 的「元工具」把可用技能名稱與簡述塞進 description，讓模型自己判斷此刻該調用哪個技能；OpenAI 則更像「套件管理」，用類似 npm install 的 $skill-installer 把技能安裝成環境的一部分，並與 MCP 連動，讓管理更可預測、也更利於在 CLI 與不同環境做靜態控管。也談到介面與訊息流的設計取捨：Claude 透過一明一暗的雙軌訊息，把「載入技能」這件事讓使用者看得到，但把數千字的 SKILL.md 以 isMeta 隱藏層送進模型端閱讀，避免聊天視窗被洗版；OpenAI 則更強調以標準化腳本產出確定性結果，而不是全靠長篇提示詞。到了權限與環境控制，文章描寫 Claude 會用 contextModifier 在技能期間限時放寬工具權限、結束立刻收回；OpenAI 則以 YAML 前言去定義權限邊界，並在受控沙盒中執行。最後在品質保證上，此文章把 Claude 的「高品質 Markdown 指令引導」對比 OpenAI 的「evals 自動化評測框架」，凸顯Claude更信任模型理解力，而OpenAI偏向把 AI 開發推向軟體工程化與可測試、可回歸的流程。

閱讀完整文章:https://www.soft4fun.net/tech/ai/agent-skill-implementation.htm