同樣是 Agent Skill,Claude 和 OpenAI 實作方式大不同

此篇文章從一個很直覺卻常見的開發迷思切入:在 AI 代理(Agent)發展初期,大家總想把模型養成「無所不能」,於是把長達數千行的 System Prompt 一次塞滿,或是硬串一堆 API 工具,期待它什麼都會做。文章指出,這條路很快就撞牆,模型會因為資訊過載而變得混亂、指令遵循度下滑,甚至讓 Token 成本一路墊高。也因此,「Agent Skill」被提出作為解法。文章強調,Agent Skill 不是單純的「功能」或「工具呼叫」,而是一個封裝完整的能力單元,裡面同時包含特定指令、專業知識參考與可自動執行的腳本。文章用很貼切的比喻說明差別:傳統 Tools 或 MCP 比較像丟給新鮮人一把扳手或一台電腦,但不保證他知道怎麼用;Agent Skills 則像直接給他一套「高級技工培訓手冊」外加「專用工具箱」,讓他能在需要時迅速切換成某個領域的專家。

接著,文章把 Agent Skill 為什麼在近期突然變得關鍵,拆成幾個更具體的痛點來說。此篇文章先談「上下文膨脹」與「Lost in the middle」:即使模型的上下文視窗愈做愈大,把所有專業指令長期塞在系統提示詞裡,仍會讓模型反應遲鈍、抓不到重點、精準度下降。文章提出的對應策略是「漸進式揭露」,也就是只有當 Agent 判斷任務真的需要某項技能時,才動態載入那份技能的完整指令,讓系統平常保持輕巧、關鍵時刻才變深。此篇文章也把「通用行為」與「專家決策」拉開距離:一般模型回答往往中規中矩,但像程式碼審查、法律分析這類場景需要的是嚴格規範與可重現的作業邏輯,因此技能會透過像 SKILL.md 這樣的結構化文件,把專業流程、錯誤處理與約束條件寫清楚。再來文章點出安全面最容易被忽略的一環:永久給 Bash 權限或檔案寫入權限非常危險,所以技能應配合「最小化原則」,在技能啟動當下才短暫開權限、任務結束就收回。最後,此篇文章把視野拉到生態系,提到 OpenAI 與 Claude 在 SKILL.md 格式上的高度共識,意味著技能可以被「資產化」、可跨環境遷移,也可能走向社群共享與技能市集的模式。

在鋪陳完背景後,此篇文章的重點落在「同樣是 Agent Skill,Claude 和 OpenAI 的實作方式為何大不同」。指出兩者都在解同一題:如何不讓 System Prompt 爆炸,卻又能給 Agent 專家級能力;差別在於系統的核心驅動方式。文章先比對技能如何被啟動:Claude 偏向「推理驅動」,用一個名為 Skill 的「元工具」把可用技能名稱與簡述塞進 description,讓模型自己判斷此刻該調用哪個技能;OpenAI 則更像「套件管理」,用類似 npm install 的 $skill-installer 把技能安裝成環境的一部分,並與 MCP 連動,讓管理更可預測、也更利於在 CLI 與不同環境做靜態控管。也談到介面與訊息流的設計取捨:Claude 透過一明一暗的雙軌訊息,把「載入技能」這件事讓使用者看得到,但把數千字的 SKILL.md 以 isMeta 隱藏層送進模型端閱讀,避免聊天視窗被洗版;OpenAI 則更強調以標準化腳本產出確定性結果,而不是全靠長篇提示詞。到了權限與環境控制,文章描寫 Claude 會用 contextModifier 在技能期間限時放寬工具權限、結束立刻收回;OpenAI 則以 YAML 前言去定義權限邊界,並在受控沙盒中執行。最後在品質保證上,此文章把 Claude 的「高品質 Markdown 指令引導」對比 OpenAI 的「evals 自動化評測框架」,凸顯Claude更信任模型理解力,而OpenAI偏向把 AI 開發推向軟體工程化與可測試、可回歸的流程。

閱讀完整文章:https://www.soft4fun.net/tech/ai/agent-skill-implementation.htm

Related posts