OpenAI公布防範濫用的AI抓蟲獎勵方案

此篇文章聚焦於AI安全治理的最新發展，指出隨著人工智慧技術快速演進，相關的濫用手法也同步升級，傳統僅以資安漏洞為核心的防護思維已顯不足。為回應這樣的變化，文章說明OpenAI推出新的安全臭蟲獎勵方案，將過去未被視為典型漏洞的風險，例如提示注入、資料外洩與代理人劫持等情境，正式納入通報與獎勵範圍。這代表AI安全不再只關注系統是否被入侵，更重視模型在運作過程中是否可能被誤導、操控或濫用，進一步造成實質危害。透過這項制度調整，帶出AI安全從「防漏洞」走向「防濫用」的趨勢，顯示產業正重新定義何謂風險。

此篇文章進一步解析新方案的運作方式與參與機制，強調其作為既有安全獎勵制度的補充角色，專門針對導致AI濫用的問題進行通報與評估。研究人員、白帽駭客及安全專家可透過專屬平台提交案例，並由OpenAI內部不同小組依影響範圍與責任歸屬進行分類處理。文章特別點出方案所涵蓋的三大類風險，其中以代理人風險最具代表性，包含第三方提示注入與資料外洩問題，這類攻擊可能讓AI代理人如瀏覽器工具或聊天代理被操控，進而執行未授權行為或洩露敏感資訊，且需具備一定程度的可重現性才會被認定。除此之外，也涵蓋大規模違規操作，以及其他可能導致代理系統產生危害的情境，顯示其評估標準兼顧技術面與實務影響。

在其他風險類型方面，此篇文章指出第二類著重於OpenAI獨有資訊的外洩，包括模型不當揭露內部推理機制或其他專屬資料的情形，反映對模型內部知識保護的重視。第三類則聚焦帳號與平台完整性，例如繞過反自動化機制、操弄信任指標或規避封鎖限制等行為，這些問題雖不直接涉及模型內容，卻可能動搖整體服務的安全基礎。文章最後也補充，OpenAI將不定期針對特定高風險議題推出專案型獎勵計畫，同時保留對其他未列入類別問題的彈性評估空間，但一般性的內容違規則不在獎勵之列。整體而言，文章呈現出AI安全策略逐漸走向多層次治理的方向，不僅關注技術漏洞，也納入行為風險與系統濫用的防範思維。

閱讀完整文章:https://www.ithome.com.tw/news/174753