ChatGPT封鎖模式上線:防惡意指令偷數據,但聯網能力受限
6月7日,鎖模式上受限OpenAI近日上線一項新的線防可選安全設置“封鎖模式”(Lockdown Mode),用戶開啟后,惡意投票穩第一團隊ChatGPT會限制實時聯網、指令深度研究和智能體模式等能力,偷數以降低敏感數據被提示注入攻擊(prompt injection)帶走的聯網風險。
OpenAI幫助中心顯示,鎖模式上受限Lockdown Mode現已面向所有已登錄用戶開放,線防覆蓋不同賬戶類型和工作區。惡意投票穩第一團隊個人用戶可在“設置-安全”中開啟,指令工作區管理員也可通過工作區設置和角色權限進行配置。偷數
它防的聯網是哪類風險
提示注入攻擊指的是攻擊者把惡意指令藏在網頁、文檔或其他外部內容里。鎖模式上受限當ChatGPT讀取這些內容時,線防模型可能被誘導忽略原本規則,惡意執行不該執行的動作,嚴重時可能把用戶輸入的敏感信息通過聯網能力傳到外部。
封鎖模式的思路不是讓模型識別所有惡意指令,而是限制最危險的一步:向外部發起網絡請求。開啟后,ChatGPT的實時網頁瀏覽會被限制,只能訪問緩存內容;搜索結果可能不完整、不可用或已經過時。ChatGPT也不會在普通回復中檢索和展示來自網絡的圖片,但用戶仍可自行上傳圖片文件,圖片生成功能也不受影響。
同時,深度研究(Deep Research)和智能體模式(Agent Mode)會被關閉;ChatGPT不能從網絡下載文件用于數據分析,只能處理用戶手動上傳的文件;Canvas生成的代碼也不能被批準聯網訪問。
對多數用戶影響有限,對企業是取舍開關
對大多數普通用戶來說,封鎖模式未必會長期打開。很多人使用ChatGPT,正是為了聯網搜索、整理資料、做深度研究或調用外部工具。開啟封鎖模式后,這些能力會明顯受限,得到的信息也可能更舊。
但對企業、公共服務機構、法律和合規團隊來說,這個開關的意義更直接:當對話里可能出現客戶隱私、合同條款、內部數據或未公開材料時,管理者可以選擇犧牲一部分聯網能力,換取更低的數據外泄風險。
OpenAI還說明,封鎖模式不會改變對話記憶、文件上傳、分享對話等功能,也不會改變對話是否被用于改進模型。相關設置仍需通過數據控制或企業管理員權限單獨管理。換句話說,它不是一個總隱私開關,只負責減少提示注入導致的數據外傳風險。
這不是萬能安全鎖
OpenAI在幫助文檔中明確承認,封鎖模式不能保證提示注入攻擊完全失效。惡意指令仍可能出現在緩存網頁內容里,也可能藏在用戶上傳的文件中,并影響ChatGPT的回答行為或準確性。
這說明AI產品正在面對一個更現實的問題:模型越能聯網、調用工具、代表用戶執行任務,攻擊面就越大。智能體模式強調讓AI主動訪問網頁、操作外部服務、完成多步驟任務,而這些能力也正是提示注入攻擊最容易利用的入口。
封鎖模式為這類能力設置了一道可見邊界。它沒有承諾讓ChatGPT絕對安全,而是把“更強能力”和“更低外泄風險”之間的取舍交給用戶和管理員。(易句)
(本文由AI翻譯,網易編輯負責校對)