脈絡管理(context management)是 AI 原生知識工作者最被低估的技能。它跟帶一個新人沒兩樣:把他指向最小、當前、相關的那組資訊,剛好夠把事情做完——不多一點。
把你的 AI 工作者指向最小、當前、相關的那組資訊,剛好夠完成任務,不多。給太少它會迷路(像 Carl 在走廊亂逛),給太多它會變慢、變貴、變笨。再加上:分離規則/事實/流程、連到活來源、並確認它真的讀了檔案。
想像最普通的會計事務所,你是 CEO。你把同一份「Peterson 退稅」交給上一個新人 Carl,說了句「去吧」——然後事情就壞了。
Carl 不知道該去哪。事務所的「部落知識」一團亂,於是他一個房間換一個房間、一疊紙換一疊紙地翻找 Peterson 的歷史、公司做事的方法、退稅 SOP。
每一個在走廊裡耗掉的小時,都是從真正工作裡扣掉的小時。等他湊出一疊紙,油箱已空,退稅根本還沒開始。
更糟的是,他抓的東西有一半是廢的。他翻出兩年前的 Peterson 檔案,不知道它已經過期,整份退稅就建在上面。看起來對,其實錯。
結果不只是遲交,而是做錯。Peterson 先生氣炸了。
Carl 之後,你的第一直覺是矯枉過正:把 200 本客戶活頁夾全影印、堆到新人桌上。但你及時收手——這不是 Carl 問題的反面,是它的放大版。把人埋在 200 本活頁夾底下,他一樣溺水。
品質不會隨脈絡一路上升;過了某個點就開始往下掉。
200 本活頁夾的傾倒「感覺」很周全,卻會把 Carl 沉下去。研究機構 Chroma 測了 18 個前沿模型,每一個都在視窗被填滿「之前」就開始變差。堆得越多,agent 越慢、越貴、越笨——目標永遠是「仍包含任務所需一切」的最小脈絡。
回到新人 Ron。你沒丟給他「全部」,而是一張標好的地圖:哪個櫃、哪本、哪幾頁。他鎖定、讀完、用 2 小時的餘裕做完了那份壓垮 Carl 的工作。地圖長這樣——
事實會更新、偏好會留存、規則決定什麼被允許。別把三者塞進同一本活頁夾。
這跟用 AI 一模一樣。你指揮的不是 Ron,是 Claude 或 Codex;花的不是有限的時間,是有限的 tokens;用的不是檔案櫃、活頁夾、頁碼,而是資料夾慣例、CLAUDE.md、活來源連結。同一份工作:把工作者指向最小、當前、相關的資訊,不多。
| Ron 的世界 | 你的 AI |
|---|---|
| 有限的時間(每小時都是成本) | 有限的 tokens(每多一個檔案都是稅) |
| 檔案櫃、活頁夾、頁碼 | 資料夾慣例、CLAUDE.md、明確的檔案指標 |
| 把他接上客戶的活檔 | 連到 Notion、Gmail、Slack、你的 codebase |
| 給一張地圖(這櫃、這本、這幾頁) | 一份「現況/待解問題/限制」摘要,而不是倒整段對話 |
| 叫他去讀 | 叫它讀,還要確認它真的讀了 |
Ron 剛剛教會你的,整理成 7 條可以直接拿去用。
三個檔案櫃,不是整棟樓。每多一個檔案,都是對速度、成本、品質的稅。目標:最小、但仍包含任務所需一切的脈絡。
200 本活頁夾感覺周全,卻會淹死人。Chroma 測 18 個前沿模型,每個都在視窗填滿前就變差。堆越多,越慢、越貴、越笨。
Carl 的退稅錯,是因為建在兩年前的舊檔上。裝成事實的過時脈絡最危險。保持當前,其餘剪掉。
三個櫃子是刻意的:價值觀(規則)、客戶(事實+偏好)、流程(SOP)。事實會更新、偏好會留存、規則決定什麼被允許。別塞進同一本。
你給 Ron 的是指標(這櫃、這本、這幾頁),不是公司每段對話的錄音。一份精簡的「現況/待解/限制」勝過把整段歷史倒進對話。
比活頁夾更好的,是把 Ron 接上客戶的活檔,讀到的就是今天為真的。對 LLM:連到 Notion、Gmail、Slack、你的 codebase。
唯一一個類比會崩的地方:Ron 會打開你指的東西,Claude 不一定。把 agent 指向一個資料夾,不代表它讀了你的檔案。叫它讀,然後檢查它真的讀了。
脈絡管理就是帶新人:把你的 AI 指向最小、當前、相關的那組資訊,剛好夠完成任務,不多一點。
給太少,它在走廊亂逛;給太多,它變慢、變貴、變笨。過時的脈絡比沒有更危險——它讓能幹的工作者自信地做錯。
分離規則/事實/流程,用指標而非逐字稿,盡量連活來源——最後,確認它真的讀了你指給它的東西。