manage-token-budget
Acerca de
Esta habilidad proporciona gestión del presupuesto de tokens para flujos de trabajo de agentes de IA de larga duración, permitiendo el seguimiento de costos, auditoría de ventanas de contexto y aplicación de límites. Implementa poda de emergencia y divulgación progresiva para controlar la acumulación de contexto y prevenir excesos en los costos de la API. Úsela al construir sistemas agentes que requieran salvaguardas de costos integradas o al solucionar problemas de crecimiento impredecible de tokens.
Instalación rápida
Claude Code
Recomendadonpx skills add pjt222/agent-almanac -a claude-code/plugin add https://github.com/pjt222/agent-almanacgit clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/manage-token-budgetCopia y pega este comando en Claude Code para instalar esta habilidad
Documentación
治詞元預算
控代理系之費與脈絡跡,每周追詞元用、查何耗脈絡、限預算、迫時刪低值、入錄前用元數而行漸顯。要旨:脈絡中每詞元當應其位。助決者留,佔位無功者去。
群中之證:三十七時自運費 $13.74,由三十分心跳、繁系令、無控脈絡累而生。修法:心跳改四時、用通知模、廢餵流瀏。此技刻防斯類事之模。
用時
- 久運代理環(心跳、輪詢、自運),費隨時積
- 運間脈絡視窗異增
- API 費逾預計,宜後察
- 設新代理流,欲始即立費衛
- 費事後審何誤以防再發
- 系令、記檔、工具規長至佔脈絡視窗主位
入
- 必:所欲設預算之代理系或流(運中或謀中)
- 必:預算頂(每期金額或每周詞元限)
- 可選:當前費數(API 日誌、賬板出)
- 可選:目標模之脈絡視窗大(默:察模文檔)
- 可選:可接降級策(限至何可棄)
法
第一步:立每周費追
裝代理環,使每運界皆錄詞元用。
每周(心跳、輪、任)捕:
- 入詞元:系令 + 記 + 工具規 + 對話史 + 新用者/系內容
- 出詞元:模應含工具呼
- 總費:入詞元 × 入價 + 出詞元 × 出價
- 周時戳:周何時運
- 周觸:何啟(時、事、用者動)
存於結構日誌(JSON 行、CSV、庫)——非脈絡視窗中:
{"cycle": 47, "ts": "2026-03-12T14:30:00Z", "trigger": "heartbeat",
"input_tokens": 18420, "output_tokens": 2105, "cost_usd": 0.0891,
"cumulative_cost_usd": 3.42}
若系無裝,自 API 賬估:
- 總費 / 周數 = 每周均費
- 與預基線比(模價 × 預脈絡大)
得: 顯每周詞元數與費之日誌,粒度足以識何周貴與其因。日誌身居脈絡外。
敗則: 若準詞元數不可得(某 API 不返用元),用賬板導均。粗追(日費 / 日周數)亦顯勢。若全無追,赴第二步從脈絡審入手——可由脈絡大估費。
第二步:審脈絡視窗
量何佔脈絡視窗,依大序耗者。
分脈絡為其諸件量之:
- 系令:基令、CLAUDE.md、人格令
- 記:MEMORY.md、自記載之主檔
- 工具規:MCP 服器工具定、函呼規
- 技法文:載活技之全 SKILL.md
- 對話史:當前會早前輪
- 動內容:當周之工具出、檔內容、搜結
生脈絡預算表:
Context Budget Audit:
+------------------------+--------+------+-----------------------------------+
| Component | Tokens | % | Notes |
+------------------------+--------+------+-----------------------------------+
| System prompt | 4,200 | 21% | Includes CLAUDE.md chain |
| Memory (auto-loaded) | 3,800 | 19% | MEMORY.md + 4 topic files |
| Tool schemas | 2,600 | 13% | 3 MCP servers, 47 tools |
| Active skill procedure | 1,900 | 9% | Full SKILL.md loaded |
| Conversation history | 5,100 | 25% | 12 prior turns |
| Current cycle content | 2,400 | 12% | Tool outputs from this cycle |
+------------------------+--------+------+-----------------------------------+
| TOTAL | 20,000 | 100% | Model limit: 200,000 |
| Remaining headroom |180,000 | | |
+------------------------+--------+------+-----------------------------------+
旗識比決策值不成比例之件。當前任不引之四千詞元記檔純為冗。
得: 序列表顯每脈絡耗者、其大、其視窗百分比。至少一件當顯為削之候——多為對話史或繁工具出。
敗則: 若每件準詞元數難得,英文用字數 / 4 估。結構數(JSON、YAML)用字數 / 3。要在相對序,非準量。
第三步:設預算限附行策
定硬軟限,明每限觸時為何。
-
軟限(警閾):常為硬限六七至七五成。觸則:
- 錄警附當前用與餘預算
- 始志願刪(第四步)最低值脈絡
- 若可,減周頻(如心跳由 30 分至 2 時)
- 以降脈絡續運
-
硬限(停閾):最大費或脈絡大。觸則:
- 即停自運
- 警人操作者(通知、郵、日誌)
- 存當態之要以待續
- 待人審准方再啟周
-
每周限:單周最大詞元或費。防一逸周耗整預算:
- 若周將逾,截工具出或略低先行動
- 錄截為後察
文檔限於工作流配:
token_budget:
soft_limit_usd: 5.00 # warn and begin pruning
hard_limit_usd: 10.00 # halt and alert
per_cycle_cap_usd: 0.50 # max per individual cycle
soft_limit_pct: 70 # % of context window triggering pruning
hard_limit_pct: 90 # % of context window triggering halt
enforcement: strict # strict = halt on hard limit; advisory = log only
alert_channel: notification # how to notify the operator
得: 三層(軟、硬、每周)已文檔之預算限附明確施。策答「至限時為何」於至限前。
敗則: 若準金限未成熟(新流未知費形),先用脈絡百分限(軟 70%、硬 90%),追費 24-48 時後加金限。校驗期間勸告模(錄而非停)可。
第四步:施急刪
至限時系統棄低值脈絡以居預算內。
刪先序(最低值先去):
- 舊工具出:前周已決後之繁搜結、檔內容、API 應。決留,證可去。
- 冗對話輪:早輪已被後修代。若三輪求 X 而七輪改 Y,三輪冗。
- 繁式:表、ASCII 畫、工具出之飾頭。以一行述出之內容代之。
- 完成子任脈絡:多步任中,已全完之子任脈絡,其出已存於要或檔。
- 不活技法:若技為前步載而不再循,其全文可棄。
- 與當前任無關之記:自載之關於別項或舊會之記。
每刪存一行墓碑:
[PRUNED: 2,400 tokens of npm audit output from cycle 12 — 3 vulnerabilities found, all patched]
墓碑費約二十詞元,然存決相關之結。
得: 刪後脈絡用降至軟限下。每刪有墓碑存其結。決關信息無失——只去已成決後之證。
敗則: 若刪至四級仍逾軟限,流於當前周頻根本太重。升至人操作者:「刪後脈絡用 N%。選:(甲)增周距,(乙)減每周範,(丙)分子流,(丁)受高費」。
第五步:載技時融漸顯
載全技法前先過錄元數——費於路非閱。
模:
- 先路:任需技時,自
_registry.yml讀技之錄條(id、述、域、難、籤)——約 3-5 行、約 50 詞元 - 驗合:錄述合當前所需乎?若否,察次候。每誤費約 50 詞元而非載誤 SKILL.md 之 500-2000 詞元
- 合則載:唯錄條驗合方載全 SKILL.md 法
- 用後卸:技法既畢,全文可刪(第四步、五級)——只留所行之要
施同模於他大脈絡載:
- 記檔:先讀 MEMORY.md 索行;唯主合方載主檔
- 工具文:用工具名與一行述為路;唯所呼工具方載全規
- 檔內容:先讀檔列與函簽;唯所改函方載全檔內容
Without progressive disclosure:
Load 5 candidate skills → 5 × 1,500 tokens = 7,500 tokens → use 1 skill
With progressive disclosure:
Route through 5 registry entries → 5 × 50 tokens = 250 tokens
Load 1 matched skill → 1 × 1,500 tokens = 1,500 tokens
Total: 1,750 tokens (77% reduction)
得: 載技循二段模:經元數輕路,唯驗合方全載。同模施於記、工具規、檔內容。
敗則: 若錄元數不足以路(述太泛、籤缺),改錄條而非棄漸顯。修在元數佳,非載更多脈絡。
第六步:設費覺周距
依費數設運距,非依無據之程。
-
算當前周距之每時費:
cost_per_hour = avg_cost_per_cycle × cycles_per_hour- 例:$0.09/周 × 2 周/時 = $0.18/時 = $4.32/日
-
與預算比:
hours_until_hard_limit = (hard_limit - cumulative_cost) / cost_per_hour- 若至硬限之時 < 擬運時,延周距
-
定最小有效距:
- 監系最速變率為何?若數源每四時更,每三十分輪費八之七
- 周距合數之刷新率,非合恐失事
- 事驅系,可則以鉤或推通知代輪
-
施距:
Before: 30-minute heartbeat, verbose processing
→ 48 cycles/day × $0.09/cycle = $4.32/day
After: 4-hour heartbeat, notification-only
→ 6 cycles/day × $0.04/cycle = $0.24/day
→ 94% cost reduction
得: 周距由費數證之,合監系刷新率。距-費衡已文檔以為後調基線。
敗則: 若系需低延而不容長距,改減每周費(縮系令、減載工具規、縮史)。預算式有二槓:頻與每周費。
第七步:驗預算控
確諸控皆作,系居預算內運。
- 追驗:運 3-5 周,驗每周日誌得書且詞元數準
- 軟限試:暫降軟限,驗警起且刪始
- 硬限試:暫降硬限,驗系停且警
- 每周限試:注大工具出,驗其被截而非破限
- 漸顯試:跡載技序,確其先過錄方載全 SKILL.md
- 費投:自驗數投:
- 當設下日費
- 當燒率下至硬限餘日
- 預月費
Budget Validation Report:
+-----------------------+----------+--------+
| Check | Expected | Actual |
+-----------------------+----------+--------+
| Per-cycle logging | Present | |
| Soft limit warning | Fires | |
| Hard limit halt | Halts | |
| Per-cycle cap | Truncates| |
| Progressive disclosure| Routes | |
| Daily cost projection | < $X.XX | |
+-----------------------+----------+--------+
得: 五控(追、軟限、硬限、每周限、漸顯)皆驗作。費投居擬預算內。
敗則: 若控不起,察施機嵌於實運環,非僅文檔。配無施為謀非控。若費投逾預算,回第六步調周距或每周費。
驗
- 每周費追為每周錄入詞元、出詞元、費、時戳
- 脈絡視窗審識諸耗者附約詞元數與百分比
- 預算限定於三層:軟限、硬限、每周限
- 每限有明確施動(警、刪、停、警報)
- 急刪循先序並存墓碑
- 漸顯經元數路而後載全內容
- 周距由費數證且合監系刷新率
- 驗試確諸控皆正起
- 費投居所定預算內
- 事後:根因已識且具體防措已置
陷
- 追於脈絡視窗中:每周日誌存於對話史中即膨欲控之物。外錄(檔、庫、API),脈絡只留當前要
- 軟限無施:無人見之警非控。軟限必觸可見動——刪、延距、警操作者。系若可默逾軟限,必逾
- 決前刪數:決前棄工具出失信息。在所助之決後刪證,非前。墓碑模存結而棄證
- 周距合恐而非數刷:每四時更之源每三十分輪費 87.5% 周。設距前測數源實刷率
- 為路而載全技:讀四百行 SKILL.md 決「此為對技乎」費讀三行錄條 10-20 倍。先過元數路;唯驗合方載法
- 忽系令:系令、CLAUDE.md 鏈、自載記為隱費——每周皆付。五千詞元系令於日 48 周環只為令日費 24 萬入詞元。先審削此
- 預算限無人升:自運系至限默降(非警人)可累害。硬限必含人通知道
參
assess-context— 評推理脈絡之構健;補第二步脈絡視窗審metal— 自庫提概念精;漸顯模施於 metal 之探階chrysopoeia— 提值與棄死重;於碼層施同每詞元值思manage-memory— 整與刪持久記檔;直減脈絡預算之記件
Repositorio GitHub
Habilidades relacionadas
executing-plans
DiseñoUtilice la habilidad executing-plans cuando tenga un plan de implementación completo para ejecutar en lotes controlados con puntos de revisión. Esta habilidad carga y revisa críticamente el plan, luego ejecuta tareas en pequeños lotes (por defecto 3 tareas) mientras reporta el progreso entre cada lote para la revisión del arquitecto. Esto asegura una implementación sistemática con puntos de control de calidad integrados.
requesting-code-review
DiseñoEsta habilidad despacha un subagente revisor de código para analizar los cambios en el código frente a los requisitos antes de proceder. Debe usarse después de completar tareas, implementar funciones principales o antes de fusionar con la rama principal. La revisión ayuda a detectar problemas de forma temprana al comparar la implementación actual con el plan original.
connect-mcp-server
DiseñoEsta habilidad proporciona una guía integral para que los desarrolladores conecten servidores MCP a Claude Code mediante transportes HTTP, stdio o SSE. Cubre la instalación, configuración, autenticación y seguridad para integrar servicios externos como GitHub, Notion y APIs personalizadas. Úsala al configurar integraciones MCP, al configurar herramientas externas o al trabajar con el Protocolo de Contexto del Modelo de Claude.
web-cli-teleport
DiseñoEsta habilidad ayuda a los desarrolladores a elegir entre las interfaces web y CLI de Claude Code mediante el análisis de tareas, y luego permite la teletransportación fluida de sesiones entre estos entornos. Optimiza el flujo de trabajo gestionando el estado y el contexto de la sesión al cambiar entre web, CLI o móvil. Úsala para proyectos complejos que requieren diferentes herramientas en varias etapas.
