context-manager

majiayu000

Updated Today

2 views

Designaidesigndata

About

The context-manager skill provides expertise in designing and optimizing AI memory systems, including RAG architectures and conversation history management. It helps developers efficiently manage context windows, implement long-term memory, and reduce token usage. Use this skill when building or refining AI agent memory, optimizing context utilization, or implementing persistent multi-session systems.

Quick Install

Claude Code

Recommended

Plugin CommandRecommended

/plugin add https://github.com/majiayu000/claude-skill-registry

Git CloneAlternative

git clone https://github.com/majiayu000/claude-skill-registry.git ~/.claude/skills/context-manager

Copy and paste this command in Claude Code to install this skill

Documentation

Context Manager

Purpose

Provides expertise in AI context management, memory architectures, and context window optimization. Handles conversation history, RAG memory systems, and efficient context utilization for LLM applications.

When to Use

Designing AI memory and context systems
Optimizing context window usage
Implementing conversation history management
Building long-term memory for AI agents
Managing RAG retrieval context
Reducing token usage while preserving quality
Designing multi-session memory persistence

Quick Start

Invoke this skill when:

Designing AI memory and context systems
Optimizing context window usage
Implementing conversation history management
Building long-term memory for AI agents
Reducing token usage while preserving quality

Do NOT invoke when:

Building full RAG pipelines (use ai-engineer)
Managing vector databases (use data-engineer)
Coordinating multiple agents (use agent-organizer)
Training embedding models (use ml-engineer)

Decision Framework

Memory Type Selection:
├── Single conversation → Sliding window context
├── Multi-session user → Persistent memory store
├── Knowledge-heavy → RAG with vector DB
├── Task-oriented → Working memory + tool results
└── Long-running agent
    ├── Episodic memory → Event summaries
    ├── Semantic memory → Knowledge graph
    └── Procedural memory → Learned patterns

Core Workflows

1. Context Window Optimization

Measure current token usage
Identify redundant or verbose content
Implement summarization for old messages
Prioritize recent and relevant context
Use compression techniques
Monitor quality vs. token tradeoff

2. Conversation Memory Design

Define memory retention requirements
Choose storage strategy (in-memory, DB)
Implement message windowing
Add summarization for overflow
Design retrieval for relevant history
Handle session boundaries

3. Long-term Memory Implementation

Define memory types needed
Design memory storage schema
Implement memory write triggers
Build retrieval mechanisms
Add memory consolidation
Implement forgetting policies

Best Practices

Summarize old context rather than truncating
Use semantic search for relevant history retrieval
Separate system instructions from conversation
Cache frequently accessed context
Monitor context utilization metrics
Implement graceful degradation at limits

Anti-Patterns

Anti-Pattern	Problem	Correct Approach
Full history always	Exceeds context limits	Sliding window + summaries
No summarization	Lost important context	Summarize before eviction
Equal priority	Wastes tokens on irrelevant	Weight recent/relevant higher
No persistence	Lost memory across sessions	Store important memories
Ignoring token costs	Expensive API calls	Monitor and optimize usage

GitHub Repository

majiayu000/claude-skill-registry

Path: skills/context-manager-skill

Related Skills

content-collections

creating-opencode-plugins

sglang

evaluating-llms-harness

Testing

This Claude Skill runs the lm-evaluation-harness to benchmark LLMs across 60+ standardized academic tasks like MMLU and GSM8K. It's designed for developers to compare model quality, track training progress, or report academic results. The tool supports various backends including HuggingFace and vLLM models.

View skill