common-context-optimization
について
このClaudeスキルは、冗長なログやJSONなどの出力を意味論的な要約でマスキングすることで、コンテキストの使用を最適化し、「中間での見失い」問題を防止します。また、長い会話履歴を圧縮して核心的な意図を保持し、トークン数を削減します。大容量ファイルやコマンドによってトリガーされた際に使用することで、遅延を軽減し、アテンションバジェットを最大限に活用できます。
クイックインストール
Claude Code
推奨npx skills add HoangNguyen0403/agent-skills-standard -a claude-code/plugin add https://github.com/HoangNguyen0403/agent-skills-standardgit clone https://github.com/HoangNguyen0403/agent-skills-standard.git ~/.claude/skills/common-context-optimizationこのコマンドをClaude Codeにコピー&ペーストしてスキルをインストールします
GitHub リポジトリ
関連スキル
llamaguard
その他LlamaGuardは、暴力やヘイトスピーチなど6つの安全性カテゴリーにおいて、LLMの入力と出力をモデレートするMetaの70-80億パラメータモデルです。94〜95%の精度を提供し、vLLM、Hugging Face、Amazon SageMakerを使用してデプロイ可能です。このスキルを使用して、AIアプリケーションにコンテンツフィルタリングと安全策を簡単に統合できます。
cost-optimization
その他このClaudeスキルは、リソースの適正サイジング、タグ付け戦略、支出分析を通じて、開発者がクラウドコストを最適化することを支援します。AWS、Azure、GCPにわたるクラウド支出の削減とコストガバナンスの実施のためのフレームワークを提供します。インフラコストの分析、リソースの適正サイジング、または予算制約への対応が必要な際にご利用ください。
quantizing-models-bitsandbytes
その他このスキルは、bitsandbytesを使用してLLMを8ビットまたは4ビット精度に量子化し、精度の低下を最小限に抑えつつ50〜75%のメモリ削減を実現します。限られたGPUメモリでより大規模なモデルを実行したり、推論を高速化するのに理想的で、INT8、NF4、FP4などのフォーマットをサポートしています。HuggingFace Transformersと統合され、QLoRAトレーニングや8ビットオプティマイザーを可能にします。
dispatching-parallel-agents
その他このClaudeスキルは、複数のエージェントを配備し、3つ以上の独立した問題を並行して調査・修正します。共有状態や依存関係がなく解決可能な、無関係な障害が発生するシナリオ向けに設計されています。中核となる機能は並列問題解決であり、効率を最大化するために独立した問題領域ごとに1つのエージェントを割り当てます。
