SKILL·6F4EE3

plan-capacity

Name: plan-capacity
Author: pjt222

pjt222

업데이트됨 1 month ago

8 조회

기타ai

정보

이 스킬은 `predict_linear`을 사용하여 과거 메트릭과 성장 모델을 기반으로 용량 계획을 수행하며, 리소스 필요량을 예측합니다. 병목 현상을 식별하고, 헤드룸을 계산하며, 포화 상태를 방지하기 위한 확장 조치를 권장합니다. 트래픽 급증 전, 제품 출시 시기, 분기별 검토 중, 또는 사용률 상승 추세를 관찰할 때 활용하세요.

빠른 설치

Claude Code

문서

name: plan-capacity description: > Kapazitaetsplanung anhand historischer Metriken und Wachstumsmodelle durchfuehren. predict_linear fuer Prognosen verwenden, Ressourcenengpaesse identifizieren, Spielraum berechnen und Skalierungsmassnahmen empfehlen, bevor Saettigung eintritt. Verwenden, vor saisonalen Traffic-Spitzen oder Produktlaunches, waehrend vierteljaehrlicher Kapazitaets- reviews, wenn Ressourcenauslastungstrends aufwaerts zeigen oder vor Budget-Planungszyklen. locale: de source_locale: en source_commit: 6f65f316 translator: claude-opus-4-6 translation_date: 2026-03-16 license: MIT allowed-tools: Read Write Edit Bash Grep Glob metadata: author: Philipp Thoss version: "1.0" domain: observability complexity: intermediate language: multi tags: capacity-planning, forecasting, predict-linear, growth, headroom

Kapazitaet planen

Ressourcenbedarf prognostizieren und Saettigung durch datengetriebene Kapazitaetsplanung vermeiden.

Wann verwenden

Vor saisonalen Traffic-Spitzen (Feiertage, Verkaufsereignisse)
Bei der Planung neuer Feature-Launches
Waehrend vierteljaehrlicher Kapazitaets-Reviews
Wenn Ressourcenauslastungstrends aufwaerts zeigen
Vor Budget-Planungszyklen

Eingaben

Pflichtfeld: Historische Metriken (CPU, Arbeitsspeicher, Festplatte, Netzwerk, Anfragen/Sek.)
Pflichtfeld: Zeitbereich fuer Trendanalyse (mindestens 4 Wochen)
Optional: Geschaeftliche Wachstumsprognosen (erwartetes Nutzerwachstum, Feature-Launches)
Optional: Budgeteinschraenkungen

Vorgehensweise

Schritt 1: Historische Metriken sammeln

Schluessel-Ressourcenmetriken aus Prometheus abfragen:

# CPU usage trend over 8 weeks
avg(rate(node_cpu_seconds_total{mode!="idle"}[5m])) by (instance)

# Memory usage trend
avg(node_memory_MemTotal_bytes - node_memory_MemAvailable_bytes) by (instance)

# Disk usage growth
avg(node_filesystem_size_bytes - node_filesystem_free_bytes) by (instance, device)

# Request rate growth
sum(rate(http_requests_total[5m])) by (service)

# Database connection pool usage
avg(db_connection_pool_used / db_connection_pool_max) by (instance)

Zur Analyse exportieren:

# Export 8 weeks of CPU data
curl -G 'http://prometheus:9090/api/v1/query_range' \
  --data-urlencode 'query=avg(rate(node_cpu_seconds_total{mode!="idle"}[5m])) by (instance)' \
  --data-urlencode 'start=2024-12-15T00:00:00Z' \
  --data-urlencode 'end=2025-02-09T00:00:00Z' \
  --data-urlencode 'step=1h' | jq '.data.result' > cpu_8weeks.json

Erwartet: Saubere Zeitreihendaten fuer jede Ressource ohne grosse Luecken.

Bei Fehler: Fehlende Daten reduzieren die Prognosegenauigkeit. Metrik-Aufbewahrung und Scrape-Intervalle pruefen.

Schritt 2: Wachstumsraten mit predict_linear berechnen

Prometheus's predict_linear() verwenden, um Saettigung zu prognostizieren:

# Predict when CPU will hit 80% (4 weeks ahead)
predict_linear(
  avg(rate(node_cpu_seconds_total{mode!="idle"}[5m]))[8w:],
  4*7*24*3600  # 4 weeks in seconds
) > 0.80

# Predict disk full date (8 weeks ahead)
predict_linear(
  avg(node_filesystem_size_bytes - node_filesystem_free_bytes)[8w:],
  8*7*24*3600
) > 0.95 * avg(node_filesystem_size_bytes)

# Predict memory pressure (2 weeks ahead)
predict_linear(
  avg(node_memory_MemTotal_bytes - node_memory_MemAvailable_bytes)[8w:],
  2*7*24*3600
) / avg(node_memory_MemTotal_bytes) > 0.90

# Predict request rate capacity breach (4 weeks ahead)
predict_linear(
  sum(rate(http_requests_total[5m]))[8w:],
  4*7*24*3600
) > 10000  # known capacity limit

Ein Prognose-Dashboard erstellen:

{
  "dashboard": {
    "title": "Capacity Forecast",
    "panels": [
      {
        "title": "CPU Saturation Forecast (4 weeks)",
        "targets": [
          {
            "expr": "predict_linear(avg(rate(node_cpu_seconds_total{mode!=\"idle\"}[5m]))[8w:], 4*7*24*3600)",
            "legendFormat": "Predicted CPU"
          },
          {
            "expr": "0.80",
            "legendFormat": "Target Threshold (80%)"
          }
        ]
      },
      {
        "title": "Disk Full Date",
        "targets": [
          {
            "expr": "(avg(node_filesystem_size_bytes) - predict_linear(avg(node_filesystem_free_bytes)[8w:], 8*7*24*3600)) / avg(node_filesystem_size_bytes)",
            "legendFormat": "Predicted Usage %"
          }
        ]
      }
    ]
  }
}

Erwartet: Klare Visualisierung, die zeigt, wann Ressourcen Schwellenwerte ueberschreiten werden.

Bei Fehler: Wenn Prognosen falsch aussehen (negative Werte, wilde Schwankungen), auf folgendes pruefen:

Unzureichende Historie (mindestens 4 Wochen erforderlich)
Stufenfoermige Spitzen (Deployments, Migrationen) verzerren den Trend
Saisonale Muster, die das lineare Modell nicht erfasst

Schritt 3: Aktuellen Spielraum berechnen

Sicherheitsspanne vor der Saettigung bestimmen:

# CPU headroom (percentage remaining before 80% threshold)
(0.80 - avg(rate(node_cpu_seconds_total{mode!="idle"}[5m]))) / 0.80 * 100

# Memory headroom (bytes remaining before 90% usage)
avg(node_memory_MemAvailable_bytes) - (avg(node_memory_MemTotal_bytes) * 0.10)

# Request rate headroom (requests/sec before saturation)
10000 - sum(rate(http_requests_total[5m]))

# Time until saturation (weeks until CPU hits 80%)
(0.80 - avg(rate(node_cpu_seconds_total{mode!="idle"}[5m]))) /
  deriv(avg(rate(node_cpu_seconds_total{mode!="idle"}[5m]))[8w:]) /
  (7*24*3600)

Einen Spielraum-Zusammenfassungsbericht erstellen:

cat > capacity_headroom.md <<'EOF'
# Capacity Headroom Report (2025-02-09)

## Current Utilization
- **CPU**: 45% average (target: <80%)
- **Memory**: 62% (target: <90%)
- **Disk**: 71% (target: <95%)
- **Request Rate**: 4,200 req/s (capacity: 10,000)

## Headroom Analysis
- **CPU**: 35% headroom → ~12 weeks until saturation
- **Memory**: 28% headroom → ~16 weeks until saturation
- **Disk**: 24% headroom → ~8 weeks until full
- **Request Rate**: 5,800 req/s headroom → ~20 weeks until capacity

## Priority Actions
1. **Disk**: Implement log rotation or expand volume within 4 weeks
2. **CPU**: Plan horizontal scaling in next quarter
3. **Memory**: Monitor but no immediate action needed
EOF

Erwartet: Quantifizierter Spielraum fuer jede Ressource mit Zeitschatzungen bis zur Saettigung.

Bei Fehler: Wenn der Spielraum bereits negativ ist, befindet man sich im reaktiven Modus. Sofortige Skalierung erforderlich.

Schritt 4: Wachstumsszenarien modellieren

Geschaeftliche Prognosen einbeziehen:

# Example Python script for scenario modeling
import pandas as pd
import numpy as np

# Load historical data
df = pd.read_json('cpu_8weeks.json')

# Calculate weekly growth rate
growth_rate_weekly = df['value'].pct_change(periods=7).mean()

# Scenario 1: Current trend
weeks_ahead = 12
current_trend = df['value'].iloc[-1] * (1 + growth_rate_weekly) ** weeks_ahead

# Scenario 2: 2x user growth (marketing campaign)
accelerated_trend = df['value'].iloc[-1] * (1 + growth_rate_weekly * 2) ** weeks_ahead

# Scenario 3: New feature launch (+30% baseline)
feature_launch = (df['value'].iloc[-1] * 1.30) * (1 + growth_rate_weekly) ** weeks_ahead

print(f"Current Trend (12 weeks): {current_trend:.1%} CPU")
print(f"2x Growth Scenario: {accelerated_trend:.1%} CPU")
print(f"Feature Launch Scenario: {feature_launch:.1%} CPU")
print(f"Threshold: 80%")

Erwartet: Mehrere Szenarien zeigen die Auswirkungen von Geschaeftsaenderungen auf die Kapazitaet.

Bei Fehler: Wenn Szenarien die Kapazitaet ueberschreiten, Skalierung vor dem Ereignis priorisieren.

Schritt 5: Skalierungsempfehlungen generieren

Handlungsorientierte Empfehlungen erstellen:

## Capacity Scaling Plan

### Immediate Actions (Next 4 Weeks)
1. **Disk Expansion** [Priority: HIGH]
   - Current: 500GB, 71% used
   - Projected full date: 2025-04-01 (8 weeks)
   - Action: Expand to 1TB by 2025-03-15
   - Cost: $50/month additional
   - Justification: 5 weeks lead time needed

2. **Log Rotation Policy** [Priority: MEDIUM]
   - Current: Logs retained 90 days
   - Action: Reduce to 30 days, archive to S3
   - Savings: ~150GB disk space
   - Cost: $5/month S3 storage

### Near-Term Actions (Next Quarter)
3. **Horizontal Scaling - API Tier** [Priority: MEDIUM]
   - Current: 4 instances, 45% CPU
   - Projected: 65% CPU by 2025-05-01
   - Action: Add 2 instances (to 6 total)
   - Cost: $400/month
   - Trigger: When CPU avg exceeds 60% for 7 days

4. **Database Connection Pool** [Priority: LOW]
   - Current: 50 max connections, 40% used
   - Projected: 55% by Q3
   - Action: Increase to 75 in Q2
   - Cost: None (configuration change)

### Long-Term Planning (Next 6 Months)
5. **Migration to Auto-Scaling** [Priority: MEDIUM]
   - Current: Manual scaling
   - Action: Implement Kubernetes HPA (Horizontal Pod Autoscaler)
   - Timeline: Q3 2025
   - Benefit: Automatic response to load spikes

Erwartet: Priorisierte Liste mit Kosten, Zeitplaenen und Ausloesebedingungen.

Bei Fehler: Wenn Empfehlungen wegen Kosten abgelehnt werden, Schwellenwerte ueberarbeiten oder Risiko akzeptieren.

Schritt 6: Kapazitaets-Alerts einrichten

Alerts fuer geringen Spielraum erstellen:

# capacity_alerts.yml
groups:
  - name: capacity
    interval: 1h
    rules:
      - alert: CPUCapacityLow
        expr: |
          (0.80 - avg(rate(node_cpu_seconds_total{mode!="idle"}[5m]))) / 0.80 < 0.20
        for: 24h
        labels:
          severity: warning
        annotations:
          summary: "CPU headroom below 20%"
          description: "Current CPU headroom: {{ $value | humanizePercentage }}. Scaling needed within 4 weeks."

      - alert: DiskFillForecast
        expr: |
          predict_linear(avg(node_filesystem_free_bytes)[8w:], 4*7*24*3600) < 0.10 * avg(node_filesystem_size_bytes)
        for: 1h
        labels:
          severity: warning
        annotations:
          summary: "Disk projected to fill within 4 weeks"
          description: "Expand disk volume soon."

      - alert: MemoryCapacityLow
        expr: |
          avg(node_memory_MemAvailable_bytes) < 0.15 * avg(node_memory_MemTotal_bytes)
        for: 6h
        labels:
          severity: warning
        annotations:
          summary: "Memory headroom below 15%"

Erwartet: Alerts loesen vor der Saettigung aus und geben Zeit fuer proaktive Skalierung.

Bei Fehler: Schwellenwerte anpassen, wenn Alerts zu oft auslosen (Alert-Ueberlastung) oder zu spaet (reaktives Handeln).

Validierung

Historische Metriken decken mindestens 8 Wochen ab
predict_linear()-Abfragen liefern sinnvolle Prognosen (keine negativen Werte)
Spielraum fuer alle kritischen Ressourcen berechnet
Wachstumsszenarien enthalten geschaeftliche Prognosen
Skalierungsempfehlungen haben Kosten und Zeitplaene
Kapazitaets-Alerts konfiguriert und getestet
Bericht mit Ingenieurleitung und Finanzen besprochen

Haeufige Stolperfallen

Unzureichende Historie: Lineare Prognosen benoetigen mindestens 4 Wochen Daten. Weniger davon macht Prognosen unzuverlaessig.
Stufenfoermige Aenderungen ignorieren: Deployments, Migrationen oder Feature-Launches verzerren Trends. Filtern oder annotieren.
Lineare Annahme: Nicht alles Wachstum ist linear. Exponentielles Wachstum (virale Produkte) erfordert andere Modelle.
Vorlaufzeit vergessen: Cloud-Provisioning ist schnell, aber Beschaffung, Budgets und Migrationen dauern Wochen. Fruehzeitig planen.
Keine Budget-Abstimmung: Kapazitaetsplanung ohne Budget-Zustimmung fuehrt zu Last-Minute-Hektik. Finanzen fruehzeitig einbeziehen.

GitHub 저장소

pjt222/agent-almanac

경로: i18n/de/skills/plan-capacity

agentsagentskillsai-assisted-developmentclaude-codeskillsteams

FAQ

Frequently asked questions

What is the plan-capacity skill?

plan-capacity is a Claude Skill by pjt222. Skills package instructions and resources that Claude loads on demand, so Claude can perform plan-capacity-related tasks without extra prompting.

How do I install plan-capacity?

Use the install commands on this page: add plan-capacity to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does plan-capacity belong to?

plan-capacity is in the Other category, tagged ai.

Is plan-capacity free to use?

Yes. plan-capacity is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.

연관 스킬

llamaguard

기타

LlamaGuard는 폭력 및 혐오 발언 등 6가지 안전 범주에서 LLM 입력과 출력을 조정하기 위한 Meta의 70-80억 파라미터 모델입니다. 94-95% 정확도를 제공하며 vLLM, Hugging Face 또는 Amazon SageMaker를 사용해 배포할 수 있습니다. 이 기술을 사용하여 AI 애플리케이션에 콘텐츠 필터링 및 안전 가드레일을 손쉽게 통합하세요.

스킬 보기

cost-optimization

기타

이 Claude Skill은 리소스 적정화, 태깅 전략, 지출 분석을 통해 개발자들이 클라우드 비용을 최적화할 수 있도록 지원합니다. AWS, Azure, GCP에서 클라우드 비용을 절감하고 비용 거버넌스를 구현하기 위한 프레임워크를 제공합니다. 인프라 비용을 분석하거나, 리소스를 적정화하거나, 예산 제약을 충족해야 할 때 사용하세요.

스킬 보기

sports-betting-analyzer

기타

이 Claude Skill은 스프레드, 오버/언더, 프로프 베트를 포함한 스포츠 베팅 시장을 분석합니다. 역사적 추이와 상황별 통계를 검토하여 가치 베트를 발견하고, 교육적 목적으로 실행 가능한 권장 사항이 담긴 구조화된 마크다운 결과를 제공합니다. 개발자는 이 기능을 스포츠 베팅 분석 도구에 활용할 수 있으며, 단순히 엔터테인먼트/교육 목적으로만 설계되었음을 유의해야 합니다.

스킬 보기

quantizing-models-bitsandbytes

기타

이 스킬은 bitsandbytes를 사용하여 LLM을 8비트 또는 4비트 정밀도로 양자화하며, 최소한의 정확도 손실로 50-75%의 메모리 감소를 달성합니다. 제한된 GPU 메모리에서 더 큰 모델을 실행하거나 추론을 가속화하는 데 이상적이며, INT8, NF4, FP4와 같은 형식을 지원합니다. 이 스킬은 HuggingFace Transformers와 통합되어 QLoRA 학습 및 8비트 옵티마이저를 가능하게 합니다.

스킬 보기

plan-capacity

정보

빠른 설치

Claude Code

문서

Kapazitaet planen

Wann verwenden

Eingaben

Vorgehensweise

Schritt 1: Historische Metriken sammeln

Schritt 2: Wachstumsraten mit predict_linear berechnen

Schritt 3: Aktuellen Spielraum berechnen

Schritt 4: Wachstumsszenarien modellieren

Schritt 5: Skalierungsempfehlungen generieren

Schritt 6: Kapazitaets-Alerts einrichten

Validierung

Haeufige Stolperfallen

Verwandte Skills

GitHub 저장소

Frequently asked questions

What is the plan-capacity skill?

How do I install plan-capacity?

What category does plan-capacity belong to?

Is plan-capacity free to use?

연관 스킬