SKILL·7FB9F8

optimize-cloud-costs

Name: optimize-cloud-costs
Author: pjt222

pjt222

업데이트됨 1 month ago

9 조회

기타general

정보

이 Claude Skill은 Kubecost를 활용하여 Kubernetes 클라우드 비용 최적화를 구현합니다. 가시성 확보, 적정 크기 조정, 오토스케일링을 통해 비즈니스 가치 없이 비용이 상승하거나, 리소스 요청이 실제 사용량과 불일치하거나, 수동 스케일링으로 과도한 프로비저닝이 발생하는 상황에 대응합니다. 본 스킬은 비용 할당, 쇼백 보고서, 스팟 인스턴스 활용 및 리소스 할당량 설정과 같은 실무 방법을 다룹니다.

빠른 설치

Claude Code

문서

クラウドコストの最適化

クラウド支出を削減するためのKubernetesクラスターの包括的なコスト最適化戦略を実装する。

使用タイミング

クラウドインフラストラクチャコストがビジネス価値の対応する増加なしに増大している時
チーム、アプリケーション、または環境別のコスト配分の可視性が必要な時
リソースリクエスト/リミットが実際の使用パターンと一致していない時
手動スケーリングが過剰プロビジョニングと無駄につながっている時
非クリティカルなワークロードにスポット/プリエンプティブルインスタンスを活用したい時
内部コスト配分のためにショーバックまたはチャージバックを実装する必要がある時
コスト意識と説明責任を持つFinOps文化を確立したい時

入力

必須: ワークロードが実行中のKubernetesクラスター
必須: クラウドプロバイダーの課金APIアクセス
必須: リソースメトリクス用のメトリクスサーバーまたはPrometheus
任意: トレンド分析用の過去の使用データ
任意: コスト配分要件（ネームスペース、ラベル、チーム別）
任意: パフォーマンス制約用のサービスレベル目標（SLO）
任意: 予算制限またはコスト削減目標

手順

完全な設定ファイルとテンプレートについてはExtended Examplesを参照。

ステップ1: コスト可視化ツールのデプロイ

コストモニタリングと配分のためにKubecostまたはOpenCostをインストールする。

Kubecostのインストール:

# Add Kubecost Helm repository
helm repo add kubecost https://kubecost.github.io/cost-analyzer/
helm repo update

# Install Kubecost with Prometheus integration
helm install kubecost kubecost/cost-analyzer \
  --namespace kubecost \
  --create-namespace \
  --set kubecostToken="your-token-here" \
  --set prometheus.server.global.external_labels.cluster_id="production-cluster" \
  --set prometheus.nodeExporter.enabled=true \
  --set prometheus.serviceAccounts.nodeExporter.create=true

# For existing Prometheus, configure Kubecost to use it
helm install kubecost kubecost/cost-analyzer \
  --namespace kubecost \
  --create-namespace \
  --set prometheus.enabled=false \
  --set global.prometheus.fqdn="http://prometheus-server.monitoring.svc.cluster.local" \
  --set global.prometheus.enabled=true

# Verify installation
kubectl get pods -n kubecost
kubectl get svc -n kubecost

# Access Kubecost UI
kubectl port-forward -n kubecost svc/kubecost-cost-analyzer 9090:9090
# Open http://localhost:9090

クラウドプロバイダー統合の設定:

# kubecost-cloud-integration.yaml
apiVersion: v1
kind: Secret
metadata:
  name: cloud-integration
  namespace: kubecost
type: Opaque
stringData:
  # For AWS
  cloud-integration.json: |
    {
      "aws": [
        {
          "serviceKeyName": "AWS_ACCESS_KEY_ID",
          "serviceKeySecret": "AWS_SECRET_ACCESS_KEY",
          "athenaProjectID": "cur-query-results",
          "athenaBucketName": "s3://your-cur-bucket",
          "athenaRegion": "us-east-1",
          "athenaDatabase": "athenacurcfn_my_cur",
          "athenaTable": "my_cur"
        }
      ]
    }
---
# For GCP
apiVersion: v1
kind: Secret
metadata:
  name: gcp-key
  namespace: kubecost
type: Opaque
data:
  key.json: <base64-encoded-service-account-key>
---
# For Azure
apiVersion: v1
kind: ConfigMap
metadata:
  name: azure-config
  namespace: kubecost
data:
  azure.json: |
    {
      "azureSubscriptionID": "your-subscription-id",
      "azureClientID": "your-client-id",
      "azureClientSecret": "your-client-secret",
      "azureTenantID": "your-tenant-id",
      "azureOfferDurableID": "MS-AZR-0003P"
    }

クラウド統合を適用する:

kubectl apply -f kubecost-cloud-integration.yaml

# Verify cloud costs are being imported
kubectl logs -n kubecost -l app=cost-analyzer -c cost-model --tail=100 | grep -i "cloud"

# Check Kubecost API for cost data
kubectl port-forward -n kubecost svc/kubecost-cost-analyzer 9090:9090 &
curl http://localhost:9090/model/allocation\?window\=7d | jq .

期待結果: Kubecostポッドが正常に実行されている。ネームスペース、デプロイメント、ポッド別のコスト内訳を表示するUIにアクセスできる。クラウドプロバイダーコストがインポートされている（初回同期には24-48時間かかる場合がある）。APIがアロケーションデータを返している。

失敗時:

Prometheusが実行中でアクセス可能か確認する: kubectl get svc -n monitoring prometheus-server
クラウド認証情報に課金APIアクセスがあるか確認する
cost-modelのログをレビューする: kubectl logs -n kubecost -l app=cost-analyzer -c cost-model
メトリクスサーバーまたはPrometheusのnode-exporterがリソースメトリクスを収集していることを確認する
クラウド課金APIへのアクセスをブロックしているネットワークポリシーがないか確認する

ステップ2: 現在のリソース使用率を分析する

過剰プロビジョニングされたリソースと最適化の機会を特定する。

リソース使用率を照会する:

# Get resource requests vs usage for all pods
kubectl top pods --all-namespaces --containers | \
  awk 'NR>1 {print $1,$2,$3,$4,$5}' > current-usage.txt

# Compare requests to actual usage
cat <<'EOF' > analyze-utilization.sh
#!/bin/bash
echo "Pod,Namespace,CPU-Request,CPU-Usage,Memory-Request,Memory-Usage"
for ns in $(kubectl get ns -o jsonpath='{.items[*].metadata.name}'); do
  kubectl get pods -n $ns -o json | jq -r '
    .items[] |
    select(.status.phase == "Running") |
    {
      name: .metadata.name,
      namespace: .metadata.namespace,
      containers: [
        .spec.containers[] |
        {
          name: .name,
          cpuReq: .resources.requests.cpu,
          memReq: .resources.requests.memory
        }
      ]
    } |
    "\(.name),\(.namespace),\(.containers[].cpuReq // "none"),\(.containers[].memReq // "none")"
  ' 2>/dev/null
done
EOF

chmod +x analyze-utilization.sh
./analyze-utilization.sh > resource-requests.csv

# Get actual usage from metrics server
kubectl top pods --all-namespaces --containers > actual-usage.txt

Kubecostの推奨を使用する:

# Get right-sizing recommendations via API
curl "http://localhost:9090/model/savings/requestSizing?window=7d" | jq . > recommendations.json

# Extract top wasteful resources
jq '.data[] | select(.totalRecommendedSavings > 10) | {
  cluster: .clusterID,
# ... (see EXAMPLES.md for complete configuration)

使用率ダッシュボードを作成する:

# grafana-utilization-dashboard.yaml
apiVersion: v1
kind: ConfigMap
metadata:
  name: utilization-dashboard
  namespace: monitoring
# ... (see EXAMPLES.md for complete configuration)

期待結果: 現在のリソースリクエストと実際の使用量の明確なビュー。使用率30%未満のポッド（過剰プロビジョニング）の特定。推定節約額付きの最適化機会のリスト。時系列の使用率トレンドを表示するダッシュボード。

失敗時:

メトリクスサーバーが実行中か確認する: kubectl get deployment metrics-server -n kube-system
Prometheusにnode-exporterメトリクスがあるか確認する: curl http://prometheus:9090/api/v1/query?query=node_cpu_seconds_total
有意なデータのためにポッドが十分な時間実行されていることを確認する（少なくとも24時間）
メトリクス収集のギャップを確認する: Prometheusの保持期間とスクレイプ間隔をレビューする
Kubecostの場合、少なくとも48時間のデータが収集されていることを確認する

ステップ3: 水平ポッドオートスケーリング（HPA）の実装

CPU、メモリ、またはカスタムメトリクスに基づく自動スケーリングを設定する。

CPUベースのスケーリング用HPAを作成する:

# hpa-cpu.yaml
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
  name: api-server-hpa
  namespace: production
# ... (see EXAMPLES.md for complete configuration)

HPAのデプロイと検証:

kubectl apply -f hpa-cpu.yaml

# Check HPA status
kubectl get hpa -n production
kubectl describe hpa api-server-hpa -n production

# Monitor scaling events
kubectl get events -n production --field-selector involvedObject.kind=HorizontalPodAutoscaler --watch

# Generate load to test autoscaling
kubectl run load-generator --rm -it --image=busybox -- /bin/sh -c \
  "while true; do wget -q -O- http://api-server.production.svc.cluster.local; done"

# Watch replicas scale
watch kubectl get hpa,deployment -n production

期待結果: HPAが作成され、現在/目標メトリクスを表示している。負荷時にポッドがスケールアップする。負荷が減少するとポッドがスケールダウンする（安定化ウィンドウ後）。スケーリングイベントがログに記録される。スラッシング（急速なスケールアップ/ダウンサイクル）がない。

失敗時:

メトリクスサーバーが実行中か確認する: kubectl get apiservice v1beta1.metrics.k8s.io
デプロイメントにリソースリクエストが設定されているか確認する（HPAにはこれが必要）
HPAイベントをレビューする: kubectl describe hpa api-server-hpa -n production
ターゲットデプロイメントが最大レプリカに達していないか確認する
カスタムメトリクスの場合、メトリクスアダプターがインストールされ設定されているか確認する
HPAコントローラーのログを確認する: kubectl logs -n kube-system -l app=kube-controller-manager | grep horizontal-pod-autoscaler

ステップ4: 垂直ポッドオートスケーリング（VPA）の設定

実際の使用パターンに基づいてリソースリクエストを自動調整する。

VPAのインストール:

# Clone VPA repository
git clone https://github.com/kubernetes/autoscaler.git
cd autoscaler/vertical-pod-autoscaler

# Install VPA
./hack/vpa-up.sh

# Verify installation
kubectl get pods -n kube-system | grep vpa

# Check VPA CRDs
kubectl get crd | grep verticalpodautoscaler

VPAポリシーを作成する:

# vpa-policies.yaml
apiVersion: autoscaling.k8s.io/v1
kind: VerticalPodAutoscaler
metadata:
  name: api-server-vpa
  namespace: production
# ... (see EXAMPLES.md for complete configuration)

VPAのデプロイとモニタリング:

kubectl apply -f vpa-policies.yaml

# Check VPA recommendations
kubectl get vpa -n production
kubectl describe vpa api-server-vpa -n production

# View detailed recommendations
kubectl get vpa api-server-vpa -n production -o jsonpath='{.status.recommendation}' | jq .

# Monitor VPA-initiated pod updates
kubectl get events -n production --field-selector involvedObject.kind=VerticalPodAutoscaler --watch

# Compare recommendations to current requests
kubectl get deployment api-server -n production -o json | \
  jq '.spec.template.spec.containers[].resources.requests'

期待結果: VPAが推奨を提供するか、リソースリクエストを自動更新している。推奨がパーセンタイル使用パターン（通常P95）に基づいている。Auto/Recreateモードを使用している場合、ポッドが新しいリクエストで再起動される。HPAとVPAの間に競合がない（HPAはレプリカ用、VPAはポッドごとのリソース用に使用する）。

失敗時:

メトリクスサーバーに十分なデータがあることを確認する（VPAは正確な推奨のために数日必要）
VPAコンポーネントが実行中か確認する: kubectl get pods -n kube-system | grep vpa
VPAアドミッションコントローラーのログをレビューする: kubectl logs -n kube-system -l app=vpa-admission-controller
Webhookが登録されているか確認する: kubectl get mutatingwebhookconfigurations vpa-webhook-config
同じメトリクス（CPU/メモリ）でVPAとHPAを使用しない — 競合が発生する
自動更新を有効にする前に「Off」モードで推奨をレビューすることから始める

ステップ5: スポット/プリエンプティブルインスタンスの活用

コスト効率の高いスポットインスタンスでのワークロードスケジューリングを設定する。

スポットインスタンスでノードプールを作成する:

# For AWS (via Karpenter)
apiVersion: karpenter.sh/v1alpha5
kind: Provisioner
metadata:
  name: spot-provisioner
spec:
# ... (see EXAMPLES.md for complete configuration)

スポットインスタンス用にワークロードを設定する:

# spot-workload.yaml
apiVersion: apps/v1
kind: Deployment
metadata:
  name: batch-processor
  namespace: production
# ... (see EXAMPLES.md for complete configuration)

スポット使用状況のデプロイとモニタリング:

kubectl apply -f spot-workload.yaml

# Monitor spot node allocation
kubectl get nodes -l node-type=spot

# Check workload distribution
# ... (see EXAMPLES.md for complete configuration)

期待結果: ワークロードがスポットノードに正常にスケジュールされている。大幅なコスト削減（通常オンデマンドと比較して60-90%）。スポット中断のポッド再スケジューリングによる優雅な処理。モニタリングがスポット中断率と正常な復旧を示している。

失敗時:

リージョン/ゾーンでのスポットインスタンスの利用可能性を確認する
ノードラベルとテイントがワークロードのトレレーションと一致しているか確認する
Karpenterのログをレビューする: kubectl logs -n karpenter -l app.kubernetes.io/name=karpenter
ワークロードがステートレスであるか、中断に対する適切な状態管理があることを確認する
中断処理をテストする: 手動でスポットノードをcordonしdrainする
中断率をモニタリングする — 高すぎる場合、オンデマンドノードへのフォールバックを検討する

ステップ6: リソースクォータと予算アラートの実装

コスト制御のためのハードリミットとアラートを設定する。

リソースクォータを作成する:

# resource-quotas.yaml
apiVersion: v1
kind: ResourceQuota
metadata:
  name: production-quota
  namespace: production
# ... (see EXAMPLES.md for complete configuration)

予算アラートを設定する:

# kubecost-budget-alerts.yaml
apiVersion: v1
kind: ConfigMap
metadata:
  name: budget-alerts
  namespace: kubecost
# ... (see EXAMPLES.md for complete configuration)

適用とモニタリング:

kubectl apply -f resource-quotas.yaml
kubectl apply -f kubecost-budget-alerts.yaml

# Check quota usage
kubectl get resourcequota -n production
kubectl describe resourcequota production-quota -n production
# ... (see EXAMPLES.md for complete configuration)

期待結果: リソースクォータがネームスペースごとの制限を強制している。クォータ超過時にポッド作成がブロックされる。閾値を超えた時に予算アラートが発火する。コストスパイク検出が機能している。ステークホルダーに定期的なレポートが送信される。

失敗時:

ResourceQuotaとLimitRangeが正しく適用されているか確認する: kubectl get resourcequota,limitrange -A
クォータによるポッドの失敗がないか確認する: kubectl get events -n production | grep quota
Kubecostのアラート設定をレビューする: kubectl logs -n kubecost -l app=cost-analyzer | grep alert
PrometheusにKubecostメトリクスがあるか確認する: curl http://prometheus:9090/api/v1/query?query=kubecost_monthly_cost
アラートルーティングをテストする: メール/Slack Webhook設定を確認する

バリデーション

よくある落とし穴

積極的すぎるライトサイジング: VPAの推奨をすぐに適用しない。「Off」モードで開始し、1週間推奨をレビューしてから徐々に適用する。急激な変更はOOMKillやCPUスロットリングを引き起こす可能性がある。
HPAとVPAの競合: 同じメトリクス（CPU/メモリ）でHPAとVPAを同時に使用しない。水平スケーリングにはHPAを、ポッドごとのリソースチューニングにはVPAを使用するか、カスタムメトリクスのHPA + リソースのVPAを使用する。
フォールトトレランスなしのスポット: フォールトトレラントでステートレスなワークロードのみをスポットで実行する。データベース、ステートフルサービス、または単一レプリカのクリティカルサービスは不可。常にPodDisruptionBudgetを使用する。
不十分なモニタリング期間: コスト最適化の決定には過去データが必要。変更前に少なくとも7日、VPA推奨には30日、トレンド分析には90日待つ。
バースト要件の無視: 平均使用量に基づいて制限を低く設定しすぎると、トラフィックスパイク時にスロットリングが発生する。キャパシティプランニングには平均ではなくP95またはP99パーセンタイルを使用する。
ネットワークエグレスコスト: Kubecostではコンピュートコストが可視化されるが、エグレス（データ転送）も大きくなる可能性がある。クロスAZトラフィックをモニタリングし、トポロジー対応ルーティングを使用し、アーキテクチャでデータ転送コストを考慮する。
ストレージの見落とし: PersistentVolumeコストが忘れられがち。未使用のPVCを監査し、ボリュームをライトサイジングし、過剰プロビジョニングの代わりにボリューム拡張を使用し、PVクリーンアップポリシーを実装する。
制限的すぎるクォータ: クォータを低く設定しすぎると正当な成長がブロックされる。クォータ使用量を月次でレビューし、実際のニーズに基づいて調整し、強制前にチームに制限を伝える。
間違ったメトリクスからの偽りの節約: CPU/メモリのみを最適化メトリクスとして使用すると、I/O、ネットワーク、ストレージコストを見逃す。コンピュートだけでなく、総所有コストを考慮する。
信頼前のチャージバック: チームがコストデータを理解し信頼する前にチャージバックを実装すると摩擦が生じる。ショーバック（情報提供）から始め、コスト意識の文化を構築してからチャージバックに移行する。

GitHub 저장소

pjt222/agent-almanac

경로: i18n/ja/skills/optimize-cloud-costs

agentsagentskillsai-assisted-developmentclaude-codeskillsteams

FAQ

Frequently asked questions

What is the optimize-cloud-costs skill?

optimize-cloud-costs is a Claude Skill by pjt222. Skills package instructions and resources that Claude loads on demand, so Claude can perform optimize-cloud-costs-related tasks without extra prompting.

How do I install optimize-cloud-costs?

Use the install commands on this page: add optimize-cloud-costs to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does optimize-cloud-costs belong to?

optimize-cloud-costs is in the Other category, tagged general.

Is optimize-cloud-costs free to use?

Yes. optimize-cloud-costs is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.

연관 스킬

llamaguard

기타

LlamaGuard는 폭력 및 혐오 발언 등 6가지 안전 범주에서 LLM 입력과 출력을 조정하기 위한 Meta의 70-80억 파라미터 모델입니다. 94-95% 정확도를 제공하며 vLLM, Hugging Face 또는 Amazon SageMaker를 사용해 배포할 수 있습니다. 이 기술을 사용하여 AI 애플리케이션에 콘텐츠 필터링 및 안전 가드레일을 손쉽게 통합하세요.

스킬 보기

cost-optimization

기타

이 Claude Skill은 리소스 적정화, 태깅 전략, 지출 분석을 통해 개발자들이 클라우드 비용을 최적화할 수 있도록 지원합니다. AWS, Azure, GCP에서 클라우드 비용을 절감하고 비용 거버넌스를 구현하기 위한 프레임워크를 제공합니다. 인프라 비용을 분석하거나, 리소스를 적정화하거나, 예산 제약을 충족해야 할 때 사용하세요.

스킬 보기

sports-betting-analyzer

기타

이 Claude Skill은 스프레드, 오버/언더, 프로프 베트를 포함한 스포츠 베팅 시장을 분석합니다. 역사적 추이와 상황별 통계를 검토하여 가치 베트를 발견하고, 교육적 목적으로 실행 가능한 권장 사항이 담긴 구조화된 마크다운 결과를 제공합니다. 개발자는 이 기능을 스포츠 베팅 분석 도구에 활용할 수 있으며, 단순히 엔터테인먼트/교육 목적으로만 설계되었음을 유의해야 합니다.

스킬 보기

quantizing-models-bitsandbytes

기타

이 스킬은 bitsandbytes를 사용하여 LLM을 8비트 또는 4비트 정밀도로 양자화하며, 최소한의 정확도 손실로 50-75%의 메모리 감소를 달성합니다. 제한된 GPU 메모리에서 더 큰 모델을 실행하거나 추론을 가속화하는 데 이상적이며, INT8, NF4, FP4와 같은 형식을 지원합니다. 이 스킬은 HuggingFace Transformers와 통합되어 QLoRA 학습 및 8비트 옵티마이저를 가능하게 합니다.

스킬 보기

optimize-cloud-costs

정보

빠른 설치

Claude Code

문서

クラウドコストの最適化

使用タイミング

入力

手順

ステップ1: コスト可視化ツールのデプロイ

ステップ2: 現在のリソース使用率を分析する

ステップ3: 水平ポッドオートスケーリング（HPA）の実装

ステップ4: 垂直ポッドオートスケーリング（VPA）の設定

ステップ5: スポット/プリエンプティブルインスタンスの活用

ステップ6: リソースクォータと予算アラートの実装

バリデーション

よくある落とし穴

関連スキル

GitHub 저장소

Frequently asked questions

What is the optimize-cloud-costs skill?

How do I install optimize-cloud-costs?

What category does optimize-cloud-costs belong to?

Is optimize-cloud-costs free to use?

연관 스킬