スキル一覧に戻る

setup-automl-pipeline

pjt222
更新日 6 days ago
25 閲覧
17
2
17
GitHubで表示
デザインaiautomationdesigndata

について

このスキルは、ハイパーパラメータ最適化のためにOptunaまたはRay Tuneを使用した自動化MLパイプラインを構成します。HyperbandやASHAなどの効率的な探索戦略を実装し、探索空間を定義し、早期停止を設定することで、最小限の手動調整で最適なモデル構成を見つけます。新しいMLプロジェクトを開始する際、新しいデータで再トレーニングする場合、アルゴリズムを比較する場合、または高度なハイパーパラメータ専門知識が不足している場合にご利用ください。

クイックインストール

Claude Code

推奨
メイン
npx skills add pjt222/agent-almanac -a claude-code
プラグインコマンド代替
/plugin add https://github.com/pjt222/agent-almanac
Git クローン代替
git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/setup-automl-pipeline

このコマンドをClaude Codeにコピー&ペーストしてスキルをインストールします

ドキュメント

設 AutoML 管

全配與板見 Extended Examples

用 Optuna 或 Ray Tune 自超參優含 Hyperband、ASHA 之效搜策。

  • 始新 ML 項速找佳配→用
  • 重訓既模新資再優超參→用
  • 較諸算與其優配→用
  • 手調時限求近優性→用
  • 組缺深知於特算超參→用
  • 需可重文錄優程→用

  • :訓資(特、標)
  • :驗資為旨評
  • :所優模型(如 XGBoost、LightGBM、神網)
  • :優旨(最大/小指)
  • :算預(時或試數)
  • :搜空限(超參最小/大)
  • :佳超參範前知

一:裝依與設境

裝 Optuna 或 Ray Tune 含宜後端。

python -m venv venv
source venv/bin/activate

# Option 1: Optuna
pip install optuna optuna-dashboard
pip install scikit-learn xgboost lightgbm

# Option 2: Ray Tune
pip install "ray[tune]" optuna hyperopt bayesian-optimization
pip install torch torchvision

pip install mlflow tensorboard plotly

建項結構:

mkdir -p automl/{configs,experiments,models,results}

得:清境含諸需包裝、無依衝。

敗:用 Python 3.8-3.11(3.12+ 相容問題)、CUDA 誤先裝 CPU 唯本、M1/M2 Mac 用 conda 代 pip 為 scikit-learn。

二:定搜空與旨(Optuna)

建超參搜配。

# automl/optuna_config.py
import optuna
from optuna.pruners import HyperbandPruner
from optuna.samplers import TPESampler
import xgboost as xgb
from sklearn.metrics import roc_auc_score, mean_squared_error
import numpy as np

# ... (see EXAMPLES.md for complete implementation)

得:搜空覆合理超參範、旨函行無誤、剪止無望試早。

敗:試崩→縮搜空(如降最大 n_estimators)、驗資無 NaN/inf、察記憶(OOM 降批大)、確 eval_metric 合務型。

三:行優含進採

行超參搜含效採策。

# automl/run_optimization.py
import optuna
from optuna.samplers import TPESampler, CmaEsSampler, NSGAIISampler
from optuna.pruners import HyperbandPruner, MedianPruner, SuccessiveHalvingPruner
import joblib
import pandas as pd
from pathlib import Path

# ... (see EXAMPLES.md for complete implementation)

得:優成、50-70% 試早剪、最佳參得、收斂繪。

敗:無剪→驗旨報中值正、優不進→試異採(TPE → CmaES)、n_jobs > 1 崩→除錯用 n_jobs = 1。

四:設 Ray Tune 為散優(替)

Ray Tune 為多 GPU 或多節優。

# automl/ray_tune_config.py
from ray import tune
from ray.tune.schedulers import ASHAScheduler, PopulationBasedTraining
from ray.tune.search.optuna import OptunaSearch
from ray.tune.search import ConcurrencyLimiter
import xgboost as xgb
from sklearn.metrics import roc_auc_score
import os
# ... (see EXAMPLES.md for complete implementation)

得:Ray Tune 跨 CPU/GPU 並試、ASHA 早止劣試、最佳配得錄。

敗:Ray 崩→除錯始 ray.init(num_cpus=2, num_gpus=0)、OOM 減並試、確訓函不改共資、用 tune.report()return 為指。

五:以 MLflow 追驗

接 MLflow 為驗追與模譜。

# automl/mlflow_tracking.py
import mlflow
import mlflow.xgboost
from mlflow.tracking import MlflowClient
import optuna
from pathlib import Path


# ... (see EXAMPLES.md for complete implementation)

得:諸試錄 MLflow 含參與指、最佳模註於 MLflow 譜、驗於 MLflow UI 可見。

敗:啟 MLflow UI mlflow ui --backend-store-uri file:./automl/mlruns、察 mlruns 寫權、註敗驗譜配、確模產 < 2GB。

六:釋最佳模察性

存優模設察。

# automl/deploy_model.py
import joblib
import json
from pathlib import Path
import optuna
import xgboost as xgb


# ... (see EXAMPLES.md for complete implementation)

得:模存產備式、配文錄、推本建為釋。

敗:模檔太大(> 100MB)→考模壓或特選、驗模於新 Python 會載正、釋前測推本含樣資。

  • Optuna/Ray Tune 裝無依衝
  • 搜空含合理超參範
  • 旨函單試成
  • 優於時預內成 ≥ 50 試
  • 剪止 40-70% 無望試早
  • 最佳參較默配進 > 5%
  • 繪示收斂(優史平)
  • MLflow 錄諸試含參指
  • 終模存正載
  • 釋包含諸需檔

  • 過合驗集:1000s 試暗優於驗集;用留測集或時分為終評
  • 忽特工:AutoML 找最佳超參而不造特;先投特工
  • 搜空過寬:無界寬範費試於不實值;用域知約
  • 不用早止:諸試訓全 epoch 為費;旨函啟早止
  • 忽算費:100 試 × 10 分 = 16 時;設 n_trials 考算預
  • 類特未編:多算需數特;優前編類
  • 不衡資:默指於不衡可誤;用 F1、AUC 或自指
  • 不存中果:崩失諸進;用持儲(Optuna SQLite、MLflow)以續

  • track-ml-experiments
  • orchestrate-ml-pipeline

GitHub リポジトリ

pjt222/agent-almanac
パス: i18n/wenyan-ultra/skills/setup-automl-pipeline
0
agentsagentskillsai-assisted-developmentclaude-codeskillsteams

関連スキル

executing-plans

デザイン

executing-plansスキルは、完全な実装計画があり、それを管理されたバッチでレビューチェックポイントを設けながら実行する場合に使用します。このスキルは計画を読み込んで批判的にレビューした後、小さなバッチ(デフォルトは3タスク)でタスクを実行し、各バッチの間に進捗状況を報告してアーキテクトのレビューを受けます。これにより、品質管理チェックポイントが組み込まれた体系的な実装が保証されます。

スキルを見る

requesting-code-review

デザイン

このスキルは、コードレビュアーサブエージェントを起動し、処理を進める前に要件に対してコード変更を分析します。タスク完了後、主要な機能の実装後、またはmainブランチへのマージ前などに使用すべきです。このレビューは、現在の実装と元の計画を比較することで、問題を早期に発見するのに役立ちます。

スキルを見る

connect-mcp-server

デザイン

このスキルは、開発者がHTTP、stdio、またはSSEトランスポートを使用してMCPサーバーをClaude Codeに接続するための包括的なガイドを提供します。GitHub、Notion、カスタムAPIなどの外部サービスを統合するためのインストール、設定、認証、セキュリティについて解説しています。MCP統合のセットアップ、外部ツールの設定、またはClaudeのModel Context Protocolを扱う際にご利用ください。

スキルを見る

web-cli-teleport

デザイン

このスキルは、タスク分析に基づいて開発者がClaude Code WebとCLIインターフェースの選択を支援し、これらの環境間でのシームレスなセッションテレポーテーションを可能にします。Web、CLI、モバイル環境を切り替える際のセッション状態とコンテキストを管理することで、ワークフローを最適化します。様々な段階で異なるツールを必要とする複雑なプロジェクトにご活用ください。

スキルを見る