SKILL·C6AE61

setup-automl-pipeline

Name: setup-automl-pipeline
Author: pjt222

pjt222

Обновлено 1 month ago

30 просмотров

Дизайнaiautomationdesigndata

О программе

Этот навык настраивает автоматизированные ML-пайплайны с использованием Optuna или Ray Tune для оптимизации гиперпараметров. Он реализует эффективные стратегии поиска, такие как Hyperband и ASHA, определяет пространства поиска и настраивает раннюю остановку для нахождения оптимальных конфигураций модели с минимальной ручной настройкой. Используйте его при запуске новых ML-проектов, переобучении на новых данных, сравнении алгоритмов или при отсутствии глубоких знаний в области гиперпараметров.

Быстрая установка

Claude Code

Рекомендуется

Основной

npx skills add pjt222/agent-almanac -a claude-code

Команда плагинаАльтернативный

/plugin add https://github.com/pjt222/agent-almanac

Git клонированиеАльтернативный

git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/setup-automl-pipeline

Скопируйте и вставьте эту команду в Claude Code для установки этого навыка

Документация

設 AutoML 管

全配與板見 Extended Examples。

用 Optuna 或 Ray Tune 自超參優含 Hyperband、ASHA 之效搜策。

用

始新 ML 項速找佳配→用
重訓既模新資再優超參→用
較諸算與其優配→用
手調時限求近優性→用
組缺深知於特算超參→用
需可重文錄優程→用

入

必：訓資（特、標）
必：驗資為旨評
必：所優模型（如 XGBoost、LightGBM、神網）
必：優旨（最大/小指）
必：算預（時或試數）
可：搜空限（超參最小/大）
可：佳超參範前知

行

一：裝依與設境

裝 Optuna 或 Ray Tune 含宜後端。

python -m venv venv
source venv/bin/activate

# Option 1: Optuna
pip install optuna optuna-dashboard
pip install scikit-learn xgboost lightgbm

# Option 2: Ray Tune
pip install "ray[tune]" optuna hyperopt bayesian-optimization
pip install torch torchvision

pip install mlflow tensorboard plotly

建項結構：

mkdir -p automl/{configs,experiments,models,results}

得：清境含諸需包裝、無依衝。

敗：用 Python 3.8-3.11（3.12+ 相容問題）、CUDA 誤先裝 CPU 唯本、M1/M2 Mac 用 conda 代 pip 為 scikit-learn。

二：定搜空與旨（Optuna）

建超參搜配。

# automl/optuna_config.py
import optuna
from optuna.pruners import HyperbandPruner
from optuna.samplers import TPESampler
import xgboost as xgb
from sklearn.metrics import roc_auc_score, mean_squared_error
import numpy as np

# ... (see EXAMPLES.md for complete implementation)

得：搜空覆合理超參範、旨函行無誤、剪止無望試早。

敗：試崩→縮搜空（如降最大 n_estimators）、驗資無 NaN/inf、察記憶（OOM 降批大）、確 eval_metric 合務型。

三：行優含進採

行超參搜含效採策。

# automl/run_optimization.py
import optuna
from optuna.samplers import TPESampler, CmaEsSampler, NSGAIISampler
from optuna.pruners import HyperbandPruner, MedianPruner, SuccessiveHalvingPruner
import joblib
import pandas as pd
from pathlib import Path

# ... (see EXAMPLES.md for complete implementation)

得：優成、50-70% 試早剪、最佳參得、收斂繪。

敗：無剪→驗旨報中值正、優不進→試異採（TPE → CmaES）、n_jobs > 1 崩→除錯用 n_jobs = 1。

四：設 Ray Tune 為散優（替）

Ray Tune 為多 GPU 或多節優。

# automl/ray_tune_config.py
from ray import tune
from ray.tune.schedulers import ASHAScheduler, PopulationBasedTraining
from ray.tune.search.optuna import OptunaSearch
from ray.tune.search import ConcurrencyLimiter
import xgboost as xgb
from sklearn.metrics import roc_auc_score
import os
# ... (see EXAMPLES.md for complete implementation)

得：Ray Tune 跨 CPU/GPU 並試、ASHA 早止劣試、最佳配得錄。

敗：Ray 崩→除錯始 ray.init(num_cpus=2, num_gpus=0)、OOM 減並試、確訓函不改共資、用 tune.report() 非 return 為指。

五：以 MLflow 追驗

接 MLflow 為驗追與模譜。

# automl/mlflow_tracking.py
import mlflow
import mlflow.xgboost
from mlflow.tracking import MlflowClient
import optuna
from pathlib import Path


# ... (see EXAMPLES.md for complete implementation)

得：諸試錄 MLflow 含參與指、最佳模註於 MLflow 譜、驗於 MLflow UI 可見。

敗：啟 MLflow UI mlflow ui --backend-store-uri file:./automl/mlruns、察 mlruns 寫權、註敗驗譜配、確模產 < 2GB。

六：釋最佳模察性

存優模設察。

# automl/deploy_model.py
import joblib
import json
from pathlib import Path
import optuna
import xgboost as xgb


# ... (see EXAMPLES.md for complete implementation)

得：模存產備式、配文錄、推本建為釋。

敗：模檔太大（> 100MB）→考模壓或特選、驗模於新 Python 會載正、釋前測推本含樣資。

驗

忌

過合驗集：1000s 試暗優於驗集；用留測集或時分為終評
忽特工：AutoML 找最佳超參而不造特；先投特工
搜空過寬：無界寬範費試於不實值；用域知約
不用早止：諸試訓全 epoch 為費；旨函啟早止
忽算費：100 試 × 10 分 = 16 時；設 n_trials 考算預
類特未編：多算需數特；優前編類
不衡資：默指於不衡可誤；用 F1、AUC 或自指
不存中果：崩失諸進；用持儲（Optuna SQLite、MLflow）以續

參

track-ml-experiments
orchestrate-ml-pipeline

GitHub репозиторий

pjt222/agent-almanac

Путь: i18n/wenyan-ultra/skills/setup-automl-pipeline

agentsagentskillsai-assisted-developmentclaude-codeskillsteams

FAQ

Frequently asked questions

What is the setup-automl-pipeline skill?

setup-automl-pipeline is a Claude Skill by pjt222. Skills package instructions and resources that Claude loads on demand, so Claude can perform setup-automl-pipeline-related tasks without extra prompting.

How do I install setup-automl-pipeline?

Use the install commands on this page: add setup-automl-pipeline to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does setup-automl-pipeline belong to?

setup-automl-pipeline is in the Design category, tagged ai, automation, design and data.

Is setup-automl-pipeline free to use?

Yes. setup-automl-pipeline is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.