setup-automl-pipeline
О программе
Этот навык настраивает автоматизированные ML-пайплайны с использованием Optuna или Ray Tune для оптимизации гиперпараметров. Он реализует эффективные стратегии поиска, такие как Hyperband и ASHA, определяет пространства поиска и настраивает раннюю остановку для нахождения оптимальных конфигураций модели с минимальной ручной настройкой. Используйте его при запуске новых ML-проектов, переобучении на новых данных, сравнении алгоритмов или при отсутствии глубоких знаний в области гиперпараметров.
Быстрая установка
Claude Code
Рекомендуетсяnpx skills add pjt222/agent-almanac -a claude-code/plugin add https://github.com/pjt222/agent-almanacgit clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/setup-automl-pipelineСкопируйте и вставьте эту команду в Claude Code для установки этого навыка
Документация
設 AutoML 管
全配與板見 Extended Examples。
用 Optuna 或 Ray Tune 自超參優含 Hyperband、ASHA 之效搜策。
用
- 始新 ML 項速找佳配→用
- 重訓既模新資再優超參→用
- 較諸算與其優配→用
- 手調時限求近優性→用
- 組缺深知於特算超參→用
- 需可重文錄優程→用
入
- 必:訓資(特、標)
- 必:驗資為旨評
- 必:所優模型(如 XGBoost、LightGBM、神網)
- 必:優旨(最大/小指)
- 必:算預(時或試數)
- 可:搜空限(超參最小/大)
- 可:佳超參範前知
行
一:裝依與設境
裝 Optuna 或 Ray Tune 含宜後端。
python -m venv venv
source venv/bin/activate
# Option 1: Optuna
pip install optuna optuna-dashboard
pip install scikit-learn xgboost lightgbm
# Option 2: Ray Tune
pip install "ray[tune]" optuna hyperopt bayesian-optimization
pip install torch torchvision
pip install mlflow tensorboard plotly
建項結構:
mkdir -p automl/{configs,experiments,models,results}
得:清境含諸需包裝、無依衝。
敗:用 Python 3.8-3.11(3.12+ 相容問題)、CUDA 誤先裝 CPU 唯本、M1/M2 Mac 用 conda 代 pip 為 scikit-learn。
二:定搜空與旨(Optuna)
建超參搜配。
# automl/optuna_config.py
import optuna
from optuna.pruners import HyperbandPruner
from optuna.samplers import TPESampler
import xgboost as xgb
from sklearn.metrics import roc_auc_score, mean_squared_error
import numpy as np
# ... (see EXAMPLES.md for complete implementation)
得:搜空覆合理超參範、旨函行無誤、剪止無望試早。
敗:試崩→縮搜空(如降最大 n_estimators)、驗資無 NaN/inf、察記憶(OOM 降批大)、確 eval_metric 合務型。
三:行優含進採
行超參搜含效採策。
# automl/run_optimization.py
import optuna
from optuna.samplers import TPESampler, CmaEsSampler, NSGAIISampler
from optuna.pruners import HyperbandPruner, MedianPruner, SuccessiveHalvingPruner
import joblib
import pandas as pd
from pathlib import Path
# ... (see EXAMPLES.md for complete implementation)
得:優成、50-70% 試早剪、最佳參得、收斂繪。
敗:無剪→驗旨報中值正、優不進→試異採(TPE → CmaES)、n_jobs > 1 崩→除錯用 n_jobs = 1。
四:設 Ray Tune 為散優(替)
Ray Tune 為多 GPU 或多節優。
# automl/ray_tune_config.py
from ray import tune
from ray.tune.schedulers import ASHAScheduler, PopulationBasedTraining
from ray.tune.search.optuna import OptunaSearch
from ray.tune.search import ConcurrencyLimiter
import xgboost as xgb
from sklearn.metrics import roc_auc_score
import os
# ... (see EXAMPLES.md for complete implementation)
得:Ray Tune 跨 CPU/GPU 並試、ASHA 早止劣試、最佳配得錄。
敗:Ray 崩→除錯始 ray.init(num_cpus=2, num_gpus=0)、OOM 減並試、確訓函不改共資、用 tune.report() 非 return 為指。
五:以 MLflow 追驗
接 MLflow 為驗追與模譜。
# automl/mlflow_tracking.py
import mlflow
import mlflow.xgboost
from mlflow.tracking import MlflowClient
import optuna
from pathlib import Path
# ... (see EXAMPLES.md for complete implementation)
得:諸試錄 MLflow 含參與指、最佳模註於 MLflow 譜、驗於 MLflow UI 可見。
敗:啟 MLflow UI mlflow ui --backend-store-uri file:./automl/mlruns、察 mlruns 寫權、註敗驗譜配、確模產 < 2GB。
六:釋最佳模察性
存優模設察。
# automl/deploy_model.py
import joblib
import json
from pathlib import Path
import optuna
import xgboost as xgb
# ... (see EXAMPLES.md for complete implementation)
得:模存產備式、配文錄、推本建為釋。
敗:模檔太大(> 100MB)→考模壓或特選、驗模於新 Python 會載正、釋前測推本含樣資。
驗
- Optuna/Ray Tune 裝無依衝
- 搜空含合理超參範
- 旨函單試成
- 優於時預內成 ≥ 50 試
- 剪止 40-70% 無望試早
- 最佳參較默配進 > 5%
- 繪示收斂(優史平)
- MLflow 錄諸試含參指
- 終模存正載
- 釋包含諸需檔
忌
- 過合驗集:1000s 試暗優於驗集;用留測集或時分為終評
- 忽特工:AutoML 找最佳超參而不造特;先投特工
- 搜空過寬:無界寬範費試於不實值;用域知約
- 不用早止:諸試訓全 epoch 為費;旨函啟早止
- 忽算費:100 試 × 10 分 = 16 時;設 n_trials 考算預
- 類特未編:多算需數特;優前編類
- 不衡資:默指於不衡可誤;用 F1、AUC 或自指
- 不存中果:崩失諸進;用持儲(Optuna SQLite、MLflow)以續
參
track-ml-experimentsorchestrate-ml-pipeline
GitHub репозиторий
Похожие навыки
executing-plans
ДизайнИспользуйте навык executing-plans, когда у вас есть полный план реализации для выполнения контролируемыми партиями с контрольными точками проверки. Он загружает и критически анализирует план, затем выполняет задачи небольшими партиями (по умолчанию 3 задачи), сообщая о прогрессе между каждой партией для проверки архитектором. Это обеспечивает систематическую реализацию со встроенными контрольными точками проверки качества.
requesting-code-review
ДизайнЭтот навык запускает суб-агента для ревью кода, который анализирует изменения в коде на соответствие требованиям перед дальнейшими действиями. Его следует использовать после завершения задач, реализации крупных функций или перед слиянием с основной веткой. Ревью помогает выявить проблемы на ранней стадии, сравнивая текущую реализацию с исходным планом.
connect-mcp-server
ДизайнЭтот навык предоставляет разработчикам подробное руководство по подключению серверов MCP к Claude Code с использованием транспортов HTTP, stdio или SSE. Он охватывает установку, конфигурацию, аутентификацию и безопасность для интеграции внешних сервисов, таких как GitHub, Notion и пользовательские API. Используйте его при настройке интеграций MCP, конфигурации внешних инструментов или работе с Model Context Protocol от Claude.
web-cli-teleport
ДизайнЭтот навык помогает разработчикам выбирать между веб-интерфейсом Claude Code и CLI на основе анализа задачи, а также обеспечивает бесшовное перемещение сессий между этими средами. Он оптимизирует рабочий процесс, управляя состоянием и контекстом сессии при переключении между веб-интерфейсом, CLI или мобильным приложением. Используйте его для сложных проектов, требующих различных инструментов на разных этапах работы.
