MCP HubMCP Hub
Volver a habilidades

setup-automl-pipeline

pjt222
Actualizado 6 days ago
26 vistas
17
2
17
Ver en GitHub
Diseñoaiautomationdesigndata

Acerca de

Esta habilidad configura pipelines automatizados de ML utilizando Optuna o Ray Tune para la optimización de hiperparámetros. Implementa estrategias de búsqueda eficientes como Hyperband y ASHA, define espacios de búsqueda y configura paradas tempranas para encontrar configuraciones de modelos óptimas con una mínima intervención manual. Úsela al iniciar nuevos proyectos de ML, al reentrenar con nuevos datos, al comparar algoritmos o cuando se carezca de experiencia profunda en hiperparámetros.

Instalación rápida

Claude Code

Recomendado
Principal
npx skills add pjt222/agent-almanac -a claude-code
Comando PluginAlternativo
/plugin add https://github.com/pjt222/agent-almanac
Git CloneAlternativo
git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/setup-automl-pipeline

Copia y pega este comando en Claude Code para instalar esta habilidad

Documentación

設 AutoML 管

全配與板見 Extended Examples

用 Optuna 或 Ray Tune 自超參優含 Hyperband、ASHA 之效搜策。

  • 始新 ML 項速找佳配→用
  • 重訓既模新資再優超參→用
  • 較諸算與其優配→用
  • 手調時限求近優性→用
  • 組缺深知於特算超參→用
  • 需可重文錄優程→用

  • :訓資(特、標)
  • :驗資為旨評
  • :所優模型(如 XGBoost、LightGBM、神網)
  • :優旨(最大/小指)
  • :算預(時或試數)
  • :搜空限(超參最小/大)
  • :佳超參範前知

一:裝依與設境

裝 Optuna 或 Ray Tune 含宜後端。

python -m venv venv
source venv/bin/activate

# Option 1: Optuna
pip install optuna optuna-dashboard
pip install scikit-learn xgboost lightgbm

# Option 2: Ray Tune
pip install "ray[tune]" optuna hyperopt bayesian-optimization
pip install torch torchvision

pip install mlflow tensorboard plotly

建項結構:

mkdir -p automl/{configs,experiments,models,results}

得:清境含諸需包裝、無依衝。

敗:用 Python 3.8-3.11(3.12+ 相容問題)、CUDA 誤先裝 CPU 唯本、M1/M2 Mac 用 conda 代 pip 為 scikit-learn。

二:定搜空與旨(Optuna)

建超參搜配。

# automl/optuna_config.py
import optuna
from optuna.pruners import HyperbandPruner
from optuna.samplers import TPESampler
import xgboost as xgb
from sklearn.metrics import roc_auc_score, mean_squared_error
import numpy as np

# ... (see EXAMPLES.md for complete implementation)

得:搜空覆合理超參範、旨函行無誤、剪止無望試早。

敗:試崩→縮搜空(如降最大 n_estimators)、驗資無 NaN/inf、察記憶(OOM 降批大)、確 eval_metric 合務型。

三:行優含進採

行超參搜含效採策。

# automl/run_optimization.py
import optuna
from optuna.samplers import TPESampler, CmaEsSampler, NSGAIISampler
from optuna.pruners import HyperbandPruner, MedianPruner, SuccessiveHalvingPruner
import joblib
import pandas as pd
from pathlib import Path

# ... (see EXAMPLES.md for complete implementation)

得:優成、50-70% 試早剪、最佳參得、收斂繪。

敗:無剪→驗旨報中值正、優不進→試異採(TPE → CmaES)、n_jobs > 1 崩→除錯用 n_jobs = 1。

四:設 Ray Tune 為散優(替)

Ray Tune 為多 GPU 或多節優。

# automl/ray_tune_config.py
from ray import tune
from ray.tune.schedulers import ASHAScheduler, PopulationBasedTraining
from ray.tune.search.optuna import OptunaSearch
from ray.tune.search import ConcurrencyLimiter
import xgboost as xgb
from sklearn.metrics import roc_auc_score
import os
# ... (see EXAMPLES.md for complete implementation)

得:Ray Tune 跨 CPU/GPU 並試、ASHA 早止劣試、最佳配得錄。

敗:Ray 崩→除錯始 ray.init(num_cpus=2, num_gpus=0)、OOM 減並試、確訓函不改共資、用 tune.report()return 為指。

五:以 MLflow 追驗

接 MLflow 為驗追與模譜。

# automl/mlflow_tracking.py
import mlflow
import mlflow.xgboost
from mlflow.tracking import MlflowClient
import optuna
from pathlib import Path


# ... (see EXAMPLES.md for complete implementation)

得:諸試錄 MLflow 含參與指、最佳模註於 MLflow 譜、驗於 MLflow UI 可見。

敗:啟 MLflow UI mlflow ui --backend-store-uri file:./automl/mlruns、察 mlruns 寫權、註敗驗譜配、確模產 < 2GB。

六:釋最佳模察性

存優模設察。

# automl/deploy_model.py
import joblib
import json
from pathlib import Path
import optuna
import xgboost as xgb


# ... (see EXAMPLES.md for complete implementation)

得:模存產備式、配文錄、推本建為釋。

敗:模檔太大(> 100MB)→考模壓或特選、驗模於新 Python 會載正、釋前測推本含樣資。

  • Optuna/Ray Tune 裝無依衝
  • 搜空含合理超參範
  • 旨函單試成
  • 優於時預內成 ≥ 50 試
  • 剪止 40-70% 無望試早
  • 最佳參較默配進 > 5%
  • 繪示收斂(優史平)
  • MLflow 錄諸試含參指
  • 終模存正載
  • 釋包含諸需檔

  • 過合驗集:1000s 試暗優於驗集;用留測集或時分為終評
  • 忽特工:AutoML 找最佳超參而不造特;先投特工
  • 搜空過寬:無界寬範費試於不實值;用域知約
  • 不用早止:諸試訓全 epoch 為費;旨函啟早止
  • 忽算費:100 試 × 10 分 = 16 時;設 n_trials 考算預
  • 類特未編:多算需數特;優前編類
  • 不衡資:默指於不衡可誤;用 F1、AUC 或自指
  • 不存中果:崩失諸進;用持儲(Optuna SQLite、MLflow)以續

  • track-ml-experiments
  • orchestrate-ml-pipeline

Repositorio GitHub

pjt222/agent-almanac
Ruta: i18n/wenyan-ultra/skills/setup-automl-pipeline
0
agentsagentskillsai-assisted-developmentclaude-codeskillsteams

Habilidades relacionadas

executing-plans

Diseño

Utilice la habilidad executing-plans cuando tenga un plan de implementación completo para ejecutar en lotes controlados con puntos de revisión. Esta habilidad carga y revisa críticamente el plan, luego ejecuta tareas en pequeños lotes (por defecto 3 tareas) mientras reporta el progreso entre cada lote para la revisión del arquitecto. Esto asegura una implementación sistemática con puntos de control de calidad integrados.

Ver habilidad

requesting-code-review

Diseño

Esta habilidad despacha un subagente revisor de código para analizar los cambios en el código frente a los requisitos antes de proceder. Debe usarse después de completar tareas, implementar funciones principales o antes de fusionar con la rama principal. La revisión ayuda a detectar problemas de forma temprana al comparar la implementación actual con el plan original.

Ver habilidad

connect-mcp-server

Diseño

Esta habilidad proporciona una guía integral para que los desarrolladores conecten servidores MCP a Claude Code mediante transportes HTTP, stdio o SSE. Cubre la instalación, configuración, autenticación y seguridad para integrar servicios externos como GitHub, Notion y APIs personalizadas. Úsala al configurar integraciones MCP, al configurar herramientas externas o al trabajar con el Protocolo de Contexto del Modelo de Claude.

Ver habilidad

web-cli-teleport

Diseño

Esta habilidad ayuda a los desarrolladores a elegir entre las interfaces web y CLI de Claude Code mediante el análisis de tareas, y luego permite la teletransportación fluida de sesiones entre estos entornos. Optimiza el flujo de trabajo gestionando el estado y el contexto de la sesión al cambiar entre web, CLI o móvil. Úsala para proyectos complejos que requieren diferentes herramientas en varias etapas.

Ver habilidad