MCP HubMCP Hub
Вернуться к навыкам

setup-automl-pipeline

pjt222
Обновлено 6 days ago
23 просмотров
17
2
17
Посмотреть на GitHub
Дизайнaiautomationdesigndata

О программе

Этот навык настраивает автоматизированные ML-пайплайны с использованием Optuna или Ray Tune для оптимизации гиперпараметров. Он реализует эффективные стратегии поиска, такие как Hyperband и ASHA, определяет пространства поиска и настраивает раннюю остановку для нахождения оптимальных конфигураций модели с минимальной ручной настройкой. Используйте его при запуске новых ML-проектов, переобучении на новых данных, сравнении алгоритмов или при отсутствии глубоких знаний в области гиперпараметров.

Быстрая установка

Claude Code

Рекомендуется
Основной
npx skills add pjt222/agent-almanac -a claude-code
Команда плагинаАльтернативный
/plugin add https://github.com/pjt222/agent-almanac
Git клонированиеАльтернативный
git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/setup-automl-pipeline

Скопируйте и вставьте эту команду в Claude Code для установки этого навыка

Документация

設 AutoML 管

全配與板見 Extended Examples

用 Optuna 或 Ray Tune 自超參優含 Hyperband、ASHA 之效搜策。

  • 始新 ML 項速找佳配→用
  • 重訓既模新資再優超參→用
  • 較諸算與其優配→用
  • 手調時限求近優性→用
  • 組缺深知於特算超參→用
  • 需可重文錄優程→用

  • :訓資(特、標)
  • :驗資為旨評
  • :所優模型(如 XGBoost、LightGBM、神網)
  • :優旨(最大/小指)
  • :算預(時或試數)
  • :搜空限(超參最小/大)
  • :佳超參範前知

一:裝依與設境

裝 Optuna 或 Ray Tune 含宜後端。

python -m venv venv
source venv/bin/activate

# Option 1: Optuna
pip install optuna optuna-dashboard
pip install scikit-learn xgboost lightgbm

# Option 2: Ray Tune
pip install "ray[tune]" optuna hyperopt bayesian-optimization
pip install torch torchvision

pip install mlflow tensorboard plotly

建項結構:

mkdir -p automl/{configs,experiments,models,results}

得:清境含諸需包裝、無依衝。

敗:用 Python 3.8-3.11(3.12+ 相容問題)、CUDA 誤先裝 CPU 唯本、M1/M2 Mac 用 conda 代 pip 為 scikit-learn。

二:定搜空與旨(Optuna)

建超參搜配。

# automl/optuna_config.py
import optuna
from optuna.pruners import HyperbandPruner
from optuna.samplers import TPESampler
import xgboost as xgb
from sklearn.metrics import roc_auc_score, mean_squared_error
import numpy as np

# ... (see EXAMPLES.md for complete implementation)

得:搜空覆合理超參範、旨函行無誤、剪止無望試早。

敗:試崩→縮搜空(如降最大 n_estimators)、驗資無 NaN/inf、察記憶(OOM 降批大)、確 eval_metric 合務型。

三:行優含進採

行超參搜含效採策。

# automl/run_optimization.py
import optuna
from optuna.samplers import TPESampler, CmaEsSampler, NSGAIISampler
from optuna.pruners import HyperbandPruner, MedianPruner, SuccessiveHalvingPruner
import joblib
import pandas as pd
from pathlib import Path

# ... (see EXAMPLES.md for complete implementation)

得:優成、50-70% 試早剪、最佳參得、收斂繪。

敗:無剪→驗旨報中值正、優不進→試異採(TPE → CmaES)、n_jobs > 1 崩→除錯用 n_jobs = 1。

四:設 Ray Tune 為散優(替)

Ray Tune 為多 GPU 或多節優。

# automl/ray_tune_config.py
from ray import tune
from ray.tune.schedulers import ASHAScheduler, PopulationBasedTraining
from ray.tune.search.optuna import OptunaSearch
from ray.tune.search import ConcurrencyLimiter
import xgboost as xgb
from sklearn.metrics import roc_auc_score
import os
# ... (see EXAMPLES.md for complete implementation)

得:Ray Tune 跨 CPU/GPU 並試、ASHA 早止劣試、最佳配得錄。

敗:Ray 崩→除錯始 ray.init(num_cpus=2, num_gpus=0)、OOM 減並試、確訓函不改共資、用 tune.report()return 為指。

五:以 MLflow 追驗

接 MLflow 為驗追與模譜。

# automl/mlflow_tracking.py
import mlflow
import mlflow.xgboost
from mlflow.tracking import MlflowClient
import optuna
from pathlib import Path


# ... (see EXAMPLES.md for complete implementation)

得:諸試錄 MLflow 含參與指、最佳模註於 MLflow 譜、驗於 MLflow UI 可見。

敗:啟 MLflow UI mlflow ui --backend-store-uri file:./automl/mlruns、察 mlruns 寫權、註敗驗譜配、確模產 < 2GB。

六:釋最佳模察性

存優模設察。

# automl/deploy_model.py
import joblib
import json
from pathlib import Path
import optuna
import xgboost as xgb


# ... (see EXAMPLES.md for complete implementation)

得:模存產備式、配文錄、推本建為釋。

敗:模檔太大(> 100MB)→考模壓或特選、驗模於新 Python 會載正、釋前測推本含樣資。

  • Optuna/Ray Tune 裝無依衝
  • 搜空含合理超參範
  • 旨函單試成
  • 優於時預內成 ≥ 50 試
  • 剪止 40-70% 無望試早
  • 最佳參較默配進 > 5%
  • 繪示收斂(優史平)
  • MLflow 錄諸試含參指
  • 終模存正載
  • 釋包含諸需檔

  • 過合驗集:1000s 試暗優於驗集;用留測集或時分為終評
  • 忽特工:AutoML 找最佳超參而不造特;先投特工
  • 搜空過寬:無界寬範費試於不實值;用域知約
  • 不用早止:諸試訓全 epoch 為費;旨函啟早止
  • 忽算費:100 試 × 10 分 = 16 時;設 n_trials 考算預
  • 類特未編:多算需數特;優前編類
  • 不衡資:默指於不衡可誤;用 F1、AUC 或自指
  • 不存中果:崩失諸進;用持儲(Optuna SQLite、MLflow)以續

  • track-ml-experiments
  • orchestrate-ml-pipeline

GitHub репозиторий

pjt222/agent-almanac
Путь: i18n/wenyan-ultra/skills/setup-automl-pipeline
0
agentsagentskillsai-assisted-developmentclaude-codeskillsteams

Похожие навыки

executing-plans

Дизайн

Используйте навык executing-plans, когда у вас есть полный план реализации для выполнения контролируемыми партиями с контрольными точками проверки. Он загружает и критически анализирует план, затем выполняет задачи небольшими партиями (по умолчанию 3 задачи), сообщая о прогрессе между каждой партией для проверки архитектором. Это обеспечивает систематическую реализацию со встроенными контрольными точками проверки качества.

Просмотреть навык

requesting-code-review

Дизайн

Этот навык запускает суб-агента для ревью кода, который анализирует изменения в коде на соответствие требованиям перед дальнейшими действиями. Его следует использовать после завершения задач, реализации крупных функций или перед слиянием с основной веткой. Ревью помогает выявить проблемы на ранней стадии, сравнивая текущую реализацию с исходным планом.

Просмотреть навык

connect-mcp-server

Дизайн

Этот навык предоставляет разработчикам подробное руководство по подключению серверов MCP к Claude Code с использованием транспортов HTTP, stdio или SSE. Он охватывает установку, конфигурацию, аутентификацию и безопасность для интеграции внешних сервисов, таких как GitHub, Notion и пользовательские API. Используйте его при настройке интеграций MCP, конфигурации внешних инструментов или работе с Model Context Protocol от Claude.

Просмотреть навык

web-cli-teleport

Дизайн

Этот навык помогает разработчикам выбирать между веб-интерфейсом Claude Code и CLI на основе анализа задачи, а также обеспечивает бесшовное перемещение сессий между этими средами. Он оптимизирует рабочий процесс, управляя состоянием и контекстом сессии при переключении между веб-интерфейсом, CLI или мобильным приложением. Используйте его для сложных проектов, требующих различных инструментов на разных этапах работы.

Просмотреть навык