MCP HubMCP Hub
Вернуться к навыкам

track-ml-experiments

pjt222
Обновлено 6 days ago
20 просмотров
17
2
17
Посмотреть на GitHub
Метаaiautomationdesign

О программе

Этот навык настраивает сервер отслеживания MLflow для управления экспериментами с автоматическим логированием популярных фреймворков. Он обеспечивает систематическое сравнение обучающих запусков через метрики и визуализации, одновременно управляя артефактами в удалённом хранилище. Используйте его при старте ML-проектов, требующих воспроизводимых рабочих процессов, при переходе с ручного логирования или для сравнения множества запусков с полным отслеживанием происхождения данных.

Быстрая установка

Claude Code

Рекомендуется
Основной
npx skills add pjt222/agent-almanac -a claude-code
Команда плагинаАльтернативный
/plugin add https://github.com/pjt222/agent-almanac
Git клонированиеАльтернативный
git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/track-ml-experiments

Скопируйте и вставьте эту команду в Claude Code для установки этого навыка

Документация

追 ML 試

Extended Examples 為全配檔與模

立 MLflow 追服、行全試追含度、參、物。

  • 始新 ML 案需試追→用
  • 由手日轉至自追→用
  • 系比多模訓行→用
  • 與隊分試果→用
  • 建可重現 ML 流含全系追→用
  • 整試追於 CI/CD 流→用

  • :含 ML 框(sklearn、pytorch、tensorflow、xgboost)之 Python 境
  • :MLflow 裝(pip install mlflow
  • :遠存背(S3、Azure Blob、GCS)為物
  • :庫背(PostgreSQL、MySQL)為元存
  • :遠背認憑

一:初 MLflow 追服

立 MLflow 追服含宜背。

# Option 1: Local file-based tracking (development)
mkdir -p mlruns
export MLFLOW_TRACKING_URI="file:./mlruns"

# Option 2: SQLite backend with local artifacts
mlflow server \
  --backend-store-uri sqlite:///mlflow.db \
  --default-artifact-root ./mlartifacts \
# ... (see EXAMPLES.md for complete implementation)

建配檔為隊享:

# mlflow_config.py
import os

MLFLOW_TRACKING_URI = os.getenv(
    "MLFLOW_TRACKING_URI",
    "http://mlflow-server.company.com:5000"
)

# ... (see EXAMPLES.md for complete implementation)

得:MLflow UI 可訪於指 host:port、示空試列。服日確啟成無誤。

敗:察口可用以 netstat -tulpn | grep 5000、驗庫連串、確 S3 憑配(aws configure)、察防火牆規於遠訪。

二:配 ML 框自記

啟框自記以自捕度、參、模。

# training_script.py
import mlflow
from mlflow_config import MLFLOW_TRACKING_URI, MLFLOW_EXPERIMENT_NAME

# Set tracking URI
mlflow.set_tracking_uri(MLFLOW_TRACKING_URI)
mlflow.set_experiment(MLFLOW_EXPERIMENT_NAME)

# ... (see EXAMPLES.md for complete implementation)

PyTorch:

import mlflow.pytorch

mlflow.pytorch.autolog(
    log_every_n_epoch=1,
    log_every_n_step=None,
    log_models=True,
    disable=False,
    exclusive=False,
# ... (see EXAMPLES.md for complete implementation)

得:行現於 MLflow UI 含諸超參、度(訓/驗失、準)、模物、入例自記。

敗:驗 MLflow 版於 ML 框合(mlflow.sklearn.autolog() 需 MLflow ≥1.20)、察自記支於模類否、閉自記用手記為退、用 mlflow.set_tracking_uri() 察日為連誤。

三:行全手記

加自度、參、物、標為全試文。

# comprehensive_tracking.py
import mlflow
import numpy as np
import matplotlib.pyplot as plt
from pathlib import Path

def train_and_log_model(params, X_train, y_train, X_test, y_test):
    """
# ... (see EXAMPLES.md for complete implementation)

得:MLflow UI 示富試訊含逐步度、視物、模簽、入例、為濾搜之全標。

敗:察物存權(aws s3 ls s3://bucket/path)、驗 matplotlib 背為圖記(plt.switch_backend('Agg'))、確 JSON 可序資類為 log_dict、察碟空為本物存。

四:比行而生報

用 MLflow 比工析多試。

# compare_runs.py
import mlflow
from mlflow.tracking import MlflowClient

client = MlflowClient()

def compare_experiments(experiment_name, metric_name="test_accuracy", top_n=5):
    """
# ... (see EXAMPLES.md for complete implementation)

命行比:

# Compare runs using MLflow CLI
mlflow runs compare --experiment-name customer-churn \
  --order-by "metrics.test_accuracy DESC" \
  --max-results 10

# Export run data to CSV
mlflow experiments csv --experiment-name customer-churn \
  --output experiments.csv

得:終出示序行含要度、HTML 報生含格比表、CSV 檔含諸行資為深析。

敗:以 mlflow experiments list 驗試在、察度名精配(敏)、確行成(察行態)、驗檔書權於出檔。

五:配遠物存

立 S3/Azure/GCS 背為可長物管。

# artifact_storage_config.py
import mlflow
import os

def configure_s3_backend():
    """
    Configure S3 for artifact storage.
    """
# ... (see EXAMPLES.md for complete implementation)

Docker Compose 為 MLflow 含 PostgreSQL 與 S3:

# docker-compose.yml
version: '3.8'

services:
  postgres:
    image: postgres:14
    environment:
      POSTGRES_DB: mlflow
# ... (see EXAMPLES.md for complete implementation)

得:物上載成於遠存、MLflow UI 示物鏈指 S3/Azure/GCS URI、由 UI 載物正行。

敗:以 aws s3 lsaz storage blob list 驗雲憑、察桶/容權(需書權)、確 MLflow 含雲附(pip install mlflow[extras])裝、測網於存端、察 CORS 為瀏訪。

六:行試生命管

立自清、藏、組策。

# lifecycle_management.py
import mlflow
from mlflow.tracking import MlflowClient
from datetime import datetime, timedelta

client = MlflowClient()

def archive_old_experiments(days_old=90):
# ... (see EXAMPLES.md for complete implementation)

得:舊試移至刪態、敗行自活列除、佳行標為易濾於 UI、存空復。

敗:察試權(必為主乃可刪)、驗行於 FAILED 態、確度於諸序行存、察庫連於批操、驗遠存物刪足權。

  • MLflow 追服可由 web UI 訪
  • 試建而行記成
  • 自記捕框特度自
  • 自度、參、物正記
  • 比查返期頂行
  • 遠物存配而行
  • 物可由 UI 與程載
  • 行濾搜以標行
  • HTML 比報生無誤
  • 生命管腳本執成

  • 連超時:MLflow 服自訓腳本不可訪——驗 MLFLOW_TRACKING_URI 環變、察防火、確服行
  • 物上載敗:S3/Azure 憑未配或桶不在——先測雲 CLI 訪、驗桶權
  • 缺度:自記閉或框版不支——察 MLflow 版合、退至手記
  • 行雜:試行過多污 UI——早行標策、常用生命管腳本
  • 大物:記全資致存脹——唯記樣或參、用外資版(DVC)
  • 名不一:諸行間參異名——於配檔標名規
  • 庫鎖:SQLite 不支並書——多用境用 PostgreSQL/MySQL
  • 自記衝:多自記配相擾——用 exclusive=True 或閉衝自記

  • register-ml-model - 登追之模於 MLflow 模登
  • version-ml-data - 用 DVC 為可重現試版資集
  • setup-automl-pipeline - 整試追於自 ML 流
  • deploy-ml-model-serving - 部最佳追之模於產
  • orchestrate-ml-pipeline - 合試追與流協

GitHub репозиторий

pjt222/agent-almanac
Путь: i18n/wenyan-ultra/skills/track-ml-experiments
0
agentsagentskillsai-assisted-developmentclaude-codeskillsteams

Похожие навыки

content-collections

Мета

Этот навык предоставляет проверенную в продакшене настройку для Content Collections — TypeScript-ориентированного инструмента, который преобразует файлы Markdown/MDX в типобезопасные коллекции данных с валидацией Zod. Используйте его при создании блогов, сайтов документации или контентных приложений на Vite + React для обеспечения типобезопасности и автоматической проверки содержимого. Он охватывает всё: от настройки плагина Vite и компиляции MDX до оптимизации развертывания и валидации схем.

Просмотреть навык

polymarket

Мета

Этот навык позволяет разработчикам создавать приложения на платформе прогнозных рынков Polymarket, включая интеграцию с API для торговли и получения рыночных данных. Он также обеспечивает потоковую передачу данных в реальном времени через WebSocket для отслеживания текущих сделок и рыночной активности. Используйте его для реализации торговых стратегий или создания инструментов, обрабатывающих обновления рынка в реальном времени.

Просмотреть навык

creating-opencode-plugins

Мета

Этот навык помогает разработчикам создавать плагины OpenCode, которые подключаются к более чем 25 типам событий, таким как команды, файлы и операции LSP. Он предоставляет структуру плагина, спецификации API событий и шаблоны реализации для модулей на JavaScript/TypeScript. Используйте его, когда вам нужно перехватывать, отслеживать или расширять жизненный цикл ассистента OpenCode AI с помощью пользовательской событийно-ориентированной логики.

Просмотреть навык

sglang

Мета

SGLang — это высокопроизводительный фреймворк для обслуживания больших языковых моделей (LLM), специализирующийся на быстрой структурированной генерации JSON, regex и рабочих процессов агентов с использованием кэширования префиксов RadixAttention. Он обеспечивает значительно более высокую скорость вывода, особенно для задач с повторяющимися префиксами, что делает его идеальным для сложных структурированных результатов и многократных диалогов. Выбирайте SGLang вместо альтернатив, таких как vLLM, когда вам требуется ограниченное декодирование или вы создаете приложения с интенсивным совместным использованием префиксов.

Просмотреть навык