SKILL·EDA2A0

track-ml-experiments

Name: track-ml-experiments
Author: pjt222

pjt222

Обновлено 1 month ago

24 просмотров

Метаaiautomationdesign

О программе

Этот навык настраивает сервер отслеживания MLflow для управления экспериментами с автоматическим логированием популярных фреймворков. Он обеспечивает систематическое сравнение обучающих запусков через метрики и визуализации, одновременно управляя артефактами в удалённом хранилище. Используйте его при старте ML-проектов, требующих воспроизводимых рабочих процессов, при переходе с ручного логирования или для сравнения множества запусков с полным отслеживанием происхождения данных.

Быстрая установка

Claude Code

Рекомендуется

Основной

npx skills add pjt222/agent-almanac -a claude-code

Команда плагинаАльтернативный

/plugin add https://github.com/pjt222/agent-almanac

Git клонированиеАльтернативный

git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/track-ml-experiments

Скопируйте и вставьте эту команду в Claude Code для установки этого навыка

Документация

追 ML 試

見 Extended Examples 為全配檔與模

立 MLflow 追服、行全試追含度、參、物。

用

始新 ML 案需試追→用
由手日轉至自追→用
系比多模訓行→用
與隊分試果→用
建可重現 ML 流含全系追→用
整試追於 CI/CD 流→用

入

必：含 ML 框（sklearn、pytorch、tensorflow、xgboost）之 Python 境
必：MLflow 裝（pip install mlflow）
可：遠存背（S3、Azure Blob、GCS）為物
可：庫背（PostgreSQL、MySQL）為元存
可：遠背認憑

行

一：初 MLflow 追服

立 MLflow 追服含宜背。

# Option 1: Local file-based tracking (development)
mkdir -p mlruns
export MLFLOW_TRACKING_URI="file:./mlruns"

# Option 2: SQLite backend with local artifacts
mlflow server \
  --backend-store-uri sqlite:///mlflow.db \
  --default-artifact-root ./mlartifacts \
# ... (see EXAMPLES.md for complete implementation)

建配檔為隊享：

# mlflow_config.py
import os

MLFLOW_TRACKING_URI = os.getenv(
    "MLFLOW_TRACKING_URI",
    "http://mlflow-server.company.com:5000"
)

# ... (see EXAMPLES.md for complete implementation)

得：MLflow UI 可訪於指 host:port、示空試列。服日確啟成無誤。

敗：察口可用以 netstat -tulpn | grep 5000、驗庫連串、確 S3 憑配（aws configure）、察防火牆規於遠訪。

二：配 ML 框自記

啟框自記以自捕度、參、模。

# training_script.py
import mlflow
from mlflow_config import MLFLOW_TRACKING_URI, MLFLOW_EXPERIMENT_NAME

# Set tracking URI
mlflow.set_tracking_uri(MLFLOW_TRACKING_URI)
mlflow.set_experiment(MLFLOW_EXPERIMENT_NAME)

# ... (see EXAMPLES.md for complete implementation)

PyTorch：

import mlflow.pytorch

mlflow.pytorch.autolog(
    log_every_n_epoch=1,
    log_every_n_step=None,
    log_models=True,
    disable=False,
    exclusive=False,
# ... (see EXAMPLES.md for complete implementation)

得：行現於 MLflow UI 含諸超參、度（訓/驗失、準）、模物、入例自記。

敗：驗 MLflow 版於 ML 框合（mlflow.sklearn.autolog() 需 MLflow ≥1.20）、察自記支於模類否、閉自記用手記為退、用 mlflow.set_tracking_uri() 察日為連誤。

三：行全手記

加自度、參、物、標為全試文。

# comprehensive_tracking.py
import mlflow
import numpy as np
import matplotlib.pyplot as plt
from pathlib import Path

def train_and_log_model(params, X_train, y_train, X_test, y_test):
    """
# ... (see EXAMPLES.md for complete implementation)

得：MLflow UI 示富試訊含逐步度、視物、模簽、入例、為濾搜之全標。

敗：察物存權（aws s3 ls s3://bucket/path）、驗 matplotlib 背為圖記（plt.switch_backend('Agg')）、確 JSON 可序資類為 log_dict、察碟空為本物存。

四：比行而生報

用 MLflow 比工析多試。

# compare_runs.py
import mlflow
from mlflow.tracking import MlflowClient

client = MlflowClient()

def compare_experiments(experiment_name, metric_name="test_accuracy", top_n=5):
    """
# ... (see EXAMPLES.md for complete implementation)

命行比：

# Compare runs using MLflow CLI
mlflow runs compare --experiment-name customer-churn \
  --order-by "metrics.test_accuracy DESC" \
  --max-results 10

# Export run data to CSV
mlflow experiments csv --experiment-name customer-churn \
  --output experiments.csv

得：終出示序行含要度、HTML 報生含格比表、CSV 檔含諸行資為深析。

敗：以 mlflow experiments list 驗試在、察度名精配（敏）、確行成（察行態）、驗檔書權於出檔。

五：配遠物存

立 S3/Azure/GCS 背為可長物管。

# artifact_storage_config.py
import mlflow
import os

def configure_s3_backend():
    """
    Configure S3 for artifact storage.
    """
# ... (see EXAMPLES.md for complete implementation)

Docker Compose 為 MLflow 含 PostgreSQL 與 S3：

# docker-compose.yml
version: '3.8'

services:
  postgres:
    image: postgres:14
    environment:
      POSTGRES_DB: mlflow
# ... (see EXAMPLES.md for complete implementation)

得：物上載成於遠存、MLflow UI 示物鏈指 S3/Azure/GCS URI、由 UI 載物正行。

敗：以 aws s3 ls 或 az storage blob list 驗雲憑、察桶/容權（需書權）、確 MLflow 含雲附（pip install mlflow[extras]）裝、測網於存端、察 CORS 為瀏訪。

六：行試生命管

立自清、藏、組策。

# lifecycle_management.py
import mlflow
from mlflow.tracking import MlflowClient
from datetime import datetime, timedelta

client = MlflowClient()

def archive_old_experiments(days_old=90):
# ... (see EXAMPLES.md for complete implementation)

得：舊試移至刪態、敗行自活列除、佳行標為易濾於 UI、存空復。

敗：察試權（必為主乃可刪）、驗行於 FAILED 態、確度於諸序行存、察庫連於批操、驗遠存物刪足權。

驗

忌

連超時：MLflow 服自訓腳本不可訪——驗 MLFLOW_TRACKING_URI 環變、察防火、確服行
物上載敗：S3/Azure 憑未配或桶不在——先測雲 CLI 訪、驗桶權
缺度：自記閉或框版不支——察 MLflow 版合、退至手記
行雜：試行過多污 UI——早行標策、常用生命管腳本
大物：記全資致存脹——唯記樣或參、用外資版（DVC）
名不一：諸行間參異名——於配檔標名規
庫鎖：SQLite 不支並書——多用境用 PostgreSQL/MySQL
自記衝：多自記配相擾——用 exclusive=True 或閉衝自記

參

register-ml-model - 登追之模於 MLflow 模登
version-ml-data - 用 DVC 為可重現試版資集
setup-automl-pipeline - 整試追於自 ML 流
deploy-ml-model-serving - 部最佳追之模於產
orchestrate-ml-pipeline - 合試追與流協

GitHub репозиторий

pjt222/agent-almanac

Путь: i18n/wenyan-ultra/skills/track-ml-experiments

agentsagentskillsai-assisted-developmentclaude-codeskillsteams

FAQ

Frequently asked questions

What is the track-ml-experiments skill?

track-ml-experiments is a Claude Skill by pjt222. Skills package instructions and resources that Claude loads on demand, so Claude can perform track-ml-experiments-related tasks without extra prompting.

How do I install track-ml-experiments?

Use the install commands on this page: add track-ml-experiments to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does track-ml-experiments belong to?

track-ml-experiments is in the Meta category, tagged ai, automation and design.

Is track-ml-experiments free to use?

Yes. track-ml-experiments is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.

Похожие навыки

content-collections

Мета

Этот навык предоставляет проверенную в продакшене настройку для Content Collections — TypeScript-ориентированного инструмента, который преобразует файлы Markdown/MDX в типобезопасные коллекции данных с валидацией Zod. Используйте его при создании блогов, сайтов документации или контентных приложений на Vite + React для обеспечения типобезопасности и автоматической проверки содержимого. Он охватывает всё: от настройки плагина Vite и компиляции MDX до оптимизации развертывания и валидации схем.

Просмотреть навык

polymarket

Мета

Этот навык позволяет разработчикам создавать приложения на платформе прогнозных рынков Polymarket, включая интеграцию с API для торговли и получения рыночных данных. Он также обеспечивает потоковую передачу данных в реальном времени через WebSocket для отслеживания текущих сделок и рыночной активности. Используйте его для реализации торговых стратегий или создания инструментов, обрабатывающих обновления рынка в реальном времени.

Просмотреть навык

creating-opencode-plugins

Мета

Этот навык помогает разработчикам создавать плагины OpenCode, которые подключаются к более чем 25 типам событий, таким как команды, файлы и операции LSP. Он предоставляет структуру плагина, спецификации API событий и шаблоны реализации для модулей на JavaScript/TypeScript. Используйте его, когда вам нужно перехватывать, отслеживать или расширять жизненный цикл ассистента OpenCode AI с помощью пользовательской событийно-ориентированной логики.

Просмотреть навык

sglang

Мета

SGLang — это высокопроизводительный фреймворк для обслуживания больших языковых моделей (LLM), специализирующийся на быстрой структурированной генерации JSON, regex и рабочих процессов агентов с использованием кэширования префиксов RadixAttention. Он обеспечивает значительно более высокую скорость вывода, особенно для задач с повторяющимися префиксами, что делает его идеальным для сложных структурированных результатов и многократных диалогов. Выбирайте SGLang вместо альтернатив, таких как vLLM, когда вам требуется ограниченное декодирование или вы создаете приложения с интенсивным совместным использованием префиксов.

Просмотреть навык