MCP HubMCP Hub
스킬 목록으로 돌아가기

register-ml-model

pjt222
업데이트됨 Yesterday
4 조회
17
2
17
GitHub에서 보기
개발aiautomationdata

정보

이 스킬은 MLflow 모델 레지스트리에 훈련된 모델을 완전한 버전 관리와 단계 전환(스테이징, 프로덕션, 아카이브) 기능과 함께 등록합니다. 모델 계보 관리, 배포 추적 및 거버넌스를 위한 승인 워크플로우를 구현합니다. 실험 단계에서 프로덕션으로 모델을 승격하거나, 버전을 롤백하거나, 규정 준수를 위한 변경 사항을 감사할 때 사용하세요.

빠른 설치

Claude Code

추천
기본
npx skills add pjt222/agent-almanac -a claude-code
플러그인 명령대체
/plugin add https://github.com/pjt222/agent-almanac
Git 클론대체
git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/register-ml-model

Claude Code에서 이 명령을 복사하여 붙여넣어 스킬을 설치하세요

문서

註冊 ML 模型

完整配置文件與模板見 Extended Examples

實施 MLflow Model Registry,作系統化之模型版本化、階段管理與部署治理。

適用時機

  • 將已訓練之模型自實驗擢升至生產
  • 跨開發階段管理多個模型版本
  • 實施模型核准工作流以資治理
  • 自訓練至部署追蹤模型譜系
  • 回滾至前模型版本
  • 為 A/B 測試比對已部署之模型版本
  • 為合規要求稽核模型變更

輸入

  • 必要:啟用 Model Registry 之 MLflow 追蹤伺服器
  • 必要:已記錄於 MLflow 之已訓模型(自追蹤運行)
  • 必要:擬於登記簿登記之模型名
  • 選擇性:核准工作流整合(電郵、Slack、Jira)
  • 選擇性:自動擢升之 CI/CD 管線
  • 選擇性:模型驗證指標閾值

步驟

步驟一:配置 Model Registry 後端

以資料庫後端設置 MLflow Model Registry(生產環境不建議文件式登記簿)。

# Start MLflow server with Model Registry support
mlflow server \
  --backend-store-uri postgresql://user:pass@localhost:5432/mlflow \
  --default-artifact-root s3://mlflow-artifacts/models \
  --host 0.0.0.0 \
  --port 5000

Python 配置:

# model_registry_config.py
import mlflow
from mlflow.tracking import MlflowClient

# Set tracking URI (must support Model Registry)
MLFLOW_TRACKING_URI = "http://mlflow-server.company.com:5000"
mlflow.set_tracking_uri(MLFLOW_TRACKING_URI)

# ... (see EXAMPLES.md for complete implementation)

預期: Model Registry UI 標籤現於 MLflow 中,search_registered_models() 成功返回(即便為空),資料庫含 registered_models 表。

失敗時: 確認 MLflow 版本 ≥1.2(Model Registry 自 1.2 引入),檢查資料庫後端(SQLite 對 Model Registry 支援不全),確保 --backend-store-uri 指向資料庫(非 file://),確認資料庫用戶具 CREATE TABLE 權限,查 MLflow 伺服器日誌之遷移錯誤。

步驟二:自訓練運行註冊模型

將已記錄之模型以全面元資料註冊至 Model Registry。

# register_model.py
import mlflow
from mlflow.tracking import MlflowClient
from model_registry_config import MLFLOW_TRACKING_URI

mlflow.set_tracking_uri(MLFLOW_TRACKING_URI)
client = MlflowClient()

# ... (see EXAMPLES.md for complete implementation)

預期: 新模型版本現於 Model Registry UI,版本含描述與標籤,模型製品可透過 models:/<model-name>/<version> URI 取用,模型簽章與輸入例皆保留。

失敗時: 確認 run_id 存在且已完成(client.get_run(run_id)),檢查模型製品路徑與所記製品相符(mlflow.search_runs() 以察),確保模型以正確之框架風味記錄(mlflow.sklearn.log_model 而非 mlflow.log_artifact),確認模型名無特殊字元(用連字符勿用底線),檢查製品儲存可達。

步驟三:附驗證之階段轉換

帶驗證檢查地將模型版本經各階段(None → Staging → Production → Archived)。

# stage_management.py
import mlflow
from mlflow.tracking import MlflowClient
from datetime import datetime

client = MlflowClient()

class ModelStageManager:
# ... (see EXAMPLES.md for complete implementation)

預期: 模型版本之階段於登記簿更新,舊版本自動歸檔,轉換時戳記於標籤,回滾恢復前生產版本。

失敗時: 檢查版本存在且於預期階段,確認 archive_existing_versions 旗標行為(若僅一版恐不歸檔),確保資料庫支援階段更新之並發交易,檢查階段轉換鎖(每版本同時只一轉換),確認核准工作流整合。

步驟四:實施模型別名與引用

用模型別名作穩定之部署引用(MLflow ≥2.0)。

# model_aliases.py
from mlflow.tracking import MlflowClient

client = MlflowClient()

def set_model_alias(model_name, version, alias):
    """
    Set an alias for a model version (MLflow 2.0+).
# ... (see EXAMPLES.md for complete implementation)

預期: 別名現於 Model Registry UI,以別名載入模型可行(models:/name@alias),更新別名立即影響新載入,A/B 測試基礎建置可運作。

失敗時: 升級 MLflow 至 ≥2.0 以支援原生別名,舊版本用標籤式回退,確認別名命名(僅字母數字與連字符),檢查別名衝突(每模型版本一別名)。

步驟五:實施模型譜系追蹤

以全面元資料自資料追蹤至部署之完整譜系。

# model_lineage.py
import mlflow
from mlflow.tracking import MlflowClient
import json

client = MlflowClient()

def enrich_model_metadata(model_name, version, lineage_data):
# ... (see EXAMPLES.md for complete implementation)

預期: 模型版本標籤含全面譜系資訊,get_model_lineage() 返完整歷史,JSON 報告含資料源、訓練細節與部署資訊。

失敗時: 確認標籤值為字串(將 dict 轉為 JSON),檢查標籤鍵名(無空格或特殊字元),確保訓練時已捕獲譜系資料,確認 run_id 有效可達。

步驟六:以 CI/CD 自動化登記簿操作

將模型註冊整合入 CI/CD 管線以自動擢升。

# .github/workflows/model_promotion.yml
name: Model Promotion Pipeline

on:
  workflow_dispatch:
    inputs:
      model_name:
        description: 'Model name to promote'
# ... (see EXAMPLES.md for complete implementation)

Python 自動化腳本:

# scripts/promote_model.py
import argparse
from stage_management import ModelStageManager

def main():
    parser = argparse.ArgumentParser()
    parser.add_argument("--model-name", required=True)
    parser.add_argument("--version", type=int, required=True)
# ... (see EXAMPLES.md for complete implementation)

預期: GitHub Actions 工作流於手動派發時觸發,驗證測試通過,模型擢升至目標階段,Slack 通知已發,部署管線自動觸發。

失敗時: 檢查 MLFLOW_TRACKING_URI 之 GitHub secrets 配置,確認 GitHub Actions 至 MLflow 伺服器之網路存取(恐需 VPN 或 IP 允許清單),確保驗證腳本之指標閾值正確,檢查 Slack webhook 配置,確認 Python 腳本之執行權限。

驗證

  • Model Registry 可達且後端已配置
  • 模型自訓練運行成功註冊
  • 階段轉換可行(None → Staging → Production → Archived)
  • 驗證檢查強制品質閾值
  • 模型別名已設且解析正確
  • 譜系元資料全面捕獲
  • 回滾功能恢復前版本
  • CI/CD 管線自動化擢升
  • 階段變更之團隊通知運作
  • 所有階段之模型 URI 解析正確

常見陷阱

  • SQLite 限制:生產之 Model Registry 需資料庫後端(PostgreSQL/MySQL)——文件式登記簿致並發問題
  • 階段衝突:同階段多版本致混淆——用 archive_existing_versions=True 自動歸檔
  • 缺失運行連結:無 run_id 而註冊模型則失譜系——務自 MLflow 運行而非生文件註冊
  • 別名混淆:用階段而非別名為部署目標——階段為工作流,別名為部署引用
  • 跳過驗證:未檢即擢至生產——於 CI/CD 管線中強制驗證
  • 無回滾計畫:生產問題無回滾能力——將前生產版本留於 Archived 階段
  • 標籤過載:太多無組織之標籤——標準化標籤結構與命名慣例
  • 手動流程:人驅之擢升易錯且慢——以 CI/CD 與核准工作流自動化
  • 製品丟失:模型已註但製品自儲存被刪——確保製品保留策略與模型生命週期一致

相關技能

  • track-ml-experiments — 註冊前先將模型記錄至 MLflow
  • deploy-ml-model-serving — 將已註冊之模型部署至服務基礎建置
  • run-ab-test-models — 用登記簿別名 A/B 測試模型
  • orchestrate-ml-pipeline — 自動化模型訓練與註冊
  • version-ml-data — 為模型譜系版本化訓練資料

GitHub 저장소

pjt222/agent-almanac
경로: i18n/wenyan-lite/skills/register-ml-model
0
agentsagentskillsai-assisted-developmentclaude-codeskillsteams

연관 스킬

subagent-driven-development

개발

이 스킬은 각 독립적인 작업마다 새로운 하위 에이전트를 배치하고 작업 사이에 코드 리뷰를 진행하여 구현 계획을 실행합니다. 이 리뷰 프로세스를 통해 품질 게이트를 유지하면서 빠른 반복 작업을 가능하게 합니다. 동일한 세션 내에서 대부분 독립적인 작업을 진행할 때 내장된 품질 검증과 함께 지속적인 진행을 보장하기 위해 사용하세요.

스킬 보기

qmd

개발

qmd는 BM25, 벡터 임베딩, 재순위화를 결합한 하이브리드 검색을 통해 로컬 파일을 색인화하고 검색할 수 있는 로컬 검색 및 색인화 CLI 도구입니다. 명령줄 사용과 Claude 통합을 위한 MCP(Model Context Protocol) 모드를 모두 지원합니다. 이 도구는 임베딩에 Ollama를 사용하고 색인을 로컬에 저장하여 터미널에서 직접 문서나 코드베이스를 검색하는 데 이상적입니다.

스킬 보기

mcporter

개발

mcporter 스킬은 개발자가 Claude에서 직접 Model Context Protocol(MCP) 서버를 관리하고 호출할 수 있도록 합니다. 이 스킬은 사용 가능한 서버를 나열하고, 인수를 사용해 해당 서버의 도구를 호출하며, 인증 및 데몬 생명주기를 처리하는 명령어를 제공합니다. 개발 워크플로우에서 MCP 서버 기능을 통합하고 테스트할 때 이 스킬을 사용하세요.

스킬 보기

adk-deployment-specialist

개발

이 스킬은 A2A 프로토콜을 사용하여 Vertex AI ADK 에이전트를 배포하고 오케스트레이션하며, AgentCard 검색, 작업 제출, 코드 실행 샌드박스 및 메모리 뱅크와 같은 지원 도구를 관리합니다. Python, Java 또는 Go 언어로 순차, 병렬 또는 루프 오케스트레이션 패턴을 갖춘 다중 에이전트 시스템 구축을 가능하게 합니다. Google Cloud에서 ADK 에이전트 배포 또는 에이전트 워크플로우 오케스트레이션을 요청받았을 때 사용하세요.

스킬 보기