MCP HubMCP Hub
Retour aux compétences

deepspeed

zechenzhangAGI
Mis à jour 20 days ago
514 vues
62
2
62
Voir sur GitHub
Designdeepspeeddistributed-trainingzeropipeline-parallelismmixed-precisionoptimizationmicrosoftlarge-scale-trainingfp16fp8

À propos

Cette compétence fournit des conseils d'expert pour l'entraînement distribué en utilisant la bibliothèque DeepSpeed de Microsoft. Elle aide les développeurs à mettre en œuvre des techniques d'optimisation comme les étapes ZeRO, le parallélisme de pipeline et l'entraînement en précision mixte. Utilisez cette compétence lorsque vous travaillez avec les fonctionnalités DeepSpeed, déboguez du code ou apprenez les bonnes pratiques pour l'entraînement de modèles à grande échelle.

Installation rapide

Claude Code

Recommandé
Principal
npx skills add zechenzhangAGI/AI-research-SKILLs -a claude-code
Commande PluginAlternatif
/plugin add https://github.com/zechenzhangAGI/AI-research-SKILLs
Git CloneAlternatif
git clone https://github.com/zechenzhangAGI/AI-research-SKILLs.git ~/.claude/skills/deepspeed

Copiez et collez cette commande dans Claude Code pour installer cette compétence

Dépôt GitHub

zechenzhangAGI/AI-research-SKILLs
Chemin: 08-distributed-training/deepspeed
0
aiai-researchclaudeclaude-codeclaude-skillscodex

Compétences associées

when-optimizing-prompts-use-prompt-architect

Autre

Prompt Architect is a framework for developers to systematically analyze, refine, and optimize prompts using evidence-based techniques. It helps improve AI response quality and consistency by identifying anti-patterns and validating changes through A/B testing. Use it when you need to refactor an underperforming prompt or design a new, effective one from scratch.

Voir la compétence

performance-analysis

Autre

This skill provides comprehensive performance analysis and bottleneck detection for Claude Flow swarms, helping developers identify optimization opportunities. It offers real-time monitoring, profiling of swarm operations, and generates detailed reports with actionable recommendations. Use this skill when you need to diagnose performance issues and improve the efficiency of your Claude Code applications.

Voir la compétence

when-profiling-performance-use-performance-profiler

Autre

This skill provides comprehensive performance profiling to measure, analyze, and optimize application performance across CPU, memory, I/O, and network dimensions. It helps developers identify bottlenecks, perform root cause analysis, and implement optimizations using tools like perf, Instruments, and clinic.js. Use it when you need systematic performance improvement through baseline measurement, detection, and optimization phases.

Voir la compétence

pytorch-fsdp

Design

This Claude Skill provides expert guidance for PyTorch Fully Sharded Data Parallel (FSDP) training, helping developers implement distributed training solutions. It covers key features like parameter sharding, mixed precision, CPU offloading, and FSDP2 for large-scale model training. Use this skill when working with FSDP APIs, debugging distributed training code, or learning best practices for sharded data parallelism.

Voir la compétence