MCP HubMCP Hub
Retour aux compétences

pytorch-fsdp

zechenzhangAGI
Mis à jour 20 days ago
507 vues
62
2
62
Voir sur GitHub
Designpytorchfsdpdistributed-trainingdata-parallelshardingmixed-precisioncpu-offloadingfsdp2large-scale-training

À propos

Cette compétence Claude fournit une expertise pour l'entraînement PyTorch Fully Sharded Data Parallel (FSDP), aidant les développeurs à mettre en œuvre des solutions d'entraînement distribué. Elle couvre les fonctionnalités clés telles que le partitionnement des paramètres, la précision mixte, le déchargement sur CPU et FSDP2 pour l'entraînement de modèles à grande échelle. Utilisez cette compétence lorsque vous travaillez avec les API FSDP, déboguez du code d'entraînement distribué ou apprenez les meilleures pratiques pour le parallélisme de données partitionnées.

Installation rapide

Claude Code

Recommandé
Principal
npx skills add zechenzhangAGI/AI-research-SKILLs -a claude-code
Commande PluginAlternatif
/plugin add https://github.com/zechenzhangAGI/AI-research-SKILLs
Git CloneAlternatif
git clone https://github.com/zechenzhangAGI/AI-research-SKILLs.git ~/.claude/skills/pytorch-fsdp

Copiez et collez cette commande dans Claude Code pour installer cette compétence

Dépôt GitHub

zechenzhangAGI/AI-research-SKILLs
Chemin: 08-distributed-training/pytorch-fsdp
0
aiai-researchclaudeclaude-codeclaude-skillscodex

Compétences associées

deepspeed

Design

This skill provides expert guidance for distributed training using Microsoft's DeepSpeed library. It helps developers implement optimization techniques like ZeRO stages, pipeline parallelism, and mixed-precision training. Use this skill when working with DeepSpeed features, debugging code, or learning best practices for large-scale model training.

Voir la compétence

flow-nexus-neural

Autre

Flow Nexus Neural enables developers to train and deploy neural networks in distributed E2B sandbox environments. It supports multiple architectures like feedforward, LSTM, GAN, and transformer networks, with options for custom models or pre-built templates. Use this skill when you need to manage scalable machine learning workflows through Claude with distributed training capabilities.

Voir la compétence

flow-nexus-neural

Autre

Flow Nexus Neural enables developers to train and deploy neural networks (feedforward, LSTM, GAN, transformer) within distributed E2B sandbox environments. It provides both custom model training and pre-built marketplace templates for machine learning workflows. Use this skill when you need to manage scalable, sandboxed neural network training directly through Claude.

Voir la compétence

flow-nexus-neural

Autre

Flow Nexus Neural enables developers to train and deploy neural networks in distributed E2B sandbox environments. It supports multiple architectures like feedforward, LSTM, GAN, and transformer networks, with options for custom models or pre-built templates. Use this skill when you need scalable, sandboxed machine learning workflows integrated directly into your Claude development environment.

Voir la compétence