MCP HubMCP Hub
Volver a habilidades

training-llms-megatron

zechenzhangAGI
Actualizado 23 days ago
629 vistas
62
2
62
Ver en GitHub
Diseñoaidesign

Acerca de

Esta habilidad de Claude entrena modelos de lenguaje grande (de 2.000 a 462.000 millones de parámetros) utilizando el framework Megatron-Core de NVIDIA con estrategias avanzadas de paralelismo. Úsela cuando entrene modelos de más de 1.000 millones de parámetros, necesite la máxima eficiencia de GPU (47% de MFU en H100) o requiera paralelismo de tensor, canalización o secuencia. Es un framework listo para producción probado en modelos como Nemotron, LLaMA y DeepSeek.

Instalación rápida

Claude Code

Recomendado
Principal
npx skills add zechenzhangAGI/AI-research-SKILLs -a claude-code
Comando PluginAlternativo
/plugin add https://github.com/zechenzhangAGI/AI-research-SKILLs
Git CloneAlternativo
git clone https://github.com/zechenzhangAGI/AI-research-SKILLs.git ~/.claude/skills/training-llms-megatron

Copia y pega este comando en Claude Code para instalar esta habilidad

Repositorio GitHub

zechenzhangAGI/AI-research-SKILLs
Ruta: 08-distributed-training/megatron-core
0
aiai-researchclaudeclaude-codeclaude-skillscodex

Habilidades relacionadas

executing-plans

Diseño

Utilice la habilidad executing-plans cuando tenga un plan de implementación completo para ejecutar en lotes controlados con puntos de revisión. Esta habilidad carga y revisa críticamente el plan, luego ejecuta tareas en pequeños lotes (por defecto 3 tareas) mientras reporta el progreso entre cada lote para la revisión del arquitecto. Esto asegura una implementación sistemática con puntos de control de calidad integrados.

Ver habilidad

requesting-code-review

Diseño

Esta habilidad despacha un subagente revisor de código para analizar los cambios en el código frente a los requisitos antes de proceder. Debe usarse después de completar tareas, implementar funciones principales o antes de fusionar con la rama principal. La revisión ayuda a detectar problemas de forma temprana al comparar la implementación actual con el plan original.

Ver habilidad

connect-mcp-server

Diseño

Esta habilidad proporciona una guía integral para que los desarrolladores conecten servidores MCP a Claude Code mediante transportes HTTP, stdio o SSE. Cubre la instalación, configuración, autenticación y seguridad para integrar servicios externos como GitHub, Notion y APIs personalizadas. Úsala al configurar integraciones MCP, al configurar herramientas externas o al trabajar con el Protocolo de Contexto del Modelo de Claude.

Ver habilidad

web-cli-teleport

Diseño

Esta habilidad ayuda a los desarrolladores a elegir entre las interfaces web y CLI de Claude Code mediante el análisis de tareas, y luego permite la teletransportación fluida de sesiones entre estos entornos. Optimiza el flujo de trabajo gestionando el estado y el contexto de la sesión al cambiar entre web, CLI o móvil. Úsala para proyectos complejos que requieren diferentes herramientas en varias etapas.

Ver habilidad