MCP HubMCP Hub
Вернуться к навыкам

training-llms-megatron

zechenzhangAGI
Обновлено 23 days ago
620 просмотров
62
2
62
Посмотреть на GitHub
Дизайнaidesign

О программе

Этот навык Claude обучает большие языковые модели (от 2 до 462 миллиардов параметров) с использованием фреймворка NVIDIA Megatron-Core и продвинутых стратегий параллелизма. Используйте его при обучении моделей свыше 1 миллиарда параметров, когда требуется максимальная эффективность использования GPU (47% MFU на H100) или необходимо применять тензорный, конвейерный или последовательный параллелизм. Это готовый к промышленной эксплуатации фреймворк, проверенный на таких моделях, как Nemotron, LLaMA и DeepSeek.

Быстрая установка

Claude Code

Рекомендуется
Основной
npx skills add zechenzhangAGI/AI-research-SKILLs -a claude-code
Команда плагинаАльтернативный
/plugin add https://github.com/zechenzhangAGI/AI-research-SKILLs
Git клонированиеАльтернативный
git clone https://github.com/zechenzhangAGI/AI-research-SKILLs.git ~/.claude/skills/training-llms-megatron

Скопируйте и вставьте эту команду в Claude Code для установки этого навыка

GitHub репозиторий

zechenzhangAGI/AI-research-SKILLs
Путь: 08-distributed-training/megatron-core
0
aiai-researchclaudeclaude-codeclaude-skillscodex

Похожие навыки

executing-plans

Дизайн

Используйте навык executing-plans, когда у вас есть полный план реализации для выполнения контролируемыми партиями с контрольными точками проверки. Он загружает и критически анализирует план, затем выполняет задачи небольшими партиями (по умолчанию 3 задачи), сообщая о прогрессе между каждой партией для проверки архитектором. Это обеспечивает систематическую реализацию со встроенными контрольными точками проверки качества.

Просмотреть навык

requesting-code-review

Дизайн

Этот навык запускает суб-агента для ревью кода, который анализирует изменения в коде на соответствие требованиям перед дальнейшими действиями. Его следует использовать после завершения задач, реализации крупных функций или перед слиянием с основной веткой. Ревью помогает выявить проблемы на ранней стадии, сравнивая текущую реализацию с исходным планом.

Просмотреть навык

connect-mcp-server

Дизайн

Этот навык предоставляет разработчикам подробное руководство по подключению серверов MCP к Claude Code с использованием транспортов HTTP, stdio или SSE. Он охватывает установку, конфигурацию, аутентификацию и безопасность для интеграции внешних сервисов, таких как GitHub, Notion и пользовательские API. Используйте его при настройке интеграций MCP, конфигурации внешних инструментов или работе с Model Context Protocol от Claude.

Просмотреть навык

web-cli-teleport

Дизайн

Этот навык помогает разработчикам выбирать между веб-интерфейсом Claude Code и CLI на основе анализа задачи, а также обеспечивает бесшовное перемещение сессий между этими средами. Он оптимизирует рабочий процесс, управляя состоянием и контекстом сессии при переключении между веб-интерфейсом, CLI или мобильным приложением. Используйте его для сложных проектов, требующих различных инструментов на разных этапах работы.

Просмотреть навык