返回技能列表

training-llms-megatron

zechenzhangAGI
更新于 23 days ago
624 次查看
62
2
62
在 GitHub 上查看
设计aidesign

关于

This Claude Skill trains large language models (2B-462B parameters) using NVIDIA's Megatron-Core framework with advanced parallelism strategies. Use it when training models over 1B parameters, needing maximum GPU efficiency (47% MFU on H100), or requiring tensor/pipeline/sequence parallelism. It's a production-ready framework proven on models like Nemotron, LLaMA, and DeepSeek.

快速安装

Claude Code

推荐
主要方式
npx skills add zechenzhangAGI/AI-research-SKILLs -a claude-code
插件命令备选方式
/plugin add https://github.com/zechenzhangAGI/AI-research-SKILLs
Git 克隆备选方式
git clone https://github.com/zechenzhangAGI/AI-research-SKILLs.git ~/.claude/skills/training-llms-megatron

在 Claude Code 中复制并粘贴此命令以安装该技能

GitHub 仓库

zechenzhangAGI/AI-research-SKILLs
路径: 08-distributed-training/megatron-core
0
aiai-researchclaudeclaude-codeclaude-skillscodex

相关推荐技能

executing-plans

设计

该Skill用于当开发者提供完整实施计划时,以受控批次方式执行代码实现。它会先审阅计划并提出疑问,然后分批次执行任务(默认每批3个任务),并在批次间暂停等待审查。关键特性包括分批次执行、内置检查点和架构师审查机制,确保复杂系统实现的可控性。

查看技能

requesting-code-review

设计

该Skill可在完成任务、实现主要功能或合并代码前自动调度代码审查子代理,确保实现符合需求和计划。它支持通过指定git SHA范围进行精准的代码变更审查,帮助开发者在关键节点及时发现潜在问题。核心原则是"早审查、勤审查",适用于开发流程的各个关键阶段。

查看技能

connect-mcp-server

设计

这个Skill指导开发者如何将MCP服务器连接到Claude Code,支持HTTP、stdio和SSE三种传输协议。它涵盖了从安装配置到认证安全的完整流程,适用于集成GitHub、Notion、数据库等外部服务。当开发者需要添加集成、配置外部工具或提及MCP相关功能时,这个Skill能提供实用的操作指南。

查看技能

web-cli-teleport

设计

该Skill帮助开发者根据任务特性选择Claude Code的Web或CLI界面,并指导如何在两种环境间无缝迁移会话。它能分析任务复杂度、迭代需求等要素,推荐最优工作界面和工作流。关键特性包括会话状态管理、环境切换指导和上下文优化建议。

查看技能