MCP HubMCP Hub
Volver a habilidades

peft-fine-tuning

davila7
Actualizado 23 days ago
282 vistas
18,478
1,685
18,478
Ver en GitHub
OtroFine-TuningPEFTLoRAQLoRAParameter-EfficientAdaptersLow-RankMemory OptimizationMulti-Adapter

Acerca de

Esta habilidad permite el ajuste fino eficiente en parámetros de modelos de lenguaje grandes utilizando LoRA, QLoRA y más de 25 métodos de adaptadores, reduciendo drásticamente los requisitos de memoria de GPU. Es ideal para ajustar modelos de 7B a 70B en hardware de consumo, entrenando menos del 1% de los parámetros con una pérdida mínima de precisión. La habilidad integra la librería oficial PEFT de HuggingFace para el servicio multi-adaptador y su uso fluido dentro del ecosistema transformers.

Instalación rápida

Claude Code

Recomendado
Principal
npx skills add davila7/claude-code-templates -a claude-code
Comando PluginAlternativo
/plugin add https://github.com/davila7/claude-code-templates
Git CloneAlternativo
git clone https://github.com/davila7/claude-code-templates.git ~/.claude/skills/peft-fine-tuning

Copia y pega este comando en Claude Code para instalar esta habilidad

Repositorio GitHub

davila7/claude-code-templates
Ruta: cli-tool/components/skills/ai-research/fine-tuning-peft
0
anthropicanthropic-claudeclaudeclaude-code

Habilidades relacionadas

llamaguard

Otro

LlamaGuard es el modelo de Meta de 7-8B parámetros para moderar las entradas y salidas de LLM en seis categorías de seguridad como violencia y discurso de odio. Ofrece una precisión del 94-95% y puede implementarse usando vLLM, Hugging Face o Amazon SageMaker. Utiliza esta skill para integrar fácilmente filtrado de contenido y barreras de seguridad en tus aplicaciones de IA.

Ver habilidad

cost-optimization

Otro

Esta Skill de Claude ayuda a los desarrolladores a optimizar los costes en la nube mediante el ajuste de tamaño de recursos, estrategias de etiquetado y análisis de gastos. Proporciona un marco para reducir los gastos en la nube e implementar una gobernanza de costes en AWS, Azure y GCP. Úsala cuando necesites analizar los costes de infraestructura, ajustar el tamaño de los recursos o cumplir con restricciones presupuestarias.

Ver habilidad

quantizing-models-bitsandbytes

Otro

Esta habilidad cuantiza LLMs a precisión de 8 o 4 bits utilizando bitsandbytes, logrando una reducción de memoria del 50-75% con pérdida mínima de precisión. Es ideal para ejecutar modelos más grandes en memoria GPU limitada o para acelerar la inferencia, admitiendo formatos como INT8, NF4 y FP4. La habilidad se integra con HuggingFace Transformers y permite entrenamiento QLoRA y optimizadores de 8 bits.

Ver habilidad

dispatching-parallel-agents

Otro

Esta Skill de Claude despliega múltiples agentes para investigar y solucionar 3 o más problemas independientes de forma concurrente. Está diseñada para escenarios que involucran fallos no relacionados que pueden resolverse sin estado compartido o dependencias. Su capacidad principal es la resolución paralela de problemas, asignando un agente por cada dominio problemático independiente para maximizar la eficiencia.

Ver habilidad