MCP HubMCP Hub
Volver a habilidades

qwen-edit

digitalsamba
Actualizado 2 days ago
4 vistas
1,259
215
1,259
Ver en GitHub
Otroai

Acerca de

Esta habilidad proporciona edición de imágenes con IA utilizando Qwen-Image-Edit para tareas como preservar la identidad en fotos, reencuadrar imágenes, cambiar ropa/poses y aplicar transferencias de estilo. Ofrece patrones de prompts, ajuste de parámetros y ejemplos para desarrolladores que implementen estas ediciones. Úsela para transformaciones evitando el reemplazo de fondos debido a problemas de artefactos.

Instalación rápida

Claude Code

Recomendado
Principal
npx skills add digitalsamba/claude-code-video-toolkit -a claude-code
Comando PluginAlternativo
/plugin add https://github.com/digitalsamba/claude-code-video-toolkit
Git CloneAlternativo
git clone https://github.com/digitalsamba/claude-code-video-toolkit.git ~/.claude/skills/qwen-edit

Copia y pega este comando en Claude Code para instalar esta habilidad

Documentación

Qwen-Image-Edit Skill

AI-powered image editing using Qwen-Image-Edit-2511 via RunPod serverless.

Status: Evolving - learnings being captured as we experiment

When to Use This Skill

Use when the user wants to:

  • Edit/transform photos while preserving identity
  • Reframe cropped images (fix cut-off heads, etc.)
  • Change clothing, add accessories
  • Change pose (arm positions, hand placement)
  • Apply style transfers (cyberpunk, anime, oil painting)
  • Adjust lighting/color grading
  • Add/remove objects
  • Character transformations (Bond, Neo, etc.)

When NOT to Use

  • Background replacement (single image) - creates cut-out artifacts, halos
  • Face swapping - cannot preserve identity from reference
  • Outpainting - can't extend canvas reliably

Use With Care

  • Multi-image compositing - CAN work with explicit identity anchors (see examples.md for prompt patterns). Requires describing distinctive features (hair texture/color, ethnicity, outfit) and using guidance ~2.0
  • Camera angle changes - Inconsistent results. Vertical angles (low/high) work better than rotational (three-quarter view)

Quick Reference

# Basic edit
python tools/image_edit.py --input photo.jpg --prompt "Add sunglasses"

# With negative prompt (recommended)
python tools/image_edit.py --input photo.jpg \
  --prompt "Reframe as portrait with full head visible" \
  --negative "blur, distortion, artifacts"

# Style transfer
python tools/image_edit.py --input photo.jpg --style cyberpunk

# Background (use cautiously - often fails)
python tools/image_edit.py --input photo.jpg --background office

# Higher quality
python tools/image_edit.py --input photo.jpg --prompt "..." --steps 16 --guidance 3.0

# Multi-image composite (identity-preserving)
python tools/image_edit.py --input person.jpg background.jpg \
  --prompt "The [ethnicity] [gender] with [hair description] from first image is now in [scene] from second image. Same [features], [outfit]." \
  --negative "different ethnicity, different hair color, different face shape, generic stock photo" \
  --steps 16 --guidance 2.0

Key Files

  • prompting.md - Prompt patterns and structure
  • examples.md - Good/bad examples from experiments
  • parameters.md - Tuning steps, guidance, negative prompts

Tool Location

tools/image_edit.py - CLI wrapper for RunPod endpoint

Related Docs

  • docs/qwen-edit-patterns.md - Character transformation patterns
  • .ai_dev/qwen-edit-research.md - Research notes

Repositorio GitHub

digitalsamba/claude-code-video-toolkit
Ruta: .claude/skills/qwen-edit
0
ai-video-generatorclaude-codedeveloper-toolselevenlabsopen-sourceopenclaw

Habilidades relacionadas

llamaguard

Otro

LlamaGuard es el modelo de Meta de 7-8B parámetros para moderar las entradas y salidas de LLM en seis categorías de seguridad como violencia y discurso de odio. Ofrece una precisión del 94-95% y puede implementarse usando vLLM, Hugging Face o Amazon SageMaker. Utiliza esta skill para integrar fácilmente filtrado de contenido y barreras de seguridad en tus aplicaciones de IA.

Ver habilidad

cost-optimization

Otro

Esta Skill de Claude ayuda a los desarrolladores a optimizar los costes en la nube mediante el ajuste de tamaño de recursos, estrategias de etiquetado y análisis de gastos. Proporciona un marco para reducir los gastos en la nube e implementar una gobernanza de costes en AWS, Azure y GCP. Úsala cuando necesites analizar los costes de infraestructura, ajustar el tamaño de los recursos o cumplir con restricciones presupuestarias.

Ver habilidad

quantizing-models-bitsandbytes

Otro

Esta habilidad cuantiza LLMs a precisión de 8 o 4 bits utilizando bitsandbytes, logrando una reducción de memoria del 50-75% con pérdida mínima de precisión. Es ideal para ejecutar modelos más grandes en memoria GPU limitada o para acelerar la inferencia, admitiendo formatos como INT8, NF4 y FP4. La habilidad se integra con HuggingFace Transformers y permite entrenamiento QLoRA y optimizadores de 8 bits.

Ver habilidad

dispatching-parallel-agents

Otro

Esta Skill de Claude despliega múltiples agentes para investigar y solucionar 3 o más problemas independientes de forma concurrente. Está diseñada para escenarios que involucran fallos no relacionados que pueden resolverse sin estado compartido o dependencias. Su capacidad principal es la resolución paralela de problemas, asignando un agente por cada dominio problemático independiente para maximizar la eficiencia.

Ver habilidad