MCP HubMCP Hub
Retour aux compétences

qwen-edit

digitalsamba
Mis à jour 2 days ago
2 vues
1,259
215
1,259
Voir sur GitHub
Autreai

À propos

Cette compétence offre l'édition d'images par IA via Qwen-Image-Edit pour des tâches telles que la préservation de l'identité dans les photos, le recadrage d'images, la modification de vêtements/poses et l'application de transferts de style. Elle fournit des modèles de prompts, des réglages de paramètres et des exemples pour les développeurs mettant en œuvre ces modifications. Utilisez-la pour des transformations, en évitant le remplacement de l'arrière-plan en raison de problèmes d'artefacts.

Installation rapide

Claude Code

Recommandé
Principal
npx skills add digitalsamba/claude-code-video-toolkit -a claude-code
Commande PluginAlternatif
/plugin add https://github.com/digitalsamba/claude-code-video-toolkit
Git CloneAlternatif
git clone https://github.com/digitalsamba/claude-code-video-toolkit.git ~/.claude/skills/qwen-edit

Copiez et collez cette commande dans Claude Code pour installer cette compétence

Documentation

Qwen-Image-Edit Skill

AI-powered image editing using Qwen-Image-Edit-2511 via RunPod serverless.

Status: Evolving - learnings being captured as we experiment

When to Use This Skill

Use when the user wants to:

  • Edit/transform photos while preserving identity
  • Reframe cropped images (fix cut-off heads, etc.)
  • Change clothing, add accessories
  • Change pose (arm positions, hand placement)
  • Apply style transfers (cyberpunk, anime, oil painting)
  • Adjust lighting/color grading
  • Add/remove objects
  • Character transformations (Bond, Neo, etc.)

When NOT to Use

  • Background replacement (single image) - creates cut-out artifacts, halos
  • Face swapping - cannot preserve identity from reference
  • Outpainting - can't extend canvas reliably

Use With Care

  • Multi-image compositing - CAN work with explicit identity anchors (see examples.md for prompt patterns). Requires describing distinctive features (hair texture/color, ethnicity, outfit) and using guidance ~2.0
  • Camera angle changes - Inconsistent results. Vertical angles (low/high) work better than rotational (three-quarter view)

Quick Reference

# Basic edit
python tools/image_edit.py --input photo.jpg --prompt "Add sunglasses"

# With negative prompt (recommended)
python tools/image_edit.py --input photo.jpg \
  --prompt "Reframe as portrait with full head visible" \
  --negative "blur, distortion, artifacts"

# Style transfer
python tools/image_edit.py --input photo.jpg --style cyberpunk

# Background (use cautiously - often fails)
python tools/image_edit.py --input photo.jpg --background office

# Higher quality
python tools/image_edit.py --input photo.jpg --prompt "..." --steps 16 --guidance 3.0

# Multi-image composite (identity-preserving)
python tools/image_edit.py --input person.jpg background.jpg \
  --prompt "The [ethnicity] [gender] with [hair description] from first image is now in [scene] from second image. Same [features], [outfit]." \
  --negative "different ethnicity, different hair color, different face shape, generic stock photo" \
  --steps 16 --guidance 2.0

Key Files

  • prompting.md - Prompt patterns and structure
  • examples.md - Good/bad examples from experiments
  • parameters.md - Tuning steps, guidance, negative prompts

Tool Location

tools/image_edit.py - CLI wrapper for RunPod endpoint

Related Docs

  • docs/qwen-edit-patterns.md - Character transformation patterns
  • .ai_dev/qwen-edit-research.md - Research notes

Dépôt GitHub

digitalsamba/claude-code-video-toolkit
Chemin: .claude/skills/qwen-edit
0
ai-video-generatorclaude-codedeveloper-toolselevenlabsopen-sourceopenclaw

Compétences associées

llamaguard

Autre

LlamaGuard est le modèle de Meta, doté de 7 à 8 milliards de paramètres, conçu pour modérer les entrées et sorties des LLM selon six catégories de sécurité comme la violence et les discours haineux. Il offre une précision de 94 à 95 % et peut être déployé avec vLLM, Hugging Face ou Amazon SageMaker. Utilisez cette compétence pour intégrer facilement le filtrage de contenu et des garde-fous de sécurité dans vos applications d'IA.

Voir la compétence

cost-optimization

Autre

Cette compétence de Claude aide les développeurs à optimiser les coûts du cloud grâce au redimensionnement des ressources, aux stratégies d'étiquetage et à l'analyse des dépenses. Elle fournit un cadre pour réduire les dépenses cloud et mettre en œuvre une gouvernance des coûts sur AWS, Azure et GCP. Utilisez-la lorsque vous devez analyser les coûts d'infrastructure, redimensionner les ressources ou respecter des contraintes budgétaires.

Voir la compétence

quantizing-models-bitsandbytes

Autre

Cette compétence quantifie les LLMs en précision 8 bits ou 4 bits à l'aide de bitsandbytes, permettant une réduction de 50 à 75 % de la mémoire utilisée avec une perte de précision minime. Elle est idéale pour exécuter des modèles plus volumineux sur une mémoire GPU limitée ou pour accélérer l'inférence, prenant en charge des formats comme INT8, NF4 et FP4. La compétence s'intègre à HuggingFace Transformers et permet l'entraînement QLoRA ainsi que l'utilisation d'optimiseurs en 8 bits.

Voir la compétence

dispatching-parallel-agents

Autre

Cette compétence Claude déploie plusieurs agents pour enquêter et résoudre simultanément 3 problèmes indépendants ou plus. Elle est conçue pour des scénarios impliquant des défaillances non liées qui peuvent être résolues sans état partagé ni dépendances. La capacité fondamentale est la résolution de problèmes en parallèle, en assignant un agent par domaine problématique indépendant afin de maximiser l'efficacité.

Voir la compétence