qwen-edit
À propos
Cette compétence offre l'édition d'images par IA via Qwen-Image-Edit pour des tâches telles que la préservation de l'identité dans les photos, le recadrage d'images, la modification de vêtements/poses et l'application de transferts de style. Elle fournit des modèles de prompts, des réglages de paramètres et des exemples pour les développeurs mettant en œuvre ces modifications. Utilisez-la pour des transformations, en évitant le remplacement de l'arrière-plan en raison de problèmes d'artefacts.
Installation rapide
Claude Code
Recommandénpx skills add digitalsamba/claude-code-video-toolkit -a claude-code/plugin add https://github.com/digitalsamba/claude-code-video-toolkitgit clone https://github.com/digitalsamba/claude-code-video-toolkit.git ~/.claude/skills/qwen-editCopiez et collez cette commande dans Claude Code pour installer cette compétence
Documentation
Qwen-Image-Edit Skill
AI-powered image editing using Qwen-Image-Edit-2511 via RunPod serverless.
Status: Evolving - learnings being captured as we experiment
When to Use This Skill
Use when the user wants to:
- Edit/transform photos while preserving identity
- Reframe cropped images (fix cut-off heads, etc.)
- Change clothing, add accessories
- Change pose (arm positions, hand placement)
- Apply style transfers (cyberpunk, anime, oil painting)
- Adjust lighting/color grading
- Add/remove objects
- Character transformations (Bond, Neo, etc.)
When NOT to Use
- Background replacement (single image) - creates cut-out artifacts, halos
- Face swapping - cannot preserve identity from reference
- Outpainting - can't extend canvas reliably
Use With Care
- Multi-image compositing - CAN work with explicit identity anchors (see examples.md for prompt patterns). Requires describing distinctive features (hair texture/color, ethnicity, outfit) and using guidance ~2.0
- Camera angle changes - Inconsistent results. Vertical angles (low/high) work better than rotational (three-quarter view)
Quick Reference
# Basic edit
python tools/image_edit.py --input photo.jpg --prompt "Add sunglasses"
# With negative prompt (recommended)
python tools/image_edit.py --input photo.jpg \
--prompt "Reframe as portrait with full head visible" \
--negative "blur, distortion, artifacts"
# Style transfer
python tools/image_edit.py --input photo.jpg --style cyberpunk
# Background (use cautiously - often fails)
python tools/image_edit.py --input photo.jpg --background office
# Higher quality
python tools/image_edit.py --input photo.jpg --prompt "..." --steps 16 --guidance 3.0
# Multi-image composite (identity-preserving)
python tools/image_edit.py --input person.jpg background.jpg \
--prompt "The [ethnicity] [gender] with [hair description] from first image is now in [scene] from second image. Same [features], [outfit]." \
--negative "different ethnicity, different hair color, different face shape, generic stock photo" \
--steps 16 --guidance 2.0
Key Files
prompting.md- Prompt patterns and structureexamples.md- Good/bad examples from experimentsparameters.md- Tuning steps, guidance, negative prompts
Tool Location
tools/image_edit.py - CLI wrapper for RunPod endpoint
Related Docs
docs/qwen-edit-patterns.md- Character transformation patterns.ai_dev/qwen-edit-research.md- Research notes
Dépôt GitHub
Compétences associées
llamaguard
AutreLlamaGuard est le modèle de Meta, doté de 7 à 8 milliards de paramètres, conçu pour modérer les entrées et sorties des LLM selon six catégories de sécurité comme la violence et les discours haineux. Il offre une précision de 94 à 95 % et peut être déployé avec vLLM, Hugging Face ou Amazon SageMaker. Utilisez cette compétence pour intégrer facilement le filtrage de contenu et des garde-fous de sécurité dans vos applications d'IA.
cost-optimization
AutreCette compétence de Claude aide les développeurs à optimiser les coûts du cloud grâce au redimensionnement des ressources, aux stratégies d'étiquetage et à l'analyse des dépenses. Elle fournit un cadre pour réduire les dépenses cloud et mettre en œuvre une gouvernance des coûts sur AWS, Azure et GCP. Utilisez-la lorsque vous devez analyser les coûts d'infrastructure, redimensionner les ressources ou respecter des contraintes budgétaires.
quantizing-models-bitsandbytes
AutreCette compétence quantifie les LLMs en précision 8 bits ou 4 bits à l'aide de bitsandbytes, permettant une réduction de 50 à 75 % de la mémoire utilisée avec une perte de précision minime. Elle est idéale pour exécuter des modèles plus volumineux sur une mémoire GPU limitée ou pour accélérer l'inférence, prenant en charge des formats comme INT8, NF4 et FP4. La compétence s'intègre à HuggingFace Transformers et permet l'entraînement QLoRA ainsi que l'utilisation d'optimiseurs en 8 bits.
dispatching-parallel-agents
AutreCette compétence Claude déploie plusieurs agents pour enquêter et résoudre simultanément 3 problèmes indépendants ou plus. Elle est conçue pour des scénarios impliquant des défaillances non liées qui peuvent être résolues sans état partagé ni dépendances. La capacité fondamentale est la résolution de problèmes en parallèle, en assignant un agent par domaine problématique indépendant afin de maximiser l'efficacité.
