qwen-edit
Über
Diese Fähigkeit bietet KI-gestützte Bildbearbeitung mit Qwen-Image-Edit für Aufgaben wie das Bewahren der Identität in Fotos, das Neurahmen von Bildern, das Ändern von Kleidung/Posen und das Anwenden von Stilübertragungen. Sie stellt Prompt-Muster, Parameterabstimmung und Beispiele für Entwickler bereit, die diese Bearbeitungen implementieren. Nutzen Sie sie für Transformationen, wobei der Hintergundaustausch aufgrund von Artefaktproblemen vermieden werden sollte.
Schnellinstallation
Claude Code
Empfohlennpx skills add digitalsamba/claude-code-video-toolkit -a claude-code/plugin add https://github.com/digitalsamba/claude-code-video-toolkitgit clone https://github.com/digitalsamba/claude-code-video-toolkit.git ~/.claude/skills/qwen-editKopieren Sie diesen Befehl und fügen Sie ihn in Claude Code ein, um diese Fähigkeit zu installieren
Dokumentation
Qwen-Image-Edit Skill
AI-powered image editing using Qwen-Image-Edit-2511 via RunPod serverless.
Status: Evolving - learnings being captured as we experiment
When to Use This Skill
Use when the user wants to:
- Edit/transform photos while preserving identity
- Reframe cropped images (fix cut-off heads, etc.)
- Change clothing, add accessories
- Change pose (arm positions, hand placement)
- Apply style transfers (cyberpunk, anime, oil painting)
- Adjust lighting/color grading
- Add/remove objects
- Character transformations (Bond, Neo, etc.)
When NOT to Use
- Background replacement (single image) - creates cut-out artifacts, halos
- Face swapping - cannot preserve identity from reference
- Outpainting - can't extend canvas reliably
Use With Care
- Multi-image compositing - CAN work with explicit identity anchors (see examples.md for prompt patterns). Requires describing distinctive features (hair texture/color, ethnicity, outfit) and using guidance ~2.0
- Camera angle changes - Inconsistent results. Vertical angles (low/high) work better than rotational (three-quarter view)
Quick Reference
# Basic edit
python tools/image_edit.py --input photo.jpg --prompt "Add sunglasses"
# With negative prompt (recommended)
python tools/image_edit.py --input photo.jpg \
--prompt "Reframe as portrait with full head visible" \
--negative "blur, distortion, artifacts"
# Style transfer
python tools/image_edit.py --input photo.jpg --style cyberpunk
# Background (use cautiously - often fails)
python tools/image_edit.py --input photo.jpg --background office
# Higher quality
python tools/image_edit.py --input photo.jpg --prompt "..." --steps 16 --guidance 3.0
# Multi-image composite (identity-preserving)
python tools/image_edit.py --input person.jpg background.jpg \
--prompt "The [ethnicity] [gender] with [hair description] from first image is now in [scene] from second image. Same [features], [outfit]." \
--negative "different ethnicity, different hair color, different face shape, generic stock photo" \
--steps 16 --guidance 2.0
Key Files
prompting.md- Prompt patterns and structureexamples.md- Good/bad examples from experimentsparameters.md- Tuning steps, guidance, negative prompts
Tool Location
tools/image_edit.py - CLI wrapper for RunPod endpoint
Related Docs
docs/qwen-edit-patterns.md- Character transformation patterns.ai_dev/qwen-edit-research.md- Research notes
GitHub Repository
Verwandte Skills
llamaguard
AndereLlamaGuard ist Metas 7-8B-Parameter-Modell zur Moderation von LLM-Eingaben und -Ausgaben in sechs Sicherheitskategorien wie Gewalt und Hassrede. Es bietet eine Genauigkeit von 94-95 % und kann mit vLLM, Hugging Face oder Amazon SageMaker eingesetzt werden. Nutzen Sie diese Skill, um Inhaltsfilterung und Sicherheitsguardrails einfach in Ihre KI-Anwendungen zu integrieren.
cost-optimization
AndereDiese Claude Skill unterstützt Entwickler bei der Optimierung von Cloud-Kosten durch Ressourcen-Dimensionierung, Tagging-Strategien und Ausgabenanalysen. Sie bietet einen Rahmen zur Senkung von Cloud-Ausgaben und zur Implementierung von Kosten-Governance für AWS, Azure und GCP. Nutzen Sie sie, wenn Sie Infrastrukturkosten analysieren, Ressourcen richtig dimensionieren oder Budgetvorgaben einhalten müssen.
quantizing-models-bitsandbytes
AndereDiese Fähigkeit quantisiert LLMs auf 8-Bit- oder 4-Bit-Präzision mittels bitsandbytes und erreicht dabei eine Speicherreduzierung von 50–75 % bei minimalem Genauigkeitsverlust. Sie ist ideal für den Betrieb größerer Modelle mit begrenztem GPU-Speicher oder zur Beschleunigung von Inferenzvorgängen und unterstützt Formate wie INT8, NF4 und FP4. Die Fähigkeit integriert sich in HuggingFace Transformers und ermöglicht QLoRA-Training sowie 8-Bit-Optimierer.
dispatching-parallel-agents
AndereDiese Claude-Fähigkeit verteilt mehrere Agenten, um drei oder mehr unabhängige Probleme gleichzeitig zu untersuchen und zu beheben. Sie ist für Szenarien konzipiert, die unabhängige Fehler umfassen, die ohne gemeinsamen Zustand oder Abhängigkeiten gelöst werden können. Die Kernfähigkeit ist die parallele Problemlösung, bei der pro unabhängigem Problembereich ein Agent zugewiesen wird, um die Effizienz zu maximieren.
