Zurück zu Fähigkeiten

qwen-edit

digitalsamba
Aktualisiert 2 days ago
1 Ansichten
1,259
215
1,259
Auf GitHub ansehen
Andereai

Über

Diese Fähigkeit bietet KI-gestützte Bildbearbeitung mit Qwen-Image-Edit für Aufgaben wie das Bewahren der Identität in Fotos, das Neurahmen von Bildern, das Ändern von Kleidung/Posen und das Anwenden von Stilübertragungen. Sie stellt Prompt-Muster, Parameterabstimmung und Beispiele für Entwickler bereit, die diese Bearbeitungen implementieren. Nutzen Sie sie für Transformationen, wobei der Hintergundaustausch aufgrund von Artefaktproblemen vermieden werden sollte.

Schnellinstallation

Claude Code

Empfohlen
Primär
npx skills add digitalsamba/claude-code-video-toolkit -a claude-code
Plugin-BefehlAlternativ
/plugin add https://github.com/digitalsamba/claude-code-video-toolkit
Git CloneAlternativ
git clone https://github.com/digitalsamba/claude-code-video-toolkit.git ~/.claude/skills/qwen-edit

Kopieren Sie diesen Befehl und fügen Sie ihn in Claude Code ein, um diese Fähigkeit zu installieren

Dokumentation

Qwen-Image-Edit Skill

AI-powered image editing using Qwen-Image-Edit-2511 via RunPod serverless.

Status: Evolving - learnings being captured as we experiment

When to Use This Skill

Use when the user wants to:

  • Edit/transform photos while preserving identity
  • Reframe cropped images (fix cut-off heads, etc.)
  • Change clothing, add accessories
  • Change pose (arm positions, hand placement)
  • Apply style transfers (cyberpunk, anime, oil painting)
  • Adjust lighting/color grading
  • Add/remove objects
  • Character transformations (Bond, Neo, etc.)

When NOT to Use

  • Background replacement (single image) - creates cut-out artifacts, halos
  • Face swapping - cannot preserve identity from reference
  • Outpainting - can't extend canvas reliably

Use With Care

  • Multi-image compositing - CAN work with explicit identity anchors (see examples.md for prompt patterns). Requires describing distinctive features (hair texture/color, ethnicity, outfit) and using guidance ~2.0
  • Camera angle changes - Inconsistent results. Vertical angles (low/high) work better than rotational (three-quarter view)

Quick Reference

# Basic edit
python tools/image_edit.py --input photo.jpg --prompt "Add sunglasses"

# With negative prompt (recommended)
python tools/image_edit.py --input photo.jpg \
  --prompt "Reframe as portrait with full head visible" \
  --negative "blur, distortion, artifacts"

# Style transfer
python tools/image_edit.py --input photo.jpg --style cyberpunk

# Background (use cautiously - often fails)
python tools/image_edit.py --input photo.jpg --background office

# Higher quality
python tools/image_edit.py --input photo.jpg --prompt "..." --steps 16 --guidance 3.0

# Multi-image composite (identity-preserving)
python tools/image_edit.py --input person.jpg background.jpg \
  --prompt "The [ethnicity] [gender] with [hair description] from first image is now in [scene] from second image. Same [features], [outfit]." \
  --negative "different ethnicity, different hair color, different face shape, generic stock photo" \
  --steps 16 --guidance 2.0

Key Files

  • prompting.md - Prompt patterns and structure
  • examples.md - Good/bad examples from experiments
  • parameters.md - Tuning steps, guidance, negative prompts

Tool Location

tools/image_edit.py - CLI wrapper for RunPod endpoint

Related Docs

  • docs/qwen-edit-patterns.md - Character transformation patterns
  • .ai_dev/qwen-edit-research.md - Research notes

GitHub Repository

digitalsamba/claude-code-video-toolkit
Pfad: .claude/skills/qwen-edit
0
ai-video-generatorclaude-codedeveloper-toolselevenlabsopen-sourceopenclaw

Verwandte Skills

llamaguard

Andere

LlamaGuard ist Metas 7-8B-Parameter-Modell zur Moderation von LLM-Eingaben und -Ausgaben in sechs Sicherheitskategorien wie Gewalt und Hassrede. Es bietet eine Genauigkeit von 94-95 % und kann mit vLLM, Hugging Face oder Amazon SageMaker eingesetzt werden. Nutzen Sie diese Skill, um Inhaltsfilterung und Sicherheitsguardrails einfach in Ihre KI-Anwendungen zu integrieren.

Skill ansehen

cost-optimization

Andere

Diese Claude Skill unterstützt Entwickler bei der Optimierung von Cloud-Kosten durch Ressourcen-Dimensionierung, Tagging-Strategien und Ausgabenanalysen. Sie bietet einen Rahmen zur Senkung von Cloud-Ausgaben und zur Implementierung von Kosten-Governance für AWS, Azure und GCP. Nutzen Sie sie, wenn Sie Infrastrukturkosten analysieren, Ressourcen richtig dimensionieren oder Budgetvorgaben einhalten müssen.

Skill ansehen

quantizing-models-bitsandbytes

Andere

Diese Fähigkeit quantisiert LLMs auf 8-Bit- oder 4-Bit-Präzision mittels bitsandbytes und erreicht dabei eine Speicherreduzierung von 50–75 % bei minimalem Genauigkeitsverlust. Sie ist ideal für den Betrieb größerer Modelle mit begrenztem GPU-Speicher oder zur Beschleunigung von Inferenzvorgängen und unterstützt Formate wie INT8, NF4 und FP4. Die Fähigkeit integriert sich in HuggingFace Transformers und ermöglicht QLoRA-Training sowie 8-Bit-Optimierer.

Skill ansehen

dispatching-parallel-agents

Andere

Diese Claude-Fähigkeit verteilt mehrere Agenten, um drei oder mehr unabhängige Probleme gleichzeitig zu untersuchen und zu beheben. Sie ist für Szenarien konzipiert, die unabhängige Fehler umfassen, die ohne gemeinsamen Zustand oder Abhängigkeiten gelöst werden können. Die Kernfähigkeit ist die parallele Problemlösung, bei der pro unabhängigem Problembereich ein Agent zugewiesen wird, um die Effizienz zu maximieren.

Skill ansehen