Zurück zu Fähigkeiten

vision

mattnigh
Aktualisiert 4 days ago
3 Ansichten
22
1
22
Auf GitHub ansehen
Dokumentepdf

Über

Die Vision-Fähigkeit verarbeitet Bilder und PDFs, um Aufgaben wie Beschreibung, Zusammenfassung und Analyse basierend auf Nutzeranfragen durchzuführen. Ein Hauptmerkmal ist ihre Fähigkeit, UI-Elemente aus Screenshots oder Dokumenten präzise mit CSS, HTML und JavaScript nachzubilden. Entwickler können sie nutzen, indem sie ein lokales Python-Skript ausführen, das einen Dateipfad und eine Textanfrage als Eingaben verwendet.

Schnellinstallation

Claude Code

Empfohlen
Primär
npx skills add mattnigh/skills_collection -a claude-code
Plugin-BefehlAlternativ
/plugin add https://github.com/mattnigh/skills_collection
Git CloneAlternativ
git clone https://github.com/mattnigh/skills_collection.git ~/.claude/skills/vision

Kopieren Sie diesen Befehl und fügen Sie ihn in Claude Code ein, um diese Fähigkeit zu installieren

GitHub Repository

mattnigh/skills_collection
Pfad: collection/flyingtimes__podcast-using-skill__claude__skills__vision__SKILL.md
0

Verwandte Skills

release-standards

Dokumente

Diese Fähigkeit bietet Richtlinien für semantische Versionierung (semver) und Formatierungsstandards für Changelogs bei Softwareveröffentlichungen. Nutzen Sie sie bei der Vorbereitung von Releases, um Versionsnummern (Major/Minor/Patch) korrekt zu erhöhen und Changelog-Einträge zu strukturieren. Sie enthält Regeln für Pre-Release-Kennzeichnungen und klare Beispiele für Entwickler.

Skill ansehen

commit-standards

Dokumente

Diese Fähigkeit formatiert Git-Commit-Nachrichten gemäß dem Conventional Commits-Standard. Sie stellt Vorlagen und Typdefinitionen (wie `feat`, `fix`, `refactor`) bereit, um Konsistenz beim Schreiben oder Überprüfen von Commits zu gewährleisten. Verwenden Sie sie während des Commit-Prozesses, um eine klare, strukturierte Commit-Historie zu erstellen.

Skill ansehen

huggingface-tokenizers

Dokumente

Diese Fähigkeit bietet eine leistungsstarke Tokenisierung mit HuggingFace's Rust-basierter Bibliothek und verarbeitet 1 GB Text in unter 20 Sekunden. Sie unterstützt BPE-, WordPiece- und Unigram-Algorithmen und ermöglicht das Training benutzerdefinierter Tokenizer sowie die Verfolgung von Ausrichtungen. Nutzen Sie sie, wenn Sie produktionsreife, schnelle Tokenisierung benötigen oder benutzerdefinierte Tokenizer erstellen möchten, die in das Transformers-Ökosystem integriert sind.

Skill ansehen

nano-pdf

Dokumente

nano-pdf ist ein CLI-Tool, das Entwicklern ermöglicht, PDFs mit natürlichen Sprachbefehlen zu bearbeiten, wie etwa Text zu ändern oder Tippfehler auf bestimmten Seiten zu korrigieren. Es ist ideal für schnelle, programmatische PDF-Modifikationen direkt vom Terminal aus. Überprüfen Sie stets die Ausgabe, da die Seitennummerierung zwischen Versionen variieren kann.

Skill ansehen