Zurück zu Fähigkeiten

c-screen

daxaur
Aktualisiert 2 days ago
1 Ansichten
143
6
143
Auf GitHub ansehen
Designscreenshotocrwebcampeekaboocamsnapvision

Über

Die c-screen-Fähigkeit ermöglicht es Claude, Screenshots mit OCR-Texterkennung aufzunehmen und Webcam-Bilder für visuelle Analysen zu erfassen. Sie bietet Werkzeuge für Vollbild-/Bereichs-Screenshots, Fensteraufnahmen und sofortige OCR-Verarbeitung. Nutzen Sie diese Fähigkeit, wenn Sie Bildschirminhalte oder Kameraeingaben programmgestützt in Ihren Anwendungen analysieren müssen.

Schnellinstallation

Claude Code

Empfohlen
Primär
npx skills add daxaur/openpaw -a claude-code
Plugin-BefehlAlternativ
/plugin add https://github.com/daxaur/openpaw
Git CloneAlternativ
git clone https://github.com/daxaur/openpaw.git ~/.claude/skills/c-screen

Kopieren Sie diesen Befehl und fügen Sie ihn in Claude Code ein, um diese Fähigkeit zu installieren

Dokumentation

What This Skill Does

Enables Claude to take screenshots, extract text from the screen via OCR, and capture webcam images for visual analysis using peekaboo and camsnap.

Available CLI Tools

peekaboo — Screenshots & OCR

# Take a full screenshot and save to file
peekaboo screenshot --output ~/Desktop/screen.png

# Take screenshot and extract all text via OCR
peekaboo ocr

# OCR a specific region (x, y, width, height)
peekaboo ocr --region 0,0,1280,720

# Screenshot a specific window by app name
peekaboo screenshot --app "Safari" --output window.png

# Screenshot and pipe to stdout for immediate analysis
peekaboo screenshot --stdout

camsnap — Webcam Capture

# Capture a single webcam frame
camsnap --output ~/Desktop/photo.jpg

# Capture with a specific camera device
camsnap --device 0 --output shot.jpg

# Capture and print file path
camsnap --output /tmp/cam.jpg && echo "Saved"

Usage Guidelines

  • Use peekaboo ocr when the user wants text extracted from the screen
  • Use camsnap only when the user explicitly wants a webcam image
  • After capturing, read the image file to analyze its contents visually

Notes

  • macOS screen recording permission required for peekaboo
  • Camera permission required for camsnap
  • OCR accuracy depends on font size and screen resolution

GitHub Repository

daxaur/openpaw
Pfad: skills/c-screen
0
ai-agentanthropicautomationclaudeclaude-codecli

Verwandte Skills

executing-plans

Design

Verwenden Sie die Fähigkeit "executing-plans", wenn Sie einen vollständigen Implementierungsplan zur Ausführung in kontrollierten Batches mit Überprüfungspunkten vorliegen haben. Sie lädt den Plan und überprüft ihn kritisch, führt dann Aufgaben in kleinen Batches (standardmäßig 3 Aufgaben) aus und meldet den Fortschritt zwischen jedem Batch zur Überprüfung durch den Architekten. Dies gewährleistet eine systematische Implementierung mit integrierten Qualitätskontrollpunkten.

Skill ansehen

requesting-code-review

Design

Diese Fähigkeit sendet einen Unteragenten für Code-Review, um Codeänderungen anhand der Anforderungen zu analysieren, bevor fortgefahren wird. Sie sollte nach dem Abschließen von Aufgaben, der Implementierung größerer Funktionen oder vor dem Zusammenführen in den Hauptzweig verwendet werden. Die Überprüfung hilft dabei, Probleme frühzeitig zu erkennen, indem die aktuelle Implementierung mit dem ursprünglichen Plan verglichen wird.

Skill ansehen

connect-mcp-server

Design

Diese Fähigkeit bietet Entwicklern eine umfassende Anleitung, um MCP-Server über HTTP-, stdio- oder SSE-Transports mit Claude Code zu verbinden. Sie behandelt Installation, Konfiguration, Authentifizierung und Sicherheit für die Integration externer Dienste wie GitHub, Notion und benutzerdefinierter APIs. Nutzen Sie sie beim Einrichten von MCP-Integrationen, bei der Konfiguration externer Tools oder bei der Arbeit mit Claude's Model Context Protocol.

Skill ansehen

web-cli-teleport

Design

Diese Fähigkeit unterstützt Entwickler bei der Wahl zwischen Claude Code Web- und CLI-Schnittstellen basierend auf Aufgabenanalysen und ermöglicht nahtloses Session-Teleporting zwischen diesen Umgebungen. Sie optimiert den Workflow, indem sie den Sitzungsstatus und Kontext beim Wechsel zwischen Web, CLI oder Mobilgeräten verwaltet. Nutzen Sie sie für komplexe Projekte, die in verschiedenen Phasen unterschiedliche Werkzeuge erfordern.

Skill ansehen