SKILL·D4003B

pdf-extraction

Name: pdf-extraction
Author: openclaw

openclaw

Mis à jour 1 month ago

17 vues

972

296

972

Voir sur GitHub

Documentspdfextractionpdfplumbertablestext

À propos

Cette compétence extrait des données structurées de PDF en utilisant pdfplumber, permettant une extraction précise du texte, des tableaux et des métadonnées avec un positionnement au niveau des caractères. Elle est idéale pour les développeurs ayant besoin de traiter programmatiquement des documents PDF pour l'analyse de données ou la migration de contenu. La compétence gère les mises en page complexes et offre des capacités de débogage visuel dépassant celles des lecteurs PDF basiques.

Installation rapide

Claude Code

Recommandé

Principal

npx skills add openclaw/skills -a claude-code

Commande PluginAlternatif

/plugin add https://github.com/openclaw/skills

Git CloneAlternatif

git clone https://github.com/openclaw/skills.git ~/.claude/skills/pdf-extraction

Copiez et collez cette commande dans Claude Code pour installer cette compétence

Dépôt GitHub

openclaw/skills

Chemin: skills/lijie420461340/pdf-extraction

archivebackupclawdbotclawdhubskill

FAQ

Frequently asked questions

What is the pdf-extraction skill?

pdf-extraction is a Claude Skill by openclaw. Skills package instructions and resources that Claude loads on demand, so Claude can perform pdf-extraction-related tasks without extra prompting.

How do I install pdf-extraction?

Use the install commands on this page: add pdf-extraction to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does pdf-extraction belong to?

pdf-extraction is in the Documents category, tagged pdf, extraction, pdfplumber, tables and text.

Is pdf-extraction free to use?

Yes. pdf-extraction is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.

Compétences associées

release-standards

Documents

Cette compétence fournit des directives de gestion sémantique de version (semver) et des normes de formatage de journal des modifications pour les publications logicielles. Utilisez-la lors de la préparation des versions pour incrémenter correctement les numéros de version (majeure/mineure/corrective) et structurer les entrées du journal des modifications. Elle inclut des règles pour les identifiants de pré-version et des exemples clairs pour les développeurs.

Voir la compétence

commit-standards

Documents

Cette compétence formate les messages de commit Git selon la norme Conventional Commits. Elle fournit des modèles et des définitions de types (comme `feat`, `fix`, `refactor`) pour garantir la cohérence lors de la rédaction ou de la revue des commits. Utilisez-la pendant le processus de commit pour créer un historique de commits clair et structuré.

Voir la compétence

huggingface-tokenizers

Documents

Cette compétence offre une tokenisation haute performance en utilisant la bibliothèque basée sur Rust de HuggingFace, traitant 1 Go de texte en moins de 20 secondes. Elle prend en charge les algorithmes BPE, WordPiece et Unigram, tout en permettant l'entraînement de tokeniseurs personnalisés et le suivi des alignements. Utilisez-la lorsque vous avez besoin d'une tokenisation rapide pour la production ou pour créer des tokeniseurs personnalisés intégrés à l'écosystème transformers.

Voir la compétence

nano-pdf

Documents

nano-pdf est un outil CLI qui permet aux développeurs de modifier des PDF à l'aide d'instructions en langage naturel, comme changer du texte ou corriger des fautes de frappe sur des pages spécifiques. Il est idéal pour des modifications rapides et programmatiques de PDF directement depuis le terminal. Vérifiez toujours le résultat, car la numérotation des pages peut varier entre les versions.

Voir la compétence