learn-datalake
À propos
La compétence `learn-datalake` est un orchestrateur continu qui surveille un répertoire, traite les nouveaux PDF via des boucles de contrôle qualité et ingère d'autres types de fichiers dans la mémoire en graphe. Elle extrait et lie automatiquement les contrôles de cadres (comme NIST ou ATT&CK) à partir du contenu des PDF, permettant une recherche sémantique et une traversée à sauts multiples. Utilisez cette compétence pour construire automatiquement un graphe de connaissances interrogeable à partir d'un dossier surveillé contenant des documents et des actifs.
Installation rapide
Claude Code
Recommandénpx skills add grahama1970/agent-skills -a claude-code/plugin add https://github.com/grahama1970/agent-skillsgit clone https://github.com/grahama1970/agent-skills.git ~/.claude/skills/learn-datalakeCopiez et collez cette commande dans Claude Code pour installer cette compétence
Dépôt GitHub
Compétences associées
release-standards
DocumentsCette compétence fournit des directives de gestion sémantique de version (semver) et des normes de formatage de journal des modifications pour les publications logicielles. Utilisez-la lors de la préparation des versions pour incrémenter correctement les numéros de version (majeure/mineure/corrective) et structurer les entrées du journal des modifications. Elle inclut des règles pour les identifiants de pré-version et des exemples clairs pour les développeurs.
commit-standards
DocumentsCette compétence formate les messages de commit Git selon la norme Conventional Commits. Elle fournit des modèles et des définitions de types (comme `feat`, `fix`, `refactor`) pour garantir la cohérence lors de la rédaction ou de la revue des commits. Utilisez-la pendant le processus de commit pour créer un historique de commits clair et structuré.
huggingface-tokenizers
DocumentsCette compétence offre une tokenisation haute performance en utilisant la bibliothèque basée sur Rust de HuggingFace, traitant 1 Go de texte en moins de 20 secondes. Elle prend en charge les algorithmes BPE, WordPiece et Unigram, tout en permettant l'entraînement de tokeniseurs personnalisés et le suivi des alignements. Utilisez-la lorsque vous avez besoin d'une tokenisation rapide pour la production ou pour créer des tokeniseurs personnalisés intégrés à l'écosystème transformers.
nano-pdf
Documentsnano-pdf est un outil CLI qui permet aux développeurs de modifier des PDF à l'aide d'instructions en langage naturel, comme changer du texte ou corriger des fautes de frappe sur des pages spécifiques. Il est idéal pour des modifications rapides et programmatiques de PDF directement depuis le terminal. Vérifiez toujours le résultat, car la numérotation des pages peut varier entre les versions.
