learn-datalake
Acerca de
La habilidad `learn-datalake` es un orquestador continuo que monitorea un directorio, procesa nuevos PDFs mediante bucles de revisión de calidad e ingiere otros tipos de archivos en la memoria de grafo. Extrae y vincula automáticamente controles de marcos de trabajo (como NIST o ATT&CK) del contenido de los PDF, permitiendo búsqueda semántica y recorrido de múltiples saltos. Utilice esta habilidad para construir automáticamente un grafo de conocimiento consultable a partir de una carpeta vigilada de documentos y activos.
Instalación rápida
Claude Code
Recomendadonpx skills add grahama1970/agent-skills -a claude-code/plugin add https://github.com/grahama1970/agent-skillsgit clone https://github.com/grahama1970/agent-skills.git ~/.claude/skills/learn-datalakeCopia y pega este comando en Claude Code para instalar esta habilidad
Repositorio GitHub
Habilidades relacionadas
release-standards
DocumentosEsta habilidad proporciona pautas de versionado semántico (semver) y estándares de formato para el changelog en lanzamientos de software. Úsela al preparar lanzamientos para incrementar correctamente los números de versión (principal/secundario/parche) y estructurar las entradas del changelog. Incluye reglas para identificadores de pre-lanzamiento y ejemplos claros para desarrolladores.
commit-standards
DocumentosEsta habilidad formatea los mensajes de commit de Git según el estándar Conventional Commits. Proporciona plantillas y definiciones de tipos (como `feat`, `fix`, `refactor`) para garantizar consistencia al escribir o revisar commits. Úsala durante el proceso de commit para crear un historial de commits claro y estructurado.
huggingface-tokenizers
DocumentosEsta habilidad proporciona tokenización de alto rendimiento utilizando la biblioteca basada en Rust de HuggingFace, procesando 1GB de texto en menos de 20 segundos. Soporta algoritmos BPE, WordPiece y Unigram, además de permitir el entrenamiento de tokenizadores personalizados y el seguimiento de alineaciones. Úsela cuando necesite tokenización rápida para producción o para construir tokenizadores personalizados integrados en el ecosistema de transformers.
nano-pdf
Documentosnano-pdf es una herramienta CLI que permite a los desarrolladores editar PDFs usando instrucciones en lenguaje natural, como cambiar texto o corregir errores tipográficos en páginas específicas. Es ideal para modificaciones rápidas y programáticas de PDFs directamente desde la terminal. Siempre verifica la salida, ya que la numeración de páginas puede variar entre versiones.
