document-rag-pipeline-complete-pipeline-script
Acerca de
Esta habilidad proporciona un script completo en Python para construir un pipeline RAG a partir de documentos PDF, manejando tanto la creación de la base de datos como la funcionalidad de búsqueda. Procesa automáticamente archivos PDF en una carpeta, crea una base de conocimiento consultable y permite realizar consultas a través de una interfaz de línea de comandos. Los desarrolladores deben usarla cuando necesiten una solución lista para ejecutar para la ingesta y recuperación de documentos, en lugar de implementar componentes individuales por separado.
Instalación rápida
Claude Code
Recomendadonpx skills add vamseeachanta/workspace-hub -a claude-code/plugin add https://github.com/vamseeachanta/workspace-hubgit clone https://github.com/vamseeachanta/workspace-hub.git ~/.claude/skills/document-rag-pipeline-complete-pipeline-scriptCopia y pega este comando en Claude Code para instalar esta habilidad
Repositorio GitHub
Habilidades relacionadas
data-mesh-expert
OtroEsta habilidad de Claude proporciona orientación experta sobre la implementación de arquitecturas de malla de datos para sistemas escalables y descentralizados. Ayuda a los desarrolladores a diseñar la propiedad de datos orientada a dominios, crear productos de datos y establecer una gobernanza federada con plataformas de autoservicio. Utilice esta habilidad al planificar o refactorizar infraestructuras de datos a gran escala para alinearlas con los dominios organizacionales.
airflow-expert
OtroEsta Skill de Claude proporciona orquestación de Apache Airflow a nivel experto para diseñar y gestionar pipelines de datos complejos. Ofrece conocimiento profundo de DAGs, operadores, sensores, XComs, dependencias de tareas y programación para construir flujos de trabajo confiables. Úsela al desarrollar, solucionar problemas u optimizar despliegues de Airflow en producción.
airflow-expert
OtroEsta Habilidad Claude ofrece orientación a nivel experto para la orquestación de flujos de trabajo en Apache Airflow, incluyendo el diseño de DAGs, operadores, sensores y dependencias de tareas. Úsela al construir o solucionar problemas en tuberías de datos complejas para implementar patrones confiables de programación y ejecución. Cubre operaciones en producción, XComs y generación dinámica de tareas para una gestión escalable de flujos de trabajo.
databricks-expert
OtroEsta habilidad de Claude proporciona asistencia experta en la plataforma Databricks para diseñar e implementar canalizaciones de datos escalables y flujos de trabajo de aprendizaje automático. Ofrece conocimiento profundo de Apache Spark, Delta Lake, MLflow, cuadernos y gestión de clústeres para arquitectura de lakehouse. Utilice esta habilidad cuando trabaje con Databricks SDK, PySpark, y al construir soluciones de ingeniería de datos o aprendizaje automático en la plataforma Databricks.
