chunking-strategy
À propos
Cette compétence met en œuvre des stratégies de découpage optimales de documents pour les systèmes RAG et les bases de données vectorielles, fragmentant les documents volumineux en segments sémantiquement significatifs pour l'incorporation et la recherche. Elle est utilisée lors de la construction de systèmes de génération augmentée par récupération ou de pipelines de traitement pour améliorer les performances de recherche et préserver le contexte. Les capacités clés incluent la fourniture d'un cadre pour la segmentation des documents et l'optimisation du découpage pour une récupération efficace.
Installation rapide
Claude Code
Recommandénpx skills add majiayu000/claude-skill-registry -a claude-code/plugin add https://github.com/majiayu000/claude-skill-registrygit clone https://github.com/majiayu000/claude-skill-registry.git ~/.claude/skills/chunking-strategyCopiez et collez cette commande dans Claude Code pour installer cette compétence
Dépôt GitHub
Compétences associées
chunking-strategy
AutreCette compétence met en œuvre des stratégies de découpage optimal de documents pour les systèmes RAG et les bases de données vectorielles, en divisant les documents volumineux en segments sémantiquement significatifs. Elle est utilisée lors de la construction de pipelines de recherche ou du traitement de documents pour les embeddings et la recherche. Les capacités clés incluent la préservation du contexte pour une récupération efficace et la fourniture d'un cadre pour l'optimisation du traitement documentaire.
when-managing-token-budget-use-token-budget-advisor
MétaCette compétence gère de manière proactive les budgets de jetons en analysant la complexité des tâches et en générant des stratégies de découpage avec des plans d'exécution pour rester dans les limites. Elle est conçue pour être utilisée avant les tâches importantes, lors de l'approche des limites budgétaires, ou après des échecs dus à l'épuisement des jetons. Les capacités clés incluent l'évaluation de l'utilisation, la priorisation du travail et l'optimisation de l'allocation des ressources entre plusieurs agents.
when-managing-token-budget-use-token-budget-advisor
MétaCette compétence gère de manière proactive le budget de tokens de Claude en analysant la complexité des tâches et en générant des stratégies de découpage avec des plans d'exécution pour rester dans les limites. Elle est conçue pour que les développeurs l'utilisent avant des tâches importantes ou lorsqu'ils approchent des contraintes budgétaires, afin d'éviter l'épuisement des tokens. L'outil évalue l'utilisation, priorise le travail et crée des plans optimisés pour les projets multiphases ou la coordination multi-agents.
docling
AutreDocling est une bibliothèque Python pour l'analyse de PDF, DOCX et d'autres formats de documents avec une compréhension avancée de la mise en page. Elle convertit les documents en une représentation structurée et unifiée, idéale pour les pipelines RAG et les flux de travail d'IA. Utilisez-la lorsque vous avez besoin d'extraire du texte propre et des données de mise en page à partir de documents pour une intégration avec LangChain, LlamaIndex ou des serveurs MCP.
