MCP HubMCP Hub
Retour aux compétences

chunking-strategy

majiayu000
Mis à jour 7 days ago
9 vues
58
9
58
Voir sur GitHub
Autreragchunkingvector-searchembeddingsdocument-processing

À propos

Cette compétence met en œuvre des stratégies de découpage optimales de documents pour les systèmes RAG et les bases de données vectorielles, fragmentant les documents volumineux en segments sémantiquement significatifs pour l'incorporation et la recherche. Elle est utilisée lors de la construction de systèmes de génération augmentée par récupération ou de pipelines de traitement pour améliorer les performances de recherche et préserver le contexte. Les capacités clés incluent la fourniture d'un cadre pour la segmentation des documents et l'optimisation du découpage pour une récupération efficace.

Installation rapide

Claude Code

Recommandé
Principal
npx skills add majiayu000/claude-skill-registry -a claude-code
Commande PluginAlternatif
/plugin add https://github.com/majiayu000/claude-skill-registry
Git CloneAlternatif
git clone https://github.com/majiayu000/claude-skill-registry.git ~/.claude/skills/chunking-strategy

Copiez et collez cette commande dans Claude Code pour installer cette compétence

Dépôt GitHub

majiayu000/claude-skill-registry
Chemin: skills/data/chunking-strategy
0

Compétences associées

chunking-strategy

Autre

Cette compétence met en œuvre des stratégies de découpage optimal de documents pour les systèmes RAG et les bases de données vectorielles, en divisant les documents volumineux en segments sémantiquement significatifs. Elle est utilisée lors de la construction de pipelines de recherche ou du traitement de documents pour les embeddings et la recherche. Les capacités clés incluent la préservation du contexte pour une récupération efficace et la fourniture d'un cadre pour l'optimisation du traitement documentaire.

Voir la compétence

when-managing-token-budget-use-token-budget-advisor

Méta

Cette compétence gère de manière proactive les budgets de jetons en analysant la complexité des tâches et en générant des stratégies de découpage avec des plans d'exécution pour rester dans les limites. Elle est conçue pour être utilisée avant les tâches importantes, lors de l'approche des limites budgétaires, ou après des échecs dus à l'épuisement des jetons. Les capacités clés incluent l'évaluation de l'utilisation, la priorisation du travail et l'optimisation de l'allocation des ressources entre plusieurs agents.

Voir la compétence

when-managing-token-budget-use-token-budget-advisor

Méta

Cette compétence gère de manière proactive le budget de tokens de Claude en analysant la complexité des tâches et en générant des stratégies de découpage avec des plans d'exécution pour rester dans les limites. Elle est conçue pour que les développeurs l'utilisent avant des tâches importantes ou lorsqu'ils approchent des contraintes budgétaires, afin d'éviter l'épuisement des tokens. L'outil évalue l'utilisation, priorise le travail et crée des plans optimisés pour les projets multiphases ou la coordination multi-agents.

Voir la compétence

docling

Autre

Docling est une bibliothèque Python pour l'analyse de PDF, DOCX et d'autres formats de documents avec une compréhension avancée de la mise en page. Elle convertit les documents en une représentation structurée et unifiée, idéale pour les pipelines RAG et les flux de travail d'IA. Utilisez-la lorsque vous avez besoin d'extraire du texte propre et des données de mise en page à partir de documents pour une intégration avec LangChain, LlamaIndex ou des serveurs MCP.

Voir la compétence