qdrant-scaling-query-volume

qdrant

Actualizado 5 days ago

158

Diseñodesign

Acerca de

Esta habilidad de Claude proporciona estrategias de optimización de Qdrant para manejar grandes volúmenes de consultas y paginación. Aborda específicamente problemas de rendimiento con consultas de límite alto en múltiples shards mediante la implementación de submuestreo basado en distribución de Poisson. Utilice esta habilidad al tratar con rendimiento de desplazamiento, conjuntos de resultados grandes o consultas de alta cardinalidad en despliegues fragmentados de Qdrant.

Instalación rápida

Claude Code

Recomendado

Principal

npx skills add qdrant/skills -a claude-code

Comando PluginAlternativo

/plugin add https://github.com/qdrant/skills

Git CloneAlternativo

git clone https://github.com/qdrant/skills.git ~/.claude/skills/qdrant-scaling-query-volume

Copia y pega este comando en Claude Code para instalar esta habilidad

Documentación

Scaling for Query Volume

Problem: When a query has a large limit (e.g. 1000) and there are multiple shards (e.g. 10), naively each shard must return the full 1000 results — totaling 10,000 scored points transferred and merged. This is wasteful since data is randomly distributed across auto-shards.

Core idea

Instead of asking every shard for the full limit, ask each shard for a smaller limit computed via Poisson distribution statistics, then merge. This is safe because auto-sharding guarantees random, independent data distribution.

When it activates

More than 1 shard
Auto-sharding is in use (all queried shards share the same shard key)
The request's limit + offset >= SHARD_QUERY_SUBSAMPLING_LIMIT (128)
The query is not exact

Key tradeoff

The strategy trades a small probability of slightly incomplete results for a large reduction in inter-shard data transfer, especially for high-limit queries across many shards. The 1.2x safety factor and the 99.9% Poisson threshold keep the error rate very low — comparable to inaccuracies already introduced by approximate vector indices like HNSW.

Repositorio GitHub

qdrant/skills

Ruta: skills/qdrant-scaling/scaling-query-volume

agent-skillsai-agentsclaude-codecodexcursorembeddings

Habilidades relacionadas

executing-plans

Diseño

Utilice la habilidad executing-plans cuando tenga un plan de implementación completo para ejecutar en lotes controlados con puntos de revisión. Esta habilidad carga y revisa críticamente el plan, luego ejecuta tareas en pequeños lotes (por defecto 3 tareas) mientras reporta el progreso entre cada lote para la revisión del arquitecto. Esto asegura una implementación sistemática con puntos de control de calidad integrados.

Ver habilidad

requesting-code-review

Diseño

Esta habilidad despacha un subagente revisor de código para analizar los cambios en el código frente a los requisitos antes de proceder. Debe usarse después de completar tareas, implementar funciones principales o antes de fusionar con la rama principal. La revisión ayuda a detectar problemas de forma temprana al comparar la implementación actual con el plan original.

Ver habilidad

connect-mcp-server

Diseño

Esta habilidad proporciona una guía integral para que los desarrolladores conecten servidores MCP a Claude Code mediante transportes HTTP, stdio o SSE. Cubre la instalación, configuración, autenticación y seguridad para integrar servicios externos como GitHub, Notion y APIs personalizadas. Úsala al configurar integraciones MCP, al configurar herramientas externas o al trabajar con el Protocolo de Contexto del Modelo de Claude.

Ver habilidad

web-cli-teleport

Diseño

Esta habilidad ayuda a los desarrolladores a elegir entre las interfaces web y CLI de Claude Code mediante el análisis de tareas, y luego permite la teletransportación fluida de sesiones entre estos entornos. Optimiza el flujo de trabajo gestionando el estado y el contexto de la sesión al cambiar entre web, CLI o móvil. Úsala para proyectos complejos que requieren diferentes herramientas en varias etapas.

Ver habilidad