qdrant-scaling
Acerca de
Esta habilidad ayuda a los desarrolladores a tomar decisiones de escalado de Qdrant para necesidades de volumen de datos, rendimiento de consultas, latencia o volumen de consultas. Proporciona orientación sobre cómo elegir entre escalado vertical/horizontal, estrategias de fragmentación y planificación de capacidad. Úsela cuando enfrente problemas de rendimiento del clúster, limitaciones de capacidad o arquitecturas multiinquilino.
Instalación rápida
Claude Code
Recomendadonpx skills add qdrant/skills -a claude-code/plugin add https://github.com/qdrant/skillsgit clone https://github.com/qdrant/skills.git ~/.claude/skills/qdrant-scalingCopia y pega este comando en Claude Code para instalar esta habilidad
Documentación
Qdrant Scaling
First determine what you're scaling for:
- data volume
- query throughput (QPS)
- query latency
- query volume
After determining the scaling goal, we can choose scaling strategy based on tradeoffs and assumptions. Each pulls toward different strategies. Scaling for throughput and latency are opposite tuning directions.
Scaling Data Volume
This becomes relevant when volume of the dataset exceeds the capacity of a single node. Read more about scaling for data volume in Scaling Data Volume
Scaling for Query Throughput
If your system needs to handle more parallel queries than a single node can handle, then you need to scale for query throughput.
Read more about scaling for query throughput in Scaling for Query Throughput
Scaling for Query Latency
Latency of a single query is determined by the slowest component in the query execution path. It is in sometimes correlated with throughput, but not always. It might require different strategies for scaling.
Read more about scaling for query latency in Scaling for Query Latency
Scaling for Query Volume
By query volume we understand the amount of results that a single query returns. If the query volume is too high, it can cause performance issues and increase latency.
Tuning for query volume is opposite might require special strategies.
Read more about scaling for query volume in Scaling for Query Volume
Repositorio GitHub
Habilidades relacionadas
executing-plans
DiseñoUtilice la habilidad executing-plans cuando tenga un plan de implementación completo para ejecutar en lotes controlados con puntos de revisión. Esta habilidad carga y revisa críticamente el plan, luego ejecuta tareas en pequeños lotes (por defecto 3 tareas) mientras reporta el progreso entre cada lote para la revisión del arquitecto. Esto asegura una implementación sistemática con puntos de control de calidad integrados.
requesting-code-review
DiseñoEsta habilidad despacha un subagente revisor de código para analizar los cambios en el código frente a los requisitos antes de proceder. Debe usarse después de completar tareas, implementar funciones principales o antes de fusionar con la rama principal. La revisión ayuda a detectar problemas de forma temprana al comparar la implementación actual con el plan original.
connect-mcp-server
DiseñoEsta habilidad proporciona una guía integral para que los desarrolladores conecten servidores MCP a Claude Code mediante transportes HTTP, stdio o SSE. Cubre la instalación, configuración, autenticación y seguridad para integrar servicios externos como GitHub, Notion y APIs personalizadas. Úsala al configurar integraciones MCP, al configurar herramientas externas o al trabajar con el Protocolo de Contexto del Modelo de Claude.
web-cli-teleport
DiseñoEsta habilidad ayuda a los desarrolladores a elegir entre las interfaces web y CLI de Claude Code mediante el análisis de tareas, y luego permite la teletransportación fluida de sesiones entre estos entornos. Optimiza el flujo de trabajo gestionando el estado y el contexto de la sesión al cambiar entre web, CLI o móvil. Úsala para proyectos complejos que requieren diferentes herramientas en varias etapas.
