qdrant-deployment-options
À propos
Cette compétence aide les développeurs à choisir la bonne option de déploiement Qdrant en comparant le mode local, Docker, Qdrant Cloud et Qdrant EDGE. Elle guide les décisions en fonction des besoins tels que le prototypage, la mise à l'échelle en production, les opérations managées ou la latence la plus faible. Utilisez-la lors du choix entre des déploiements auto-hébergés et cloud pour un nouveau projet.
Installation rapide
Claude Code
Recommandénpx skills add qdrant/skills -a claude-code/plugin add https://github.com/qdrant/skillsgit clone https://github.com/qdrant/skills.git ~/.claude/skills/qdrant-deployment-optionsCopiez et collez cette commande dans Claude Code pour installer cette compétence
Documentation
Which Qdrant Deployment Do I Need?
Start with what you need: managed ops or full control? Network latency acceptable or not? Production or prototyping? The answer narrows to one of four options.
Getting Started or Prototyping
Use when: building a prototype, running tests, CI/CD pipelines, or learning Qdrant.
- Use local mode (Python only): zero-dependency, in-memory or disk-persisted, no server needed Local mode
- Local mode data format is NOT compatible with server. Do not use for production or benchmarking.
- For a real server locally, use Docker Quick start
Going to Production (Self-Hosted)
Use when: you need full control over infrastructure, data residency, or custom configuration.
- Docker is the default deployment. Full Qdrant Open Source feature set, minimal setup. Quick start
- You own operations: upgrades, backups, scaling, monitoring
- Must set up distributed mode manually for multi-node clusters Distributed deployment
- Consider Hybrid Cloud if you want Qdrant Cloud management on your infrastructure Hybrid Cloud
Going to Production (Zero-Ops)
Use when: you want managed infrastructure with zero-downtime updates, automatic backups, and resharding without operating clusters yourself.
- Qdrant Cloud handles upgrades, scaling, backups, and monitoring Qdrant Cloud
- Supports multi-version upgrades automatically
- Provides features not available in self-hosted:
/sys_metrics, managed resharding, pre-configured alerts
Need Lowest Possible Latency
Use when: network round-trip to a server is unacceptable. Edge devices, in-process search, or latency-critical applications.
- Qdrant EDGE: in-process bindings to Qdrant shard-level functions, no network overhead Qdrant EDGE
- Same data format as server. Can sync with server via shard snapshots.
- Single-node feature set only. No distributed mode.
What NOT to Do
- Use local mode for production or benchmarking (not optimized, incompatible data format)
- Self-host without monitoring and backup strategy (you will lose data or miss outages)
- Choose EDGE when you need distributed search (single-node only)
- Pick Hybrid Cloud unless you have data residency requirements (unnecessary Kubernetes complexity when Qdrant Cloud works)
Dépôt GitHub
Compétences associées
executing-plans
DesignUtilisez la compétence executing-plans lorsque vous disposez d'un plan de mise en œuvre complet à exécuter par lots contrôlés avec des points de contrôle de revue. Elle charge et examine le plan de manière critique, puis exécute les tâches par petits lots (3 tâches par défaut) tout en rapportant la progression entre chaque lot pour une revue par l'architecte. Cela garantit une mise en œuvre systématique avec des points de contrôle de qualité intégrés.
requesting-code-review
DesignCette compétence délègue un sous-agent réviseur de code pour analyser les modifications apportées au code par rapport aux exigences avant de poursuivre. Elle doit être utilisée après avoir terminé des tâches, implémenté des fonctionnalités majeures, ou avant une fusion vers la branche principale. La revue aide à détecter précocement les problèmes en comparant l'implémentation actuelle avec le plan initial.
connect-mcp-server
DesignCette compétence fournit un guide complet permettant aux développeurs de connecter des serveurs MCP à Claude Code via les transports HTTP, stdio ou SSE. Elle couvre l'installation, la configuration, l'authentification et la sécurité pour intégrer des services externes tels que GitHub, Notion et des API personnalisées. Utilisez-la lors de la configuration d'intégrations MCP, de la configuration d'outils externes ou du travail avec le Protocole de Contexte de Modèle de Claude.
web-cli-teleport
DesignCette compétence aide les développeurs à choisir entre les interfaces Web et CLI de Claude Code en fonction de l'analyse des tâches, puis permet une téléportation transparente des sessions entre ces environnements. Elle optimise le flux de travail en gérant l'état et le contexte de la session lors du passage entre le web, la CLI ou le mobile. Utilisez-la pour des projets complexes nécessitant différents outils à diverses étapes.
