MCP HubMCP Hub
Вернуться к навыкам

qdrant-search-speed-optimization

qdrant
Обновлено 6 days ago
158
18
158
Посмотреть на GitHub
Документацияdata

О программе

Этот навык Claude диагностирует и исправляет проблемы медленной работы поиска в векторных базах данных Qdrant. Он помогает разработчикам устранять типичные неполадки, такие как высокая задержка, низкая пропускная способность и снижение производительности после изменений конфигурации или роста объёма данных. Навык предоставляет диагностические шаги для решения проблем, включая нехватку памяти, сложные запросы и конкурирующие фоновые процессы.

Быстрая установка

Claude Code

Рекомендуется
Основной
npx skills add qdrant/skills -a claude-code
Команда плагинаАльтернативный
/plugin add https://github.com/qdrant/skills
Git клонированиеАльтернативный
git clone https://github.com/qdrant/skills.git ~/.claude/skills/qdrant-search-speed-optimization

Скопируйте и вставьте эту команду в Claude Code для установки этого навыка

Документация

Diagnose a problem

There the multiple possible reasons for search performance degradation. The most common ones are:

  • Memory pressure: if the working set exceeds available RAM
  • Complex requests (e.g. high hnsw_ef, complex filters without payload index)
  • Competing background processes (e.g. optimizer still running after bulk upload)
  • Problem with the cluster (e.g. network issues, hardware degradation)

Single Query Too Slow (Latency)

Use when: individual queries take too long regardless of load.

Diagnostic steps:

  • Check if second run of the same request is significantly faster (indicates memory pressure)
  • Try the same query with with_payload: false and with_vectors: false to see if payload retrieval is the bottleneck
  • If request uses filters, try to remove them one by one to identify if a specific filter condition is the bottleneck

Common fixes:

Can't Handle Enough QPS (Throughput)

Use when: system can't serve enough queries per second under load.

Filtered Search Is Slow

Use when: filtered search is significantly slower than unfiltered. Most common SA complaint after memory.

  • Create payload index on the filtered field Payload index
  • Use is_tenant=true for primary filtering condition: Tenant index
  • Try ACORN algorithm for complex filters: ACORN
  • Avoid using nested filtering conditions as a primary filter. It might force qdrant to read raw payload values instead of using index.
  • If payload index was added after HNSW build, trigger re-index to create filterable subgraph links

Optimize search performance with parallel updates

Diagnostic steps

  • Try to run the same query with indexed_only=true parameter, if the query is significantly faster, it means that the optimizer is still running and has not yet indexed all segments.
  • If CPU or IO usage is high even with no queries, it also indicates that the optimizer is still running.

Recommended configuration changes

  • reduce optimizer_cpu_budget to reserve more CPU for queries
  • Use prevent_unoptimized=true to prevent creating segments with a large amount of unindexed data for searches. Instead, once a segment reaches the so called indexing_threshold, all additional points will be added in ‘deferred state’.

Learn more here

What NOT to Do

  • Set always_ram=false on quantization (disk thrashing on every search)
  • Put HNSW on disk for latency-sensitive production (only for cold storage)
  • Increase segment count for throughput (opposite: fewer = better)
  • Create payload indexes on every field (wastes memory)
  • Blame Qdrant before checking optimizer status

GitHub репозиторий

qdrant/skills
Путь: skills/qdrant-performance-optimization/search-speed-optimization
0
agent-skillsai-agentsclaude-codecodexcursorembeddings

Похожие навыки

railway-docs

Документация

Этот навык получает актуальную документацию Railway, чтобы отвечать на вопросы о функциях, возможностях или конкретных URL-адресах документации. Он гарантирует, что разработчики получают точную и современную информацию напрямую из официальных источников Railway. Используйте его, когда пользователи спрашивают, как работает Railway, или ссылаются на документацию Railway.

Просмотреть навык

n8n-code-python

Документация

Этот навык Claude предоставляет экспертные рекомендации по написанию кода Python в узлах Code платформы n8n, в частности, по использованию стандартной библиотеки Python и работе со специальным синтаксисом n8n, таким как `_input`, `_json` и `_node`. Он помогает разработчикам понять ограничения Python в среде n8n и рекомендует использовать JavaScript для большинства рабочих процессов, предлагая решения на Python для конкретных задач по преобразованию данных.

Просмотреть навык

archon

Документация

Навык Archon предоставляет семантический поиск на основе RAG и управление проектами через REST API. Используйте его для запросов к документации, управления иерархическими проектами/задачами и выполнения поиска информации с возможностью загрузки документов. Всегда в первую очередь обращайтесь к Archon при поиске во внешней документации, прежде чем использовать другие источники.

Просмотреть навык

n8n-code-javascript

Документация

Этот навык Claude предоставляет экспертные рекомендации по написанию кода JavaScript в узлах Code платформы n8n. Он охватывает важный синтаксис, специфичный для n8n, включая переменные `$input`/`$json`, HTTP-хелперы и работу с DateTime, а также помогает в устранении распространённых ошибок. Используйте его при разработке рабочих процессов в n8n, требующих кастомной обработки JavaScript в узлах Code.

Просмотреть навык