スキル一覧に戻る

qdrant-scaling-query-volume

qdrant
更新日 5 days ago
158
18
158
GitHubで表示
デザインdesign

について

このClaudeスキルは、大量のクエリボリュームとページネーションを処理するためのQdrant最適化戦略を提供します。特に、ポアソン分布に基づくサブサンプリングを実装することで、複数のシャードにまたがる高リミットクエリのパフォーマンス問題に対処します。シャード化されたQdrantデプロイメントにおいて、スクロールパフォーマンス、大規模な結果セット、または高カーディナリティクエリを扱う際に、このスキルをご利用ください。

クイックインストール

Claude Code

推奨
メイン
npx skills add qdrant/skills -a claude-code
プラグインコマンド代替
/plugin add https://github.com/qdrant/skills
Git クローン代替
git clone https://github.com/qdrant/skills.git ~/.claude/skills/qdrant-scaling-query-volume

このコマンドをClaude Codeにコピー&ペーストしてスキルをインストールします

ドキュメント

Scaling for Query Volume

Problem: When a query has a large limit (e.g. 1000) and there are multiple shards (e.g. 10), naively each shard must return the full 1000 results — totaling 10,000 scored points transferred and merged. This is wasteful since data is randomly distributed across auto-shards.

Core idea

Instead of asking every shard for the full limit, ask each shard for a smaller limit computed via Poisson distribution statistics, then merge. This is safe because auto-sharding guarantees random, independent data distribution.

When it activates

  • More than 1 shard
  • Auto-sharding is in use (all queried shards share the same shard key)
  • The request's limit + offset >= SHARD_QUERY_SUBSAMPLING_LIMIT (128)
  • The query is not exact

Key tradeoff

The strategy trades a small probability of slightly incomplete results for a large reduction in inter-shard data transfer, especially for high-limit queries across many shards. The 1.2x safety factor and the 99.9% Poisson threshold keep the error rate very low — comparable to inaccuracies already introduced by approximate vector indices like HNSW.

GitHub リポジトリ

qdrant/skills
パス: skills/qdrant-scaling/scaling-query-volume
0
agent-skillsai-agentsclaude-codecodexcursorembeddings

関連スキル

executing-plans

デザイン

executing-plansスキルは、完全な実装計画があり、それを管理されたバッチでレビューチェックポイントを設けながら実行する場合に使用します。このスキルは計画を読み込んで批判的にレビューした後、小さなバッチ(デフォルトは3タスク)でタスクを実行し、各バッチの間に進捗状況を報告してアーキテクトのレビューを受けます。これにより、品質管理チェックポイントが組み込まれた体系的な実装が保証されます。

スキルを見る

requesting-code-review

デザイン

このスキルは、コードレビュアーサブエージェントを起動し、処理を進める前に要件に対してコード変更を分析します。タスク完了後、主要な機能の実装後、またはmainブランチへのマージ前などに使用すべきです。このレビューは、現在の実装と元の計画を比較することで、問題を早期に発見するのに役立ちます。

スキルを見る

connect-mcp-server

デザイン

このスキルは、開発者がHTTP、stdio、またはSSEトランスポートを使用してMCPサーバーをClaude Codeに接続するための包括的なガイドを提供します。GitHub、Notion、カスタムAPIなどの外部サービスを統合するためのインストール、設定、認証、セキュリティについて解説しています。MCP統合のセットアップ、外部ツールの設定、またはClaudeのModel Context Protocolを扱う際にご利用ください。

スキルを見る

web-cli-teleport

デザイン

このスキルは、タスク分析に基づいて開発者がClaude Code WebとCLIインターフェースの選択を支援し、これらの環境間でのシームレスなセッションテレポーテーションを可能にします。Web、CLI、モバイル環境を切り替える際のセッション状態とコンテキストを管理することで、ワークフローを最適化します。様々な段階で異なるツールを必要とする複雑なプロジェクトにご活用ください。

スキルを見る