eval-driven-dev
について
このスキルは、Python LLMアプリケーションのための完全な評価主導開発パイプラインを提供し、開発者がコードを計装し、テストデータセットを構築し、評価を実行して退行を検出し、問題をデバッグできるようにします。プロンプトやエージェントの動作が変更された際に、評価ベースのテストの作成から失敗の根本原因分析に至るまでの完全なテストサイクルを自動的に処理します。LLMを呼び出すPythonプロジェクトの開発、テスト、ベンチマークを行う際には常にこれを使用し、出力品質を確保し、退行を防止してください。
クイックインストール
Claude Code
推奨npx skills add github/awesome-copilot -a claude-code/plugin add https://github.com/github/awesome-copilotgit clone https://github.com/github/awesome-copilot.git ~/.claude/skills/eval-driven-devこのコマンドをClaude Codeにコピー&ペーストしてスキルをインストールします
GitHub リポジトリ
関連スキル
content-collections
メタこのスキルは、Content Collections(Markdown/MDXファイルを型安全なデータコレクションに変換するTypeScriptファーストのツール)の本番環境でテストされた設定を提供します。Zodバリデーションによる型安全性を実現し、ブログ、ドキュメントサイト、コンテンツ重視のVite + Reactアプリケーション構築時にご利用ください。Viteプラグインの設定、MDXコンパイルから、デプロイ最適化、スキーマバリデーションまで、すべてを網羅しています。
polymarket
メタこのスキルは、開発者がPolymarket予測市場プラットフォームを活用したアプリケーション構築を可能にします。API統合による取引や市場データの取得に加え、WebSocketを介したリアルタイムデータストリーミングにより、ライブ取引や市場活動を監視できます。取引戦略の実装や、ライブ市場更新を処理するツールの作成にご利用ください。
creating-opencode-plugins
メタこのスキルは、開発者がコマンド、ファイル、LSP操作など25種類以上のイベントタイプにフックするOpenCodeプラグインを作成することを支援します。JavaScript/TypeScriptモジュール向けに、プラグイン構造、イベントAPI仕様、および実装パターンを提供します。カスタムイベント駆動ロジックでOpenCode AIアシスタントのライフサイクルをインターセプト、監視、または拡張する必要がある場合にご利用ください。
sglang
メタSGLangは、高性能なLLMサービングフレームワークであり、RadixAttentionプレフィックスキャッシュを活用したJSON、正規表現、エージェントワークフロー向けの高速で構造化された生成を特長とします。特にプレフィックスが繰り返されるタスクにおいて、大幅に高速な推論を実現し、複雑な構造化出力やマルチターン対話に最適です。制約付きデコードが必要な場合や、広範なプレフィックス共有を伴うアプリケーションを構築する場合は、vLLMなどの代替案ではなくSGLangを選択してください。
