スキル一覧に戻る

ai-product-evaluation-design

majiayu000
更新日 14 days ago
17 閲覧
58
9
58
GitHubで表示
メタaidesign

について

このスキルは、従来のPRDを「Evals」に置き換える枠組みを提供し、AIモデルの正しい動作を体系的に定義・測定します。プロトタイプから本番環境への開発を導くために、3層の評価システム(決定論的評価、ヒューリスティック評価、LLM-as-a-Judge評価)を導入しています。AI機能の立ち上げ時や、予測不能なモデル出力のデバッグ時に活用し、信頼性の高いパフォーマンスへと段階的に改善を進めることができます。

クイックインストール

Claude Code

推奨
メイン
npx skills add majiayu000/claude-skill-registry -a claude-code
プラグインコマンド代替
/plugin add https://github.com/majiayu000/claude-skill-registry
Git クローン代替
git clone https://github.com/majiayu000/claude-skill-registry.git ~/.claude/skills/ai-product-evaluation-design

このコマンドをClaude Codeにコピー&ペーストしてスキルをインストールします

GitHub リポジトリ

majiayu000/claude-skill-registry
パス: skills/data/ai-product-evaluation-design
0

関連スキル

content-collections

メタ

このスキルは、Content Collections(Markdown/MDXファイルを型安全なデータコレクションに変換するTypeScriptファーストのツール)の本番環境でテストされた設定を提供します。Zodバリデーションによる型安全性を実現し、ブログ、ドキュメントサイト、コンテンツ重視のVite + Reactアプリケーション構築時にご利用ください。Viteプラグインの設定、MDXコンパイルから、デプロイ最適化、スキーマバリデーションまで、すべてを網羅しています。

スキルを見る

polymarket

メタ

このスキルは、開発者がPolymarket予測市場プラットフォームを活用したアプリケーション構築を可能にします。API統合による取引や市場データの取得に加え、WebSocketを介したリアルタイムデータストリーミングにより、ライブ取引や市場活動を監視できます。取引戦略の実装や、ライブ市場更新を処理するツールの作成にご利用ください。

スキルを見る

creating-opencode-plugins

メタ

このスキルは、開発者がコマンド、ファイル、LSP操作など25種類以上のイベントタイプにフックするOpenCodeプラグインを作成することを支援します。JavaScript/TypeScriptモジュール向けに、プラグイン構造、イベントAPI仕様、および実装パターンを提供します。カスタムイベント駆動ロジックでOpenCode AIアシスタントのライフサイクルをインターセプト、監視、または拡張する必要がある場合にご利用ください。

スキルを見る

sglang

メタ

SGLangは、高性能なLLMサービングフレームワークであり、RadixAttentionプレフィックスキャッシュを活用したJSON、正規表現、エージェントワークフロー向けの高速で構造化された生成を特長とします。特にプレフィックスが繰り返されるタスクにおいて、大幅に高速な推論を実現し、複雑な構造化出力やマルチターン対話に最適です。制約付きデコードが必要な場合や、広範なプレフィックス共有を伴うアプリケーションを構築する場合は、vLLMなどの代替案ではなくSGLangを選択してください。

スキルを見る