スキル一覧に戻る

test-team-coordination

pjt222
更新日 6 days ago
16 閲覧
17
2
17
GitHubで表示
メタaitestingdesign

について

このスキルは、AIチームの連携パターンを検証・比較するためにテストシナリオを実行します。チームの行動を観察し、受け入れ基準を評価し、構造化されたRESULT.mdレポートを自動生成します。開発プロセスにおいて、チームパフォーマンスの検証、連携アプローチの比較、またはパフォーマンスベースラインの確立にご利用ください。

クイックインストール

Claude Code

推奨
メイン
npx skills add pjt222/agent-almanac -a claude-code
プラグインコマンド代替
/plugin add https://github.com/pjt222/agent-almanac
Git クローン代替
git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/test-team-coordination

このコマンドをClaude Codeにコピー&ペーストしてスキルをインストールします

ドキュメント

測隊協

行測場於目隊。察協模為、評納則、計則、生 RESULT.mdtests/results/

  • 驗隊協模生期為→用
  • 改隊定或代後行構測→用
  • 比協模、同場異隊→用
  • 為隊組立基效標→用
  • 加新代或變員後回歸測→用

  • :測場檔路(如 tests/scenarios/teams/test-opaque-team-cartographers-audit.md
  • :行 ID 蓋(默:YYYY-MM-DD-<target>-NNN 自生)
  • :隊大蓋(默:自場前題)
  • :略範變(默:否——若定則注範變)

一:載驗測場

1.1 讀入指之測場檔。

1.2 析 YAML 前題取:

  • target — 待測之隊
  • coordination-pattern — 期模
  • team-size — 員生數
  • 納則表
  • 計則(若有)
  • 真值資(若有)

1.3 驗場檔諸需段:

  • 前況
  • 任(含主任子段)
  • 期為
  • 納則
  • 察議

得:場檔載、析、含諸需段。

敗:檔失或不可析→止以誤訊識失檔或誤段。可選段(則、真值、變)缺→記缺而續。

二:驗前況

2.1 走場諸前況格。

2.2 檔存察用 Glob 驗。

2.3 登數察析 _registry.ymltotal_* 於碟實檔數。

2.4 枝/git 態察行 git status --porcelaingit branch --show-current

得:諸前況滿。

敗:前況敗→記為 BLOCKED 於果。決續(軟前況)或止(硬前況如失目隊檔)。文決。

三:載協模則

3.1 讀 tests/_registry.ymlcoordination_patterns 配場 coordination-pattern 之值。

3.2 取此模 key_behaviors 列。

3.3 此為察清——各於行中察、記察/不察。

得:模要為載、備察。

敗:協模未於登定→用場期為段為唯察源。記警。

四:行任

4.1 建果目:tests/results/YYYY-MM-DD-<target>-NNN/

4.2 記 T0(任始時)。

4.3 自 teams/<target>.md 讀目隊定、取 CONFIG 塊、活隊:呼 TeamCreate 含隊名、生伴用各員之 subagent_type、自 CONFIG tasks 列建任。用場之隊大。傳場任段之主任提原文。

4.4 察隊執相。記時於:

  • T1:形察/任分畢
  • T2:角分顯

4.5 場定範變觸 而 skip-scope-change 為 false:

  • 待至相二(角分)顯
  • 記 T3(範變注時)
  • 經 SendMessage 送範變提於隊
  • 記 T4(範變吸——角調顯)

4.6 續察至隊交出。

  • 記 T5(整始)
  • 記 T6(末報交)

4.7 捕隊全出。

得:隊行任過協模相。諸轉時記。範變(若可)注吸。

敗:隊不生出→記敗點與誤訊。隊滯→記末察相與超時。以部果進評。

五:評模為

5.1 各步三要為定行中是否察:

  • :隊出或協明證
  • :某證而不全或歧
  • 不察:無證

5.2 各場期為段任特為施同評。

5.3 記發於察日。

得:諸或多模特與任特為察。

敗:未察為發、非測程之敗。準記——示協模未全顯。

六:評納則

6.1 走場諸納則。

6.2 各則定:

  • PASS:明滿含可察證
  • PARTIAL:部滿(計閾以 0.5 重)
  • FAIL:有機而未滿
  • BLOCKED:不可評(前況敗、隊超時等)

6.3 場含真值資→驗報發於彼:

  • 各類算準率
  • 標誤正與誤負

6.4 場含計則→各維 1-5 計含簡證。

6.5 算總度:

  • 納:X/N 過(PARTIAL 計 0.5)
  • 閾:>= 場定閾→PASS
  • 則總:X/Y 點(若可)

得:諸納則有定。總度算。

敗:少於半則可評(BLOCKED 過多)→測行不確。文何故並薦修前況後重行。

七:生 RESULT.md

7.1 用場察議之記模建 tests/results/YYYY-MM-DD-<target>-NNN/RESULT.md

7.2 填諸段:

  • 行元(察、時、長)
  • 相日含諸記時
  • 角生日(為適/隊測)
  • 納則果表
  • 則計表(若可)
  • 真值驗表(若可)
  • 要察(敘)

7.3 隊原出含為附或別檔(team-output.md)於同果目。

7.4 加首總判:

**Verdict**: PASS | FAIL | INCONCLUSIVE
**Score**: X/N criteria (Y/Z rubric points)
**Duration**: Xm

得:全 RESULT.md 含諸段填與明判。

敗:果檔不可書→出果至 stdout 為退。評資永不當失。

  • 測場檔載而諸需段在
  • 前況驗(或文為 BLOCKED)
  • 協模要為自登載
  • 隊生而任交
  • 範變注於正時(若可)
  • 諸模特為評(察/部/不察)
  • 諸納則有定(PASS/PARTIAL/FAIL/BLOCKED)
  • 真值驗畢(若可)
  • RESULT.md 生含諸段填
  • 總判算記

  • 評出質非協:此技測隊何協、非任出全否。協善而唯覓 7/9 斷參之隊仍顯模
  • 範變注過早:待至角分明顯乃注範變。過早→隊未分、無可適者
  • 混員出於隊出:不透隊當示合一出。見個員報→為不透之發、非測基患
  • 真值精配:真值數為近。評發於正範、非配精
  • 忘記時:時要為計相長與適速。事生時設、勿後

  • review-codebase — 深碼覆補隊層測
  • review-skill-format — 驗個技式(此技驗隊協)
  • create-team — 建此技測之隊定
  • evolve-team — 依測發演隊定
  • test-a2a-interop — A2A 協合規類測模
  • assess-form — 不透隊長內用之態變評

GitHub リポジトリ

pjt222/agent-almanac
パス: i18n/wenyan-ultra/skills/test-team-coordination
0
agentsagentskillsai-assisted-developmentclaude-codeskillsteams

関連スキル

content-collections

メタ

このスキルは、Content Collections(Markdown/MDXファイルを型安全なデータコレクションに変換するTypeScriptファーストのツール)の本番環境でテストされた設定を提供します。Zodバリデーションによる型安全性を実現し、ブログ、ドキュメントサイト、コンテンツ重視のVite + Reactアプリケーション構築時にご利用ください。Viteプラグインの設定、MDXコンパイルから、デプロイ最適化、スキーマバリデーションまで、すべてを網羅しています。

スキルを見る

polymarket

メタ

このスキルは、開発者がPolymarket予測市場プラットフォームを活用したアプリケーション構築を可能にします。API統合による取引や市場データの取得に加え、WebSocketを介したリアルタイムデータストリーミングにより、ライブ取引や市場活動を監視できます。取引戦略の実装や、ライブ市場更新を処理するツールの作成にご利用ください。

スキルを見る

creating-opencode-plugins

メタ

このスキルは、開発者がコマンド、ファイル、LSP操作など25種類以上のイベントタイプにフックするOpenCodeプラグインを作成することを支援します。JavaScript/TypeScriptモジュール向けに、プラグイン構造、イベントAPI仕様、および実装パターンを提供します。カスタムイベント駆動ロジックでOpenCode AIアシスタントのライフサイクルをインターセプト、監視、または拡張する必要がある場合にご利用ください。

スキルを見る

sglang

メタ

SGLangは、高性能なLLMサービングフレームワークであり、RadixAttentionプレフィックスキャッシュを活用したJSON、正規表現、エージェントワークフロー向けの高速で構造化された生成を特長とします。特にプレフィックスが繰り返されるタスクにおいて、大幅に高速な推論を実現し、複雑な構造化出力やマルチターン対話に最適です。制約付きデコードが必要な場合や、広範なプレフィックス共有を伴うアプリケーションを構築する場合は、vLLMなどの代替案ではなくSGLangを選択してください。

スキルを見る