SKILL·4C0D0B

test-team-coordination

Name: test-team-coordination
Author: pjt222

pjt222

업데이트됨 1 month ago

9 조회

테스팅testingdesign

정보

이 스킬은 팀에 대해 테스트 시나리오를 실행하고, 협업 패턴과 행동을 관찰하며, 수용 기준을 평가하여 구조화된 RESULT.md 파일을 생성합니다. 이를 통해 현실적인 작업 중에 팀의 협업 패턴이 기대되는 행동을 보이는지 검증하거나, 동등한 작업 부하에서 패턴을 비교하거나, 팀 구성에 대한 기준 성능 지표를 설정하는 데 사용할 수 있습니다. 고급 시나리오에서 팀 협업을 테스트하고 검토하기 위해 설계되었습니다.

빠른 설치

Claude Code

문서

Team-Koordination testen

Ein Testszenario aus tests/scenarios/teams/ gegen das Zielteam ausfuehren. Koordinationsmuster-Verhaltensweisen beobachten, Akzeptanzkriterien bewerten, das Rubrik-Ergebnis ermitteln und eine RESULT.md in tests/results/ erzeugen.

Wann verwenden

Validierung, dass das Koordinationsmuster eines Teams erwartete Verhaltensweisen zeigt
Ausfuehren eines strukturierten Tests nach Aenderung einer Team-Definition oder eines Agents
Vergleich von Koordinationsmustern durch Ausfuehren desselben Szenarios mit verschiedenen Teams
Einrichten von Basislinie-Leistungsmetriken fuer eine Teamzusammensetzung
Regressions-Tests nach Hinzufuegen neuer Agents oder Aenderung der Team-Mitgliedschaft

Eingaben

Erforderlich: Pfad zur Testszenario-Datei (z. B. tests/scenarios/teams/test-opaque-team-cartographers-audit.md)
Optional: Ausfuehrungs-ID-Ueberschreibung (Standard: YYYY-MM-DD-<target>-NNN automatisch generiert)
Optional: Team-Groessen-Ueberschreibung (Standard: aus Szenario-Frontmatter)
Optional: Umfangsaenderung ueberspringen (Standard: false — Umfangsaenderung injizieren wenn definiert)

Vorgehensweise

Schritt 1: Testszenario laden und validieren

1.1. Die im Input angegebene Testszenario-Datei lesen.

1.2. YAML-Frontmatter parsen und extrahieren:

target — das zu testende Team
coordination-pattern — das erwartete Muster
team-size — Anzahl der zu startenden Mitglieder
Akzeptanzkriterien-Tabelle
Bewertungsrubrik (falls vorhanden)
Ground-Truth-Daten (falls vorhanden)

1.3. Verifizieren, dass die Szenario-Datei alle erforderlichen Abschnitte hat:

Objective (Ziel)
Pre-conditions (Vorbedingungen)
Task (mit Primary-Task-Unterabschnitt)
Expected Behaviors (Erwartete Verhaltensweisen)
Acceptance Criteria (Akzeptanzkriterien)
Observation Protocol (Beobachtungsprotokoll)

Erwartet: Szenario-Datei laed, wird geparst und enthaelt alle erforderlichen Abschnitte.

Bei Fehler: Wenn die Datei fehlt oder nicht parsebar ist, mit einer Fehlermeldung abbrechen, die die fehlende Datei oder den fehlerhaften Abschnitt identifiziert. Wenn optionale Abschnitte (Rubrik, Ground Truth, Varianten) fehlen, deren Fehlen vermerken und fortfahren.

Schritt 2: Vorbedingungen verifizieren

2.1. Jede Vorbedingungs-Checkbox im Szenario durchgehen.

2.2. Fuer Datei-Existenz-Pruefungen Glob zur Verifizierung verwenden.

2.3. Fuer Registry-Anzahl-Pruefungen die relevante _registry.yml parsen und total_* gegen tatsaechliche Dateianzahlen auf dem Datentraeger vergleichen.

2.4. Fuer Branch-/Git-Zustand-Pruefungen git status --porcelain und git branch --show-current ausfuehren.

Erwartet: Alle Vorbedingungen sind erfuellt.

Bei Fehler: Wenn eine Vorbedingung fehlschlaegt, als BLOCKED in den Ergebnissen festhalten. Entscheiden ob fortgefahren werden soll (weiche Vorbedingung) oder abgebrochen werden soll (harte Vorbedingung wie fehlende Ziel-Team-Datei). Die Entscheidung dokumentieren.

Schritt 3: Koordinationsmuster-Kriterien laden

3.1. tests/_registry.yml lesen und den coordination_patterns-Eintrag finden, der dem coordination-pattern-Wert des Szenarios entspricht.

3.2. Die key_behaviors-Liste fuer dieses Muster extrahieren.

3.3. Diese Verhaltensweisen werden zur Beobachtungs-Checkliste — jede muss waehrend der Ausfuehrung beobachtet und als beobachtet/nicht beobachtet festgehalten werden.

Erwartet: Muster-Schluesselverhaltensweisen geladen und bereit zur Beobachtung.

Bei Fehler: Wenn das Koordinationsmuster nicht in der Registry definiert ist, den Abschnitt Expected Behaviors des Szenarios als alleinige Beobachtungsquelle verwenden. Eine Warnung protokollieren.

Schritt 4: Aufgabe ausfuehren

4.1. Das Ergebnisverzeichnis erstellen: tests/results/YYYY-MM-DD-<target>-NNN/.

4.2. T0 (Aufgaben-Startzeit) festhalten.

4.3. Das Zielteam mit TeamCreate und der Team-Groesse aus dem Szenario starten. Den Primary-Task-Prompt wortwortlich aus dem Task-Abschnitt des Szenarios uebergeben.

4.4. Die Ausfuehrungsphasen des Teams beobachten. Zeitstempel festhalten fuer:

T1: Formausschreibung / Aufgabenzerlegung abgeschlossen
T2: Rollenzuweisungen sichtbar

4.5. Wenn das Szenario einen Scope-Change-Trigger definiert und skip-scope-change false ist:

Warten bis Phase 2 (Rollenzuweisung) sichtbar ist
T3 (Zeitstempel der Umfangsaenderungs-Injektion) festhalten
Den Umfangsaenderungs-Prompt per SendMessage an das Team senden
T4 (Umfangsaenderung absorbiert — Rollenanpassung sichtbar) festhalten

4.6. Beobachtung fortsetzen bis das Team seine Ausgabe liefert.

T5 (Integration beginnt) festhalten
T6 (Abschlussbericht geliefert) festhalten

4.7. Die vollstaendige Ausgabe des Teams erfassen.

Erwartet: Team fuehrt die Aufgabe durch seine Koordinationsmuster-Phasen aus. Zeitstempel fuer alle Uebergaenge festgehalten. Umfangsaenderung (falls zutreffend) injiziert und absorbiert.

Bei Fehler: Wenn das Team keine Ausgabe erzeugt, den Fehlerpunkt und alle Fehlermeldungen festhalten. Wenn das Team ins Stocken geraet, die zuletzt beobachtete Phase und Zeitueberschreitung vermerken. Mit partiellen Ergebnissen zur Bewertung fortfahren.

Schritt 5: Muster-Verhaltensweisen bewerten

5.1. Fuer jede Schluesselverhalten aus Schritt 3 bestimmen, ob sie waehrend der Ausfuehrung beobachtet wurde:

Beobachtet: Klare Beweise in Ausgabe oder Koordination des Teams
Teilweise: Einige Beweise, aber unvollstaendig oder mehrdeutig
Nicht beobachtet: Kein Nachweis

5.2. Fuer jedes aufgabenspezifische Verhalten aus dem Expected-Behaviors-Abschnitt des Szenarios dieselbe Bewertung anwenden.

5.3. Befunde im Beobachtungsprotokoll festhalten.

Erwartet: Alle oder die meisten muster- und aufgabenspezifischen Verhaltensweisen werden beobachtet.

Bei Fehler: Nicht beobachtete Verhaltensweisen sind Befunde, keine Fehler des Test-Verfahrens. Sie genau festhalten — sie zeigen an, dass das Koordinationsmuster sich nicht vollstaendig manifestiert hat.

Schritt 6: Akzeptanzkriterien bewerten

6.1. Jedes Akzeptanzkriterium aus dem Szenario durchgehen.

6.2. Fuer jedes Kriterium eine Bestimmung zuweisen:

PASS: Kriterium klar erfuellt mit beobachtbaren Nachweisen
PARTIAL: Kriterium teilweise erfuellt (zaehlt mit 0,5-Gewichtung zum Schwellenwert)
FAIL: Kriterium nicht erfuellt trotz Gelegenheit
BLOCKED: Konnte nicht bewertet werden (Vorbedingungsversagen, Team-Zeitueberschreitung usw.)

6.3. Wenn das Szenario Ground-Truth-Daten enthaelt, gemeldete Befunde dagegen verifizieren:

Genauigkeitsprozentsaetze pro Kategorie berechnen
Falsch-Positive und Falsch-Negative markieren

6.4. Wenn das Szenario eine Bewertungsrubrik enthaelt, jede Dimension 1-5 mit kurzer Begruendung bewerten.

6.5. Zusammenfassungsmetriken berechnen:

Akzeptanz: X/N Kriterien bestanden (PARTIAL zaehlt als 0,5)
Schwellenwert: PASS wenn >= im Szenario definierter Schwellenwert
Rubrik-Gesamt: X/Y Punkte (falls zutreffend)

Erwartet: Alle Akzeptanzkriterien haben eine Bestimmung. Zusammenfassungsmetriken sind berechnet.

Bei Fehler: Wenn weniger als die Haelfte der Kriterien bewertet werden kann (zu viele BLOCKED), ist der Testlauf nicht schlussfolgerungsfaehig. Dokumentieren warum und erneuten Durchlauf nach Beheben der Vorbedingungen empfehlen.

Schritt 7: RESULT.md erzeugen

7.1. tests/results/YYYY-MM-DD-<target>-NNN/RESULT.md mit der Aufzeichnungsvorlage aus dem Beobachtungsprotokoll des Szenarios erstellen.

7.2. Alle Abschnitte befuellen:

Ausfuehrungs-Metadaten (Beobachter, Zeitstempel, Dauer)
Phasenprotokoll mit allen festgehaltenen Zeitstempeln
Rollenentstehungs-Protokoll (fuer adaptive/Team-Tests)
Ergebnistabelle der Akzeptanzkriterien
Rubrik-Punkte-Tabelle (falls zutreffend)
Ground-Truth-Verifikationstabelle (falls zutreffend)
Schluessbeobachtungen (narrativ)
Gelernte Lektionen

7.3. Die Rohausgabe des Teams als Anhang oder in einer separaten Datei (team-output.md) im selben Ergebnisverzeichnis einschliessen.

7.4. Zusammenfassungs-Urteil oben hinzufuegen:

**Urteil**: PASS | FAIL | INCONCLUSIVE
**Ergebnis**: X/N Kriterien (Y/Z Rubrik-Punkte)
**Dauer**: Xm

Erwartet: Vollstaendige RESULT.md mit allen befuellten Abschnitten und einem klaren Urteil.

Bei Fehler: Wenn die Ergebnisdatei nicht geschrieben werden kann, die Ergebnisse als Fallback nach stdout ausgeben. Die Bewertungsdaten sollten niemals verloren gehen.

Validierung

Haeufige Stolperfallen

Ausgabequalitaet statt Koordination bewerten: Dieser Skill testet wie das Team koordiniert, nicht ob die Aufgabenausgabe perfekt ist. Ein Team, das gut koordiniert, aber nur 7/9 defekte Referenzen findet, demonstriert trotzdem das Muster.
Umfangsaenderung zu frueh injizieren: Warten, bis Rollenzuweisung klar sichtbar ist, bevor die Umfangsaenderung injiziert wird. Zu frueh bedeutet, dass das Team sich noch nicht differenziert hat, daher gibt es nichts anzupassen.
Team-Mitglieder-Ausgabe mit Team-Ausgabe verwechseln: Das opake Team sollte eine einheitliche Ausgabe praesentieren. Wenn individuelle Mitglieder-Berichte zu sehen sind, ist das ein Befund ueber Opazitaet, kein Test-Infrastruktur-Problem.
Exaktes Ground-Truth-Matching: Ground-Truth-Zaehlen sind ungefaehr. Bewerten, ob Befunde in der richtigen Groessenordnung sind, nicht ob sie exakt uebereinstimmen.
Zeitstempel nicht festhalten: Zeitstempel sind fuer die Messung von Phasendauern und Anpassungsgeschwindigkeit unverzichtbar. Sie als Ereignisse festhalten, nicht rueckwirkend.

GitHub 저장소

pjt222/agent-almanac

경로: i18n/de/skills/test-team-coordination

agentsagentskillsai-assisted-developmentclaude-codeskillsteams

FAQ

Frequently asked questions

What is the test-team-coordination skill?

test-team-coordination is a Claude Skill by pjt222. Skills package instructions and resources that Claude loads on demand, so Claude can perform test-team-coordination-related tasks without extra prompting.

How do I install test-team-coordination?

Use the install commands on this page: add test-team-coordination to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does test-team-coordination belong to?

test-team-coordination is in the Testing category, tagged testing and design.

Is test-team-coordination free to use?

Yes. test-team-coordination is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.

연관 스킬

evaluating-llms-harness

테스팅

이 Claude Skill은 MMLU, GSM8K를 포함한 60개 이상의 표준화된 학술 과제에서 LLM 성능을 벤치마크하기 위해 lm-evaluation-harness를 실행합니다. 개발자들이 모델 품질을 비교하고, 학습 진행 상황을 추적하거나 학술 결과를 보고할 수 있도록 설계되었습니다. 이 도구는 HuggingFace와 vLLM 모델을 포함한 다양한 백엔드를 지원합니다.

스킬 보기

cloudflare-cron-triggers

테스팅

이 스킬은 cron 표현식을 사용하여 Worker를 스케줄링하기 위한 Cloudflare Cron Triggers 구현에 관한 포괄적인 지식을 제공합니다. 주기적 작업, 유지보수 작업, 자동화된 워크플로우 설정 방법을 다루며, 잘못된 cron 표현식이나 시간대 문제 같은 일반적인 이슈들을 해결하는 방법을 포함합니다. 개발자들은 이를 통해 스케줄된 핸들러 구성, cron 트리거 테스트, Workflows 및 Green Compute와의 연동 작업을 수행할 수 있습니다.

스킬 보기

webapp-testing

테스팅

이 Claude Skill은 Python 스크립트를 통해 로컬 웹 애플리케이션을 테스트하기 위한 Playwright 기반 툴킷을 제공합니다. 프론트엔드 검증, UI 디버깅, 스크린샷 캡처, 로그 확인 기능을 지원하며 서버 라이프사이클을 관리합니다. 브라우저 자동화 작업에 사용하되 컨텍스트 오염을 방지하기 위해 소스 코드를 읽지 않고 스크립트를 직접 실행하세요.

스킬 보기

finishing-a-development-branch

테스팅

이 스킬은 테스트 통과를 확인한 후 체계적인 통합 옵션을 제시하여 개발자가 완성된 작업을 마무리하도록 돕습니다. 구현이 완료된 후 머지, PR 생성, 브랜치 정리와 같은 워크플로우를 안내합니다. 코드가 준비되고 테스트가 완료되었을 때 개발 프로세스를 체계적으로 마무리하기 위해 사용하세요.

스킬 보기

test-team-coordination

정보

빠른 설치

Claude Code

문서

Team-Koordination testen

Wann verwenden

Eingaben

Vorgehensweise

Schritt 1: Testszenario laden und validieren

Schritt 2: Vorbedingungen verifizieren

Schritt 3: Koordinationsmuster-Kriterien laden

Schritt 4: Aufgabe ausfuehren

Schritt 5: Muster-Verhaltensweisen bewerten

Schritt 6: Akzeptanzkriterien bewerten

Schritt 7: RESULT.md erzeugen

Validierung

Haeufige Stolperfallen

Verwandte Skills

GitHub 저장소

Frequently asked questions

What is the test-team-coordination skill?

How do I install test-team-coordination?

What category does test-team-coordination belong to?

Is test-team-coordination free to use?

연관 스킬