MCP HubMCP Hub
스킬 목록으로 돌아가기

test-a2a-interop

pjt222
업데이트됨 6 days ago
9 조회
17
2
17
GitHub에서 보기
테스팅aitestingautomationdesign

정보

이 스킬은 에이전트 카드 규정 준수를 검증하고, 모든 작업 수명 주기 상태를 실행하며, 스트리밍 및 오류 처리를 확인함으로써 A2A 상호 운용성을 테스트합니다. 새로운 A2A 서버 구현을 검증하거나, 에이전트 간 상호 운용성을 확인하거나, CI/CD에서 규정 준수 테스트를 실행하거나, 다중 에이전트 워크플로우를 디버깅하는 데 사용하세요.

빠른 설치

Claude Code

추천
기본
npx skills add pjt222/agent-almanac -a claude-code
플러그인 명령대체
/plugin add https://github.com/pjt222/agent-almanac
Git 클론대체
git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/test-a2a-interop

Claude Code에서 이 명령을 복사하여 붙여넣어 스킬을 설치하세요

문서

測 A2A 互操

驗 A2A 行合規——測 Agent Card 發現、任生命管、SSE 流、誤理、多代通模。

  • 驗新 A2A 服行於部署前→用
  • 驗二 A2A 代或之互操→用
  • A2A 服 CI/CD 行合規測→用
  • 調多代 A2A 流敗→用
  • 證代合 A2A 協需於登記→用

  • :測代基 URL
  • :認憑(若需)
  • :次代 URL 為雙向互操測
  • :所測技(默:Agent Card 諸技)
  • :每任測超時(默:60 秒)
  • :合規報出式(jsonmarkdownjunit

一:取驗 Agent Card

1.1 自周知端取 Agent Card:

curl -s https://agent.example.com/.well-known/agent.json -o agent-card.json

1.2 驗需頂域:

const requiredFields = ["name", "description", "url", "skills"];
for (const field of requiredFields) {
  assert(agentCard[field] !== undefined, `Missing required field: ${field}`);
}

1.3 驗各技項:

for (const skill of agentCard.skills) {
  assert(skill.id, "Skill missing id");
  assert(skill.name, "Skill missing name");
  assert(skill.description, "Skill missing description");
  assert(
    Array.isArray(skill.inputModes) && skill.inputModes.length > 0,
    `Skill ${skill.id} missing inputModes`
  );
  assert(
    Array.isArray(skill.outputModes) && skill.outputModes.length > 0,
    `Skill ${skill.id} missing outputModes`
  );
}

1.4 驗認設:

  • authentication.schemesoauth2→驗 credentials.oauth2tokenUrl
  • apiKey→驗 credentials.apiKeyheaderName

1.5 驗能旗為布。

1.6 記驗果於合規報:

interface ConformanceResult {
  test: string;
  category: "agent-card" | "lifecycle" | "streaming" | "error-handling" | "interop";
  status: "pass" | "fail" | "skip";
  message?: string;
  duration_ms?: number;
}

得:Agent Card 過諸構驗。

敗:各驗敗記具域因。勿止;續測他。無效 Agent Card 自為測果。

二:送測任覆諸生命態

2.1 測:任送(submitted -> working -> completed)

送代當能理之任依其陳技:

const submitResult = await sendJsonRpc(agentUrl, {
  jsonrpc: "2.0",
  id: 1,
  method: "tasks/send",
  params: {
    id: `test-${uuid()}`,
    sessionId: `session-${uuid()}`,
    message: {
      role: "user",
      parts: [{ type: "text", text: skillExamples[0] }],
    },
  },
});

assert(submitResult.result, "tasks/send should return a result");
assert(submitResult.result.id, "Result should include task ID");
assert(
  ["submitted", "working", "completed"].includes(submitResult.result.status.state),
  `Unexpected initial state: ${submitResult.result.status.state}`
);

2.2 測:任輪詢(tasks/get)

輪至任達末態:

let task = submitResult.result;
const startTime = Date.now();
while (!["completed", "failed", "canceled"].includes(task.status.state)) {
  if (Date.now() - startTime > TEST_TIMEOUT_MS) {
    fail(`Task ${task.id} did not complete within ${TEST_TIMEOUT_MS}ms`);
    break;
  }
  await sleep(1000);
  const getResult = await sendJsonRpc(agentUrl, {
    jsonrpc: "2.0",
    id: 2,
    method: "tasks/get",
    params: { id: task.id },
  });
  task = getResult.result;
}

assert(task.status.state === "completed", `Task should complete, got: ${task.status.state}`);

2.3 測:任取消

送任而即取消:

const cancelTask = await sendJsonRpc(agentUrl, {
  jsonrpc: "2.0",
  id: 3,
  method: "tasks/send",
  params: { id: `test-cancel-${uuid()}`, sessionId: `session-${uuid()}`, message: { ... } },
});

const cancelResult = await sendJsonRpc(agentUrl, {
  jsonrpc: "2.0",
  id: 4,
  method: "tasks/cancel",
  params: { id: cancelTask.result.id },
});

assert(
  cancelResult.result.status.state === "canceled",
  "Canceled task should be in canceled state"
);

2.4 測:input-required 態(多輪)

某技支多輪→送歧請當觸 input-required、後予補:

// Send ambiguous request
const multiTurnTask = await sendJsonRpc(agentUrl, { ... });

// Poll until input-required or completed
// If input-required, send follow-up
if (task.status.state === "input-required") {
  const followUp = await sendJsonRpc(agentUrl, {
    jsonrpc: "2.0",
    id: 6,
    method: "tasks/send",
    params: {
      id: task.id,
      sessionId: task.sessionId,
      message: { role: "user", parts: [{ type: "text", text: "Column A and Column B" }] },
    },
  });
  assert(
    ["working", "completed"].includes(followUp.result.status.state),
    "Follow-up should resume task"
  );
}

2.5 測:態轉史

Agent Card 陳 stateTransitionHistory: true

const getWithHistory = await sendJsonRpc(agentUrl, {
  jsonrpc: "2.0",
  id: 7,
  method: "tasks/get",
  params: { id: completedTaskId, historyLength: 100 },
});

assert(
  Array.isArray(getWithHistory.result.history),
  "Task should include history array"
);
assert(
  getWithHistory.result.history.length >= 2,
  "History should have at least 2 entries (submitted and completed)"
);

得:諸生命態轉皆正行。任成、清取消、多輪交於支時行。

敗:記具敗轉、期態、實態。含全 JSON-RPC 應於報為調。

三:驗 SSE 流應

3.1 Agent Card 陳 streaming: false→略此步。

3.2 送 tasks/sendSubscribe 而驗 SSE 流:

const response = await fetch(`${agentUrl}/subscribe`, {
  method: "POST",
  headers: { "Content-Type": "application/json" },
  body: JSON.stringify({
    jsonrpc: "2.0",
    id: 10,
    method: "tasks/sendSubscribe",
    params: {
      id: `test-stream-${uuid()}`,
      sessionId: `session-${uuid()}`,
      message: { role: "user", parts: [{ type: "text", text: "Stream test task" }] },
    },
  }),
});

assert(
  response.headers.get("content-type")?.includes("text/event-stream"),
  "Response must be text/event-stream"
);

3.3 析 SSE 事而驗構:

const events: SSEEvent[] = [];
const reader = response.body.getReader();
const decoder = new TextDecoder();
let buffer = "";

while (true) {
  const { done, value } = await reader.read();
  if (done) break;
  buffer += decoder.decode(value, { stream: true });

  // Parse SSE events from buffer
  const lines = buffer.split("\n");
  for (const line of lines) {
    if (line.startsWith("event: ")) {
      currentEvent.type = line.slice(7);
    } else if (line.startsWith("data: ")) {
      currentEvent.data = JSON.parse(line.slice(6));
      events.push(currentEvent);
    }
  }
}

3.4 驗事序:

  • 首事當為 statussubmittedworking
  • 中事或含 status 更與 artifact
  • 末事當有 final: true 含末態
  • 末事後不當有事至

3.5 驗 SSE 接清行:

  • 流中斷接
  • 驗任仍可由 tasks/get
  • 驗無服誤自早斷

得:SSE 流正交事序、止於末事。

敗:陳 SSE 而端返非 SSE→記合規敗。事失序→記序。流不止→記超時。

四:測誤理與邊例

4.1 測:未知法

const unknownMethod = await sendJsonRpc(agentUrl, {
  jsonrpc: "2.0",
  id: 20,
  method: "tasks/nonexistent",
  params: {},
});
assert(unknownMethod.error?.code === -32601, "Should return method not found");

4.2 測:誤 JSON-RPC 請

const malformed = await fetch(agentUrl, {
  method: "POST",
  headers: { "Content-Type": "application/json" },
  body: '{"not": "valid jsonrpc"}',
});
const response = await malformed.json();
assert(response.error?.code === -32600, "Should return invalid request");

4.3 測:取不存任

const notFound = await sendJsonRpc(agentUrl, {
  jsonrpc: "2.0",
  id: 22,
  method: "tasks/get",
  params: { id: "nonexistent-task-id" },
});
assert(notFound.error, "Should return error for nonexistent task");

4.4 測:取消已成任

const cancelCompleted = await sendJsonRpc(agentUrl, {
  jsonrpc: "2.0",
  id: 23,
  method: "tasks/cancel",
  params: { id: completedTaskId },
});
assert(cancelCompleted.error, "Should error when canceling completed task");

4.5 測:認施

認設→送無憑請:

const unauthResponse = await fetch(agentUrl, {
  method: "POST",
  headers: { "Content-Type": "application/json" },
  body: JSON.stringify({ jsonrpc: "2.0", id: 24, method: "tasks/get", params: { id: "x" } }),
});
assert(unauthResponse.status === 401, "Should reject unauthenticated requests");

4.6 測:Agent Card 公訪無認

const publicCard = await fetch(`${agentUrl}/.well-known/agent.json`);
assert(publicCard.status === 200, "Agent Card should be publicly accessible");

得:諸誤況返宜 JSON-RPC 誤碼而不崩服。

敗:記各敗誤理測。誤測中服崩為要敗、必先修乃部。

五:生互操合規報

5.1 合諸測果為構報:

interface ConformanceReport {
  agentUrl: string;
  agentName: string;
  agentVersion: string;
  testDate: string;
  summary: {
    total: number;
    passed: number;
    failed: number;
    skipped: number;
  };
  categories: {
    agentCard: ConformanceResult[];
    lifecycle: ConformanceResult[];
    streaming: ConformanceResult[];
    errorHandling: ConformanceResult[];
    interop: ConformanceResult[];
  };
  conformanceLevel: "full" | "partial" | "minimal" | "non-conformant";
}

5.2 算合規級:

  • full:諸測過、含流與推通
  • partial:核生命過、某選功敗
  • minimal:Agent Card 效而基送/取行
  • non-conformant:Agent Card 無效或基生命斷

5.3 以所請式生報:

  • json:機讀為 CI/CD 整
  • markdown:人讀含過敗表
  • junit:XML 為測框整

5.4 含修敗薦:

## Failed Tests

| Test | Category | Message | Recommendation |
|------|----------|---------|----------------|
| cancel-completed-task | error-handling | Server returned 500 | Add guard for terminal state transitions |
| sse-final-event | streaming | No final event received | Ensure SSE sends event with final:true |

5.5 雙向測請(兩代)→驗:

  • 代甲可發代乙之 Agent Card
  • 代甲可送任於代乙
  • 代乙可送任於代甲
  • 兩代理並任無擾

得:全合規報含過敗果、合規級、可施薦。

敗:報生自敗→出原測果至 stdout 為退。測資永不當因報誤失。

  • Agent Card 取而構驗
  • 至少一任成全生命(submitted -> working -> completed)
  • 任取消正行
  • 誤應用正 JSON-RPC 誤碼
  • 若陳能→測 SSE 流
  • 認施於任端而非 Agent Card
  • 合規報以所請式生
  • 敗測含可施救導
  • 測組可於 CI/CD 行而無人入

  • 測冷服:某代需時初。前測加健察或熱請
  • 硬測資:用動任與會 ID(UUID)以避撞於復行。勿設某 ID 可用
  • 忽時:任轉異步。常輪以退避而勿設即態變
  • SSE 析繁:SSE 事或跨多塊。緩入而析全事、非原塊
  • 唯測順路:誤理測如成測重。誤請、無效轉、認敗皆當覆
  • 網依:測當可行於本機為開、遠 URL 為產。參代 URL
  • 設技為:測組驗協合規、非技正。用 Agent Card 例詞觸技、勿斷具出容

  • design-a2a-agent-card - 設所測之 Agent Card
  • implement-a2a-server - 行所測服
  • build-ci-cd-pipeline - 整合規測於 CI/CD
  • troubleshoot-mcp-connection - 調模適 A2A 連
  • review-software-architecture - 多代系構覆

GitHub 저장소

pjt222/agent-almanac
경로: i18n/wenyan-ultra/skills/test-a2a-interop
0
agentsagentskillsai-assisted-developmentclaude-codeskillsteams

연관 스킬

evaluating-llms-harness

테스팅

이 Claude Skill은 MMLU, GSM8K를 포함한 60개 이상의 표준화된 학술 과제에서 LLM 성능을 벤치마크하기 위해 lm-evaluation-harness를 실행합니다. 개발자들이 모델 품질을 비교하고, 학습 진행 상황을 추적하거나 학술 결과를 보고할 수 있도록 설계되었습니다. 이 도구는 HuggingFace와 vLLM 모델을 포함한 다양한 백엔드를 지원합니다.

스킬 보기

cloudflare-cron-triggers

테스팅

이 스킬은 cron 표현식을 사용하여 Worker를 스케줄링하기 위한 Cloudflare Cron Triggers 구현에 관한 포괄적인 지식을 제공합니다. 주기적 작업, 유지보수 작업, 자동화된 워크플로우 설정 방법을 다루며, 잘못된 cron 표현식이나 시간대 문제 같은 일반적인 이슈들을 해결하는 방법을 포함합니다. 개발자들은 이를 통해 스케줄된 핸들러 구성, cron 트리거 테스트, Workflows 및 Green Compute와의 연동 작업을 수행할 수 있습니다.

스킬 보기

webapp-testing

테스팅

이 Claude Skill은 Python 스크립트를 통해 로컬 웹 애플리케이션을 테스트하기 위한 Playwright 기반 툴킷을 제공합니다. 프론트엔드 검증, UI 디버깅, 스크린샷 캡처, 로그 확인 기능을 지원하며 서버 라이프사이클을 관리합니다. 브라우저 자동화 작업에 사용하되 컨텍스트 오염을 방지하기 위해 소스 코드를 읽지 않고 스크립트를 직접 실행하세요.

스킬 보기

finishing-a-development-branch

테스팅

이 스킬은 테스트 통과를 확인한 후 체계적인 통합 옵션을 제시하여 개발자가 완성된 작업을 마무리하도록 돕습니다. 구현이 완료된 후 머지, PR 생성, 브랜치 정리와 같은 워크플로우를 안내합니다. 코드가 준비되고 테스트가 완료되었을 때 개발 프로세스를 체계적으로 마무리하기 위해 사용하세요.

스킬 보기