MCP HubMCP Hub
스킬 목록으로 돌아가기

run-puzzle-tests

pjt222
업데이트됨 Yesterday
5 조회
17
2
17
GitHub에서 보기
테스팅aitestingdesign

정보

이 스킬은 WSL R 실행을 통해 jigsawR 테스트 스위트를 실행하며, 전체 테스트, 패턴 필터링 또는 단일 파일 실행을 지원합니다. 통과/실패/건너뜀 결과를 해석하고 실패한 테스트를 식별하며, --vanilla 플래그를 사용하지 않음으로써 renv 호환성을 유지합니다. 코드 수정 후, 커밋 전, 또는 특정 테스트 실패를 디버깅할 때 사용하여 문제가 발생하지 않도록 보장합니다.

빠른 설치

Claude Code

추천
기본
npx skills add pjt222/agent-almanac -a claude-code
플러그인 명령대체
/plugin add https://github.com/pjt222/agent-almanac
Git 클론대체
git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/run-puzzle-tests

Claude Code에서 이 명령을 복사하여 붙여넣어 스킬을 설치하세요

문서

行拼圖之試

行 jigsawR 之試套,並解其果。

用時

  • 包中 R 之源已改乃用
  • 新拼圖類或特徵已增乃用
  • 提交之前驗無破乃用
  • 察特試之敗乃用

  • 必要:試之範(fullfiltered、或 single
  • 可選:濾之模(為濾模,如 "snic""rectangular"
  • 可選:特試文件之徑(為單模)

第一步:擇試之範

用時
Full提交之前、大變之後約 2-5 分
Filtered治一拼圖之類約 30 秒
Single察一試文件約 10 秒

得:依當前所為擇範——提交之前用全套,治一類用濾,察一試用單。

敗則:不知擇何範,默用全套。雖久而能捕跨類之回退。

第二步:建並行試本

全套

立本文件(如 /tmp/run_tests.R):

devtools::test()
R_EXE="/mnt/c/Program Files/R/R-4.5.0/bin/Rscript.exe"
cd /mnt/d/dev/p/jigsawR && "$R_EXE" -e "devtools::test()"

依模濾之

"$R_EXE" -e "devtools::test(filter = 'snic')"

單文件

"$R_EXE" -e "testthat::test_file('tests/testthat/test-snic-puzzles.R')"

得:試出附過/敗/略之數。

敗則:

  • 勿用 --vanilla 旗;renv 需 .Rprofile 以啟
  • renv 誤,先行 renv::restore()
  • 繁命以退碼 5 敗者,書為本文件代之

第三步:解其果

察其總線:

[ FAIL 0 | WARN 0 | SKIP 7 | PASS 2042 ]
  • PASS:試之成
  • FAIL:試之敗(須察)
  • SKIP:試之略(常為缺選裝之包,如 snic
  • WARN:試中之警(察而不阻)

得:總線解之,識 PASS、FAIL、SKIP、WARN 之數。淨行則 FAIL = 0。

敗則:總線不見,試或於畢前崩。察其上之 R 級誤。出截斷者,重定於文件:"$R_EXE" -e "devtools::test()" > test_results.txt 2>&1

第四步:察敗

試敗:

  1. 讀敗辭——含文件、行、預期與實得
  2. 察其為新敗或舊存
  3. 斷言之敗,讀其試與所試之函
  4. 誤之敗,察函之簽是否變
# Run just the failing test with verbose output
"$R_EXE" -e "testthat::test_file('tests/testthat/test-failing.R', reporter = 'summary')"

得:每敗試之根因已識。敗者,或實之回退(碼宜修),或試境之患(缺依、徑訛)。

敗則:敗辭不明,加 browser()print() 於試,以 testthat::test_file() 重行為交互之察。

第五步:驗略之由

略之試,乃選依不存時之常:

  • snic 包試以 skip_if_not_installed("snic")
  • 需特 OS 之試以 skip_on_os()
  • CRAN 唯之略以 skip_on_cran()

驗略之由皆正當,非掩實敗。

得:諸略皆有正當之由(選依未裝、平台特略、CRAN 唯略)。無略掩實之試敗。

敗則:略可疑,暫除其 skip_if_*() 而行其試,察其過或現藏敗。

  • 諸試皆過(FAIL = 0)
  • 無意外之警
  • 略數合預期(唯選依之略)
  • 試數未降(無誤刪之試)

  • --vanilla:破 renv 之啟。jigsawR 永勿用之
  • 繁之 -e:殼轉義之患致退碼 5。用本文件
  • 包之陳態:改 NAMESPACE 之碼,試前先行 devtools::load_all()devtools::document()
  • 缺試依:某試需 Suggests 之包。察 DESCRIPTION 之 Suggests
  • 並試之患:試相干,以 testthat::test_file() 序行

  • generate-puzzle — 生拼圖以驗其行合試
  • add-puzzle-type — 新類需備全試套
  • write-testthat-tests — 寫 R 試之常模
  • validate-piles-notation — 獨驗 PILES 之解

GitHub 저장소

pjt222/agent-almanac
경로: i18n/wenyan/skills/run-puzzle-tests
0
agentsagentskillsai-assisted-developmentclaude-codeskillsteams

연관 스킬

evaluating-llms-harness

테스팅

이 Claude Skill은 MMLU, GSM8K를 포함한 60개 이상의 표준화된 학술 과제에서 LLM 성능을 벤치마크하기 위해 lm-evaluation-harness를 실행합니다. 개발자들이 모델 품질을 비교하고, 학습 진행 상황을 추적하거나 학술 결과를 보고할 수 있도록 설계되었습니다. 이 도구는 HuggingFace와 vLLM 모델을 포함한 다양한 백엔드를 지원합니다.

스킬 보기

cloudflare-cron-triggers

테스팅

이 스킬은 cron 표현식을 사용하여 Worker를 스케줄링하기 위한 Cloudflare Cron Triggers 구현에 관한 포괄적인 지식을 제공합니다. 주기적 작업, 유지보수 작업, 자동화된 워크플로우 설정 방법을 다루며, 잘못된 cron 표현식이나 시간대 문제 같은 일반적인 이슈들을 해결하는 방법을 포함합니다. 개발자들은 이를 통해 스케줄된 핸들러 구성, cron 트리거 테스트, Workflows 및 Green Compute와의 연동 작업을 수행할 수 있습니다.

스킬 보기

webapp-testing

테스팅

이 Claude Skill은 Python 스크립트를 통해 로컬 웹 애플리케이션을 테스트하기 위한 Playwright 기반 툴킷을 제공합니다. 프론트엔드 검증, UI 디버깅, 스크린샷 캡처, 로그 확인 기능을 지원하며 서버 라이프사이클을 관리합니다. 브라우저 자동화 작업에 사용하되 컨텍스트 오염을 방지하기 위해 소스 코드를 읽지 않고 스크립트를 직접 실행하세요.

스킬 보기

finishing-a-development-branch

테스팅

이 스킬은 테스트 통과를 확인한 후 체계적인 통합 옵션을 제시하여 개발자가 완성된 작업을 마무리하도록 돕습니다. 구현이 완료된 후 머지, PR 생성, 브랜치 정리와 같은 워크플로우를 안내합니다. 코드가 준비되고 테스트가 완료되었을 때 개발 프로세스를 체계적으로 마무리하기 위해 사용하세요.

스킬 보기