返回技能列表

run-puzzle-tests

pjt222
更新于 2 days ago
7 次查看
17
2
17
在 GitHub 上查看
测试aitestingdesign

关于

This skill runs the jigsawR test suite through WSL R execution, supporting full tests, pattern filtering, or single file runs. It interprets pass/fail/skip results and identifies failing tests while preserving renv compatibility by avoiding the --vanilla flag. Use it after code modifications, before commits, or when debugging specific test failures to ensure nothing is broken.

快速安装

Claude Code

推荐
主要方式
npx skills add pjt222/agent-almanac -a claude-code
插件命令备选方式
/plugin add https://github.com/pjt222/agent-almanac
Git 克隆备选方式
git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/run-puzzle-tests

在 Claude Code 中复制并粘贴此命令以安装该技能

技能文档

行拼圖之試

行 jigsawR 之試套,並解其果。

用時

  • 包中 R 之源已改乃用
  • 新拼圖類或特徵已增乃用
  • 提交之前驗無破乃用
  • 察特試之敗乃用

  • 必要:試之範(fullfiltered、或 single
  • 可選:濾之模(為濾模,如 "snic""rectangular"
  • 可選:特試文件之徑(為單模)

第一步:擇試之範

用時
Full提交之前、大變之後約 2-5 分
Filtered治一拼圖之類約 30 秒
Single察一試文件約 10 秒

得:依當前所為擇範——提交之前用全套,治一類用濾,察一試用單。

敗則:不知擇何範,默用全套。雖久而能捕跨類之回退。

第二步:建並行試本

全套

立本文件(如 /tmp/run_tests.R):

devtools::test()
R_EXE="/mnt/c/Program Files/R/R-4.5.0/bin/Rscript.exe"
cd /mnt/d/dev/p/jigsawR && "$R_EXE" -e "devtools::test()"

依模濾之

"$R_EXE" -e "devtools::test(filter = 'snic')"

單文件

"$R_EXE" -e "testthat::test_file('tests/testthat/test-snic-puzzles.R')"

得:試出附過/敗/略之數。

敗則:

  • 勿用 --vanilla 旗;renv 需 .Rprofile 以啟
  • renv 誤,先行 renv::restore()
  • 繁命以退碼 5 敗者,書為本文件代之

第三步:解其果

察其總線:

[ FAIL 0 | WARN 0 | SKIP 7 | PASS 2042 ]
  • PASS:試之成
  • FAIL:試之敗(須察)
  • SKIP:試之略(常為缺選裝之包,如 snic
  • WARN:試中之警(察而不阻)

得:總線解之,識 PASS、FAIL、SKIP、WARN 之數。淨行則 FAIL = 0。

敗則:總線不見,試或於畢前崩。察其上之 R 級誤。出截斷者,重定於文件:"$R_EXE" -e "devtools::test()" > test_results.txt 2>&1

第四步:察敗

試敗:

  1. 讀敗辭——含文件、行、預期與實得
  2. 察其為新敗或舊存
  3. 斷言之敗,讀其試與所試之函
  4. 誤之敗,察函之簽是否變
# Run just the failing test with verbose output
"$R_EXE" -e "testthat::test_file('tests/testthat/test-failing.R', reporter = 'summary')"

得:每敗試之根因已識。敗者,或實之回退(碼宜修),或試境之患(缺依、徑訛)。

敗則:敗辭不明,加 browser()print() 於試,以 testthat::test_file() 重行為交互之察。

第五步:驗略之由

略之試,乃選依不存時之常:

  • snic 包試以 skip_if_not_installed("snic")
  • 需特 OS 之試以 skip_on_os()
  • CRAN 唯之略以 skip_on_cran()

驗略之由皆正當,非掩實敗。

得:諸略皆有正當之由(選依未裝、平台特略、CRAN 唯略)。無略掩實之試敗。

敗則:略可疑,暫除其 skip_if_*() 而行其試,察其過或現藏敗。

  • 諸試皆過(FAIL = 0)
  • 無意外之警
  • 略數合預期(唯選依之略)
  • 試數未降(無誤刪之試)

  • --vanilla:破 renv 之啟。jigsawR 永勿用之
  • 繁之 -e:殼轉義之患致退碼 5。用本文件
  • 包之陳態:改 NAMESPACE 之碼,試前先行 devtools::load_all()devtools::document()
  • 缺試依:某試需 Suggests 之包。察 DESCRIPTION 之 Suggests
  • 並試之患:試相干,以 testthat::test_file() 序行

  • generate-puzzle — 生拼圖以驗其行合試
  • add-puzzle-type — 新類需備全試套
  • write-testthat-tests — 寫 R 試之常模
  • validate-piles-notation — 獨驗 PILES 之解

GitHub 仓库

pjt222/agent-almanac
路径: i18n/wenyan/skills/run-puzzle-tests
0
agentsagentskillsai-assisted-developmentclaude-codeskillsteams

相关推荐技能

evaluating-llms-harness

测试

该Skill通过60+个学术基准测试(如MMLU、GSM8K等)评估大语言模型质量,适用于模型对比、学术研究及训练进度追踪。它支持HuggingFace、vLLM和API接口,被EleutherAI等行业领先机构广泛采用。开发者可通过简单命令行快速对模型进行多任务批量评估。

查看技能

cloudflare-cron-triggers

测试

这个Claude Skill提供了关于Cloudflare Cron Triggers的完整知识库,用于通过cron表达式定时执行Workers。它支持配置周期性任务、维护作业和自动化工作流,并能处理常见的cron触发错误。开发者可以用它来设置定时任务、测试cron处理器,并集成Workflows和Green Compute功能。

查看技能

webapp-testing

测试

该Skill为开发者提供了基于Playwright的本地Web应用测试工具集,支持自动化测试前端功能、调试UI行为、捕获屏幕截图和查看浏览器日志。它包含管理服务器生命周期的辅助脚本,可直接作为黑盒工具运行而无需阅读源码。适用于需要快速验证本地Web应用界面和交互功能的开发场景。

查看技能

finishing-a-development-branch

测试

这个Skill用于开发分支完成后的集成决策,当代码实现完成且测试通过时,它会引导开发者选择合适的工作流。它首先验证测试状态,然后提供合并、创建PR或清理等结构化选项。核心价值在于确保代码质量的同时,标准化分支收尾流程。

查看技能