MCP HubMCP Hub
Volver a habilidades

run-puzzle-tests

pjt222
Actualizado 6 days ago
17 vistas
17
2
17
Ver en GitHub
Pruebasaitestingdesign

Acerca de

Esta habilidad ejecuta el conjunto de pruebas de jigsawR mediante la ejecución de R en WSL, admitiendo pruebas completas, filtrado por patrones o ejecuciones de archivos individuales. Interpreta los resultados de las pruebas e identifica fallos, manejando adecuadamente las dependencias de renv. Úsela después de cambios en el código, antes de confirmaciones o al depurar fallos específicos en las pruebas para mantener la calidad del código.

Instalación rápida

Claude Code

Recomendado
Principal
npx skills add pjt222/agent-almanac -a claude-code
Comando PluginAlternativo
/plugin add https://github.com/pjt222/agent-almanac
Git CloneAlternativo
git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/run-puzzle-tests

Copia y pega este comando en Claude Code para instalar esta habilidad

Documentación

行拼測

行 jigsawR 測組釋果。

  • 改 R 源後→用
  • 增新拼類/功後→用
  • 提前驗無破→用
  • 除特測敗→用

  • :測範(fullfilteredsingle
  • :濾式(filtered 模,如 "snic""rectangular"
  • :特測檔徑(single 模)

一:擇範

用時
提前、大改後~2-5 分
一拼類工~30 秒
除特測~10 秒

得:按工選範—提前用全、特類用濾、除錯用單。

敗:未定→默全。久而捕跨類退。

二:建行測本

全組

建本檔(如 /tmp/run_tests.R):

devtools::test()
R_EXE="/mnt/c/Program Files/R/R-4.5.0/bin/Rscript.exe"
cd /mnt/d/dev/p/jigsawR && "$R_EXE" -e "devtools::test()"

"$R_EXE" -e "devtools::test(filter = 'snic')"

單檔

"$R_EXE" -e "testthat::test_file('tests/testthat/test-snic-puzzles.R')"

得:測出含過/敗/跳。

敗:

  • --vanilla;renv 需 .Rprofile
  • renv 誤→先 renv::restore()
  • 複命 Exit 5→寫至本檔

三:解果

求總行:

[ FAIL 0 | WARN 0 | SKIP 7 | PASS 2042 ]
  • PASS:成
  • FAIL:敗(須查)
  • SKIP:跳(常因缺可選包如 snic
  • WARN:警(察非阻)

得:總行解 PASS、FAIL、SKIP、WARN。FAIL = 0 為清。

敗:總行不見→測器或於完前崩。察上 R 級誤。出截→重定至檔:"$R_EXE" -e "devtools::test()" > test_results.txt 2>&1

四:查敗

若敗:

  1. 讀敗訊—含檔、行、期 vs 實
  2. 察新敗或舊存
  3. 斷敗→讀測與被測函
  4. 誤敗→查函簽改否
"$R_EXE" -e "testthat::test_file('tests/testthat/test-failing.R', reporter = 'summary')"

得:諸敗本因明。或為退(碼修)或為境問題(缺依、徑)。

敗:訊不明→測中加 browser()/print()testthat::test_file() 互動除。

五:驗跳因

跳於缺可選依為常:

  • snic 包測跳於 skip_if_not_installed("snic")
  • 特 OS 跳於 skip_on_os()
  • 僅 CRAN 跳於 skip_on_cran()

確跳因正當、非藏真敗。

得:諸跳有正因(可選不裝、平台、僅 CRAN)。無跳藏實敗。

敗:跳可疑→暫除 skip_if_*()、行測察過或露藏敗。

  • 諸測過(FAIL = 0)
  • 無非期警
  • 跳數合期(僅可選依跳)
  • 測數不減(無誤除)

  • --vanilla:破 renv 啟。jigsawR 永勿用
  • -e:殼義漏致 Exit 5。用本檔
  • 舊包態:改 NAMESPACE 影碼後先 devtools::load_all()devtools::document()
  • 缺測依:察 DESCRIPTION Suggests
  • 並測擾:序行用 testthat::test_file()

  • generate-puzzle
  • add-puzzle-type
  • write-testthat-tests
  • validate-piles-notation

Repositorio GitHub

pjt222/agent-almanac
Ruta: i18n/wenyan-ultra/skills/run-puzzle-tests
0
agentsagentskillsai-assisted-developmentclaude-codeskillsteams

Habilidades relacionadas

evaluating-llms-harness

Pruebas

Esta Skill de Claude ejecuta el benchmark lm-evaluation-harness para evaluar modelos de lenguaje en más de 60 tareas académicas estandarizadas como MMLU y GSM8K. Está diseñada para que los desarrolladores comparen la calidad de los modelos, realicen seguimiento del progreso del entrenamiento o reporten resultados académicos. La herramienta admite varios backends, incluidos modelos de HuggingFace y vLLM.

Ver habilidad

cloudflare-cron-triggers

Pruebas

Esta habilidad proporciona conocimiento integral para implementar Cron Triggers de Cloudflare y programar Workers mediante expresiones cron. Cubre la configuración de tareas periódicas, trabajos de mantenimiento y flujos de trabajo automatizados, manejando problemas comunes como expresiones cron inválidas y inconvenientes de zonas horarias. Los desarrolladores pueden utilizarla para configurar manejadores programados, probar activadores cron e integrar con Workflows y Green Compute.

Ver habilidad

webapp-testing

Pruebas

Esta habilidad de Claude proporciona un kit de herramientas basado en Playwright para probar aplicaciones web locales mediante scripts de Python. Permite verificación de frontend, depuración de interfaz de usuario, captura de pantallas y visualización de registros, mientras gestiona los ciclos de vida del servidor. Úsela para tareas de automatización de navegadores, pero ejecute los scripts directamente en lugar de leer su código fuente para evitar contaminación del contexto.

Ver habilidad

finishing-a-development-branch

Pruebas

Esta habilidad ayuda a los desarrolladores a completar el trabajo terminado verificando que las pruebas pasen y luego presentando opciones estructuradas de integración. Guía el flujo de trabajo para fusionar, crear PRs o limpiar ramas después de que se completa la implementación. Úsala cuando tu código esté listo y probado para finalizar sistemáticamente el proceso de desarrollo.

Ver habilidad