MCP HubMCP Hub
Retour aux compétences

run-puzzle-tests

pjt222
Mis à jour 6 days ago
14 vues
17
2
17
Voir sur GitHub
Testsaitestingdesign

À propos

Cette compétence exécute la suite de tests jigsawR via l'exécution de R sous WSL, prenant en charge les tests complets, le filtrage par motif ou l'exécution de fichiers uniques. Elle interprète les résultats des tests et identifie les échecs tout en gérant correctement les dépendances renv. Utilisez-la après des modifications de code, avant des commits, ou lors du débogage d'échecs de tests spécifiques pour maintenir la qualité du code.

Installation rapide

Claude Code

Recommandé
Principal
npx skills add pjt222/agent-almanac -a claude-code
Commande PluginAlternatif
/plugin add https://github.com/pjt222/agent-almanac
Git CloneAlternatif
git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/run-puzzle-tests

Copiez et collez cette commande dans Claude Code pour installer cette compétence

Documentation

行拼測

行 jigsawR 測組釋果。

  • 改 R 源後→用
  • 增新拼類/功後→用
  • 提前驗無破→用
  • 除特測敗→用

  • :測範(fullfilteredsingle
  • :濾式(filtered 模,如 "snic""rectangular"
  • :特測檔徑(single 模)

一:擇範

用時
提前、大改後~2-5 分
一拼類工~30 秒
除特測~10 秒

得:按工選範—提前用全、特類用濾、除錯用單。

敗:未定→默全。久而捕跨類退。

二:建行測本

全組

建本檔(如 /tmp/run_tests.R):

devtools::test()
R_EXE="/mnt/c/Program Files/R/R-4.5.0/bin/Rscript.exe"
cd /mnt/d/dev/p/jigsawR && "$R_EXE" -e "devtools::test()"

"$R_EXE" -e "devtools::test(filter = 'snic')"

單檔

"$R_EXE" -e "testthat::test_file('tests/testthat/test-snic-puzzles.R')"

得:測出含過/敗/跳。

敗:

  • --vanilla;renv 需 .Rprofile
  • renv 誤→先 renv::restore()
  • 複命 Exit 5→寫至本檔

三:解果

求總行:

[ FAIL 0 | WARN 0 | SKIP 7 | PASS 2042 ]
  • PASS:成
  • FAIL:敗(須查)
  • SKIP:跳(常因缺可選包如 snic
  • WARN:警(察非阻)

得:總行解 PASS、FAIL、SKIP、WARN。FAIL = 0 為清。

敗:總行不見→測器或於完前崩。察上 R 級誤。出截→重定至檔:"$R_EXE" -e "devtools::test()" > test_results.txt 2>&1

四:查敗

若敗:

  1. 讀敗訊—含檔、行、期 vs 實
  2. 察新敗或舊存
  3. 斷敗→讀測與被測函
  4. 誤敗→查函簽改否
"$R_EXE" -e "testthat::test_file('tests/testthat/test-failing.R', reporter = 'summary')"

得:諸敗本因明。或為退(碼修)或為境問題(缺依、徑)。

敗:訊不明→測中加 browser()/print()testthat::test_file() 互動除。

五:驗跳因

跳於缺可選依為常:

  • snic 包測跳於 skip_if_not_installed("snic")
  • 特 OS 跳於 skip_on_os()
  • 僅 CRAN 跳於 skip_on_cran()

確跳因正當、非藏真敗。

得:諸跳有正因(可選不裝、平台、僅 CRAN)。無跳藏實敗。

敗:跳可疑→暫除 skip_if_*()、行測察過或露藏敗。

  • 諸測過(FAIL = 0)
  • 無非期警
  • 跳數合期(僅可選依跳)
  • 測數不減(無誤除)

  • --vanilla:破 renv 啟。jigsawR 永勿用
  • -e:殼義漏致 Exit 5。用本檔
  • 舊包態:改 NAMESPACE 影碼後先 devtools::load_all()devtools::document()
  • 缺測依:察 DESCRIPTION Suggests
  • 並測擾:序行用 testthat::test_file()

  • generate-puzzle
  • add-puzzle-type
  • write-testthat-tests
  • validate-piles-notation

Dépôt GitHub

pjt222/agent-almanac
Chemin: i18n/wenyan-ultra/skills/run-puzzle-tests
0
agentsagentskillsai-assisted-developmentclaude-codeskillsteams

Compétences associées

evaluating-llms-harness

Tests

Cette compétence Claude exécute le lm-evaluation-harness pour évaluer les modèles de langage sur plus de 60 tâches académiques standardisées telles que MMLU et GSM8K. Elle est conçue pour permettre aux développeurs de comparer la qualité des modèles, de suivre les progrès de l'entraînement ou de rapporter des résultats académiques. L'outil prend en charge différents backends, incluant les modèles HuggingFace et vLLM.

Voir la compétence

cloudflare-cron-triggers

Tests

Cette compétence fournit une connaissance complète pour la mise en œuvre de Déclencheurs Cron Cloudflare afin de planifier des Workers à l'aide d'expressions cron. Elle couvre la configuration de tâches périodiques, de travaux de maintenance et de flux de travail automatisés, tout en traitant des problèmes courants tels que les expressions cron non valides et les problèmes de fuseau horaire. Les développeurs peuvent l'utiliser pour configurer des gestionnaires planifiés, tester des déclencheurs cron et intégrer avec Workflows et Green Compute.

Voir la compétence

webapp-testing

Tests

Cette Compétence Claude fournit une boîte à outils basée sur Playwright pour tester des applications web locales via des scripts Python. Elle permet la vérification frontend, le débogage d'interface utilisateur, la capture d'écrans et la consultation des journaux, tout en gérant les cycles de vie du serveur. Utilisez-la pour les tâches d'automatisation de navigateur, mais exécutez les scripts directement plutôt que de lire leur code source pour éviter la pollution du contexte.

Voir la compétence

finishing-a-development-branch

Tests

Cette compétence aide les développeurs à finaliser leur travail en vérifiant que les tests passent, puis en présentant des options d'intégration structurées. Elle guide le processus de fusion, de création de PRs ou de nettoyage des branches une fois l'implémentation terminée. Utilisez-la lorsque votre code est prêt et testé pour finaliser systématiquement le cycle de développement.

Voir la compétence