SKILL·195DB7

run-puzzle-tests

Name: run-puzzle-tests
Author: pjt222

pjt222

Обновлено 1 month ago

9 просмотров

Тестированиеaitestingdesign

О программе

Этот навык запускает набор тестов jigsawR через выполнение R в WSL, поддерживая полные тесты, фильтрацию по шаблонам или запуск отдельных файлов. Он интерпретирует результаты прохождения/сбоя/пропуска и выявляет неудачи, избегая флага --vanilla для корректной активации renv. Разработчикам следует использовать его после изменений кода, перед коммитами или при отладке конкретных сбоев тестов.

Быстрая установка

Claude Code

Рекомендуется

Основной

npx skills add pjt222/agent-almanac -a claude-code

Команда плагинаАльтернативный

/plugin add https://github.com/pjt222/agent-almanac

Git клонированиеАльтернативный

git clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/run-puzzle-tests

Скопируйте и вставьте эту команду в Claude Code для установки этого навыка

Документация

Run Puzzle Tests

Run jigsawR test suite. Read results.

When Use

After modifying R source in package
After adding new puzzle type or feature
Before commit to verify nothing broken
Debugging specific test failure

Inputs

Required: Test scope (full, filtered, single)
Optional: Filter pattern (filtered mode, e.g. "snic", "rectangular")
Optional: Specific test file path (single mode)

Steps

Step 1: Choose Test Scope

Scope	Use when	Duration
Full	Before commits, after major changes	~2-5 min
Filtered	Working on one puzzle type	~30s
Single	Debugging a specific test file	~10s

Got: Scope selected by workflow: full before commits, filtered for one type, single for one debug.

If fail: Unsure? Default to full. Slower but catches cross-type regressions.

Step 2: Create and Execute Test Script

Full suite.

Make script (e.g., /tmp/run_tests.R).

devtools::test()

R_EXE="/mnt/c/Program Files/R/R-4.5.0/bin/Rscript.exe"
cd /mnt/d/dev/p/jigsawR && "$R_EXE" -e "devtools::test()"

Filtered by pattern.

"$R_EXE" -e "devtools::test(filter = 'snic')"

Single file.

"$R_EXE" -e "testthat::test_file('tests/testthat/test-snic-puzzles.R')"

Got: Test output with pass/fail/skip counts.

If fail:

Do NOT use --vanilla flag; renv needs .Rprofile to activate
renv errors? Run renv::restore() first
Complex commands fail with Exit 5? Write to script file

Step 3: Interpret Results

Look for summary line.

[ FAIL 0 | WARN 0 | SKIP 7 | PASS 2042 ]

PASS: Tests succeeded
FAIL: Tests failed (need investigation)
SKIP: Tests skipped (usually missing optional packages like snic)
WARN: Warnings during tests (review but not blocking)

Got: Summary line parsed for PASS, FAIL, SKIP, WARN. FAIL = 0 = clean run.

If fail: Summary not visible? Runner crashed before completing. Check R-level errors above. Output truncated? Redirect to file: "$R_EXE" -e "devtools::test()" > test_results.txt 2>&1.

Step 4: Investigate Failures

If tests fail.

Read failure msg — includes file, line, expected vs actual
Check if new failure or pre-existing
Assertion failures: read test + function being tested
Error failures: check function signature changed

# Run just the failing test with verbose output
"$R_EXE" -e "testthat::test_file('tests/testthat/test-failing.R', reporter = 'summary')"

Got: Root cause of each failing test identified. Failure = real regression (fix code) or test env issue (missing dep, path).

If fail: Failure msg unclear? Add browser() or print() to test, re-run with testthat::test_file() for interactive debug.

Step 5: Verify Skip Reasons

Skipped tests normal when optional deps missing.

snic package tests skip with skip_if_not_installed("snic")
Tests needing specific OS skip with skip_on_os()
CRAN-only skips with skip_on_cran()

Confirm skip reasons legitimate, not masking real failures.

Got: All skips accounted for by legitimate reasons (optional dep, platform skip, CRAN-only). No skips masking actual failures.

If fail: Skip suspicious? Temporarily remove skip_if_*() and run test to see pass or hidden failure.

Checks

All tests pass (FAIL = 0)
No unexpected warnings
Skip count matches expected (only optional dep skips)
Test count not decreased (no tests removed by accident)

Pitfalls

Use --vanilla: Breaks renv activation. Never with jigsawR.
Complex -e strings: Shell escaping = Exit 5. Use script files.
Stale package state: Run devtools::load_all() or devtools::document() before testing if NAMESPACE-affecting code changed.
Missing test deps: Some tests need suggested packages. Check DESCRIPTION Suggests.
Parallel test issues: Tests interfere? Run sequential with testthat::test_file().

GitHub репозиторий

pjt222/agent-almanac

Путь: i18n/caveman/skills/run-puzzle-tests

agentsagentskillsai-assisted-developmentclaude-codeskillsteams

FAQ

Frequently asked questions

What is the run-puzzle-tests skill?

run-puzzle-tests is a Claude Skill by pjt222. Skills package instructions and resources that Claude loads on demand, so Claude can perform run-puzzle-tests-related tasks without extra prompting.

How do I install run-puzzle-tests?

Use the install commands on this page: add run-puzzle-tests to Claude Code as a plugin, or clone its repository into your skills directory, then restart Claude so it picks up the skill.

What category does run-puzzle-tests belong to?

run-puzzle-tests is in the Testing category, tagged ai, testing and design.

Is run-puzzle-tests free to use?

Yes. run-puzzle-tests is listed on AIMCP and free to install. It runs inside Claude, so no separate service account is required to use the skill itself.

Похожие навыки

evaluating-llms-harness

Тестирование

Этот навык Claude запускает lm-evaluation-harness для тестирования LLM на более чем 60 стандартизированных академических задачах, таких как MMLU и GSM8K. Он предназначен для разработчиков, чтобы сравнивать качество моделей, отслеживать прогресс обучения или сообщать академические результаты. Инструмент поддерживает различные бэкенды, включая модели HuggingFace и vLLM.

Просмотреть навык

cloudflare-cron-triggers

Тестирование

Этот навык предоставляет обширные знания по реализации Cloudflare Cron Triggers для планирования запуска Workers с помощью cron-выражений. Он охватывает настройку периодических задач, заданий технического обслуживания и автоматизированных рабочих процессов, а также решение распространенных проблем, таких как неверные cron-выражения и ошибки часовых поясов. Разработчики могут использовать его для настройки планировщиков обработчиков, тестирования cron-триггеров и интеграции с Workflows и Green Compute.

Просмотреть навык

webapp-testing

Тестирование

Этот навык Claude предоставляет инструментарий на базе Playwright для тестирования локальных веб-приложений с помощью Python-скриптов. Он позволяет проводить проверку фронтенда, отладку интерфейса, создание скриншотов и просмотр логов, одновременно управляя жизненным циклом сервера. Используйте его для задач автоматизации браузера, но запускайте скрипты напрямую, вместо чтения их исходного кода, чтобы избежать загрязнения контекста.

Просмотреть навык

finishing-a-development-branch

Тестирование

Этот навык помогает разработчикам завершать готовую работу, проверяя прохождение тестов и предлагая структурированные варианты интеграции. Он направляет рабочий процесс по слиянию, созданию пул-реквестов или очистке веток после завершения реализации. Используйте его, когда ваш код готов и протестирован, чтобы систематически завершать процесс разработки.

Просмотреть навык

run-puzzle-tests

О программе

Быстрая установка

Claude Code

Документация

Run Puzzle Tests

When Use

Inputs

Steps

Step 1: Choose Test Scope

Step 2: Create and Execute Test Script

Step 3: Interpret Results

Step 4: Investigate Failures

Step 5: Verify Skip Reasons

Checks

Pitfalls

See Also

GitHub репозиторий

Frequently asked questions

What is the run-puzzle-tests skill?

How do I install run-puzzle-tests?

What category does run-puzzle-tests belong to?

Is run-puzzle-tests free to use?

Похожие навыки