run-puzzle-tests
について
このスキルは、WSL R実行環境を通じてjigsawRテストスイートを実行し、フルテスト、パターンフィルタリング、または単一ファイル実行をサポートします。テスト結果を解釈し、失敗を特定するとともに、renv依存関係を適切に処理します。コード変更後、コミット前、または特定のテスト失敗をデバッグする際に使用し、コード品質を維持します。
クイックインストール
Claude Code
推奨npx skills add pjt222/agent-almanac -a claude-code/plugin add https://github.com/pjt222/agent-almanacgit clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/run-puzzle-testsこのコマンドをClaude Codeにコピー&ペーストしてスキルをインストールします
ドキュメント
行拼測
行 jigsawR 測組釋果。
用
- 改 R 源後→用
- 增新拼類/功後→用
- 提前驗無破→用
- 除特測敗→用
入
- 必:測範(
full、filtered、single) - 可:濾式(
filtered模,如"snic"、"rectangular") - 可:特測檔徑(
single模)
行
一:擇範
| 範 | 用時 | 久 |
|---|---|---|
| 全 | 提前、大改後 | ~2-5 分 |
| 濾 | 一拼類工 | ~30 秒 |
| 單 | 除特測 | ~10 秒 |
得:按工選範—提前用全、特類用濾、除錯用單。
敗:未定→默全。久而捕跨類退。
二:建行測本
全組:
建本檔(如 /tmp/run_tests.R):
devtools::test()
R_EXE="/mnt/c/Program Files/R/R-4.5.0/bin/Rscript.exe"
cd /mnt/d/dev/p/jigsawR && "$R_EXE" -e "devtools::test()"
濾:
"$R_EXE" -e "devtools::test(filter = 'snic')"
單檔:
"$R_EXE" -e "testthat::test_file('tests/testthat/test-snic-puzzles.R')"
得:測出含過/敗/跳。
敗:
- 勿用
--vanilla;renv 需.Rprofile啟 - renv 誤→先
renv::restore() - 複命 Exit 5→寫至本檔
三:解果
求總行:
[ FAIL 0 | WARN 0 | SKIP 7 | PASS 2042 ]
- PASS:成
- FAIL:敗(須查)
- SKIP:跳(常因缺可選包如
snic) - WARN:警(察非阻)
得:總行解 PASS、FAIL、SKIP、WARN。FAIL = 0 為清。
敗:總行不見→測器或於完前崩。察上 R 級誤。出截→重定至檔:"$R_EXE" -e "devtools::test()" > test_results.txt 2>&1。
四:查敗
若敗:
- 讀敗訊—含檔、行、期 vs 實
- 察新敗或舊存
- 斷敗→讀測與被測函
- 誤敗→查函簽改否
"$R_EXE" -e "testthat::test_file('tests/testthat/test-failing.R', reporter = 'summary')"
得:諸敗本因明。或為退(碼修)或為境問題(缺依、徑)。
敗:訊不明→測中加 browser()/print()、testthat::test_file() 互動除。
五:驗跳因
跳於缺可選依為常:
snic包測跳於skip_if_not_installed("snic")- 特 OS 跳於
skip_on_os() - 僅 CRAN 跳於
skip_on_cran()
確跳因正當、非藏真敗。
得:諸跳有正因(可選不裝、平台、僅 CRAN)。無跳藏實敗。
敗:跳可疑→暫除 skip_if_*()、行測察過或露藏敗。
驗
- 諸測過(FAIL = 0)
- 無非期警
- 跳數合期(僅可選依跳)
- 測數不減(無誤除)
忌
- 用
--vanilla:破 renv 啟。jigsawR 永勿用 - 複
-e串:殼義漏致 Exit 5。用本檔 - 舊包態:改 NAMESPACE 影碼後先
devtools::load_all()或devtools::document() - 缺測依:察
DESCRIPTIONSuggests - 並測擾:序行用
testthat::test_file()
參
generate-puzzleadd-puzzle-typewrite-testthat-testsvalidate-piles-notation
GitHub リポジトリ
関連スキル
evaluating-llms-harness
テストこのClaudeスキルは、lm-evaluation-harnessを実行し、MMLUやGSM8Kなど60以上の標準化学術タスクでLLMをベンチマークします。開発者がモデルの品質を比較し、トレーニングの進捗を追跡し、学術的な結果を報告するために設計されています。このツールはHuggingFaceやvLLMモデルを含む様々なバックエンドをサポートしています。
cloudflare-cron-triggers
テストこのスキルは、cron式を使用してWorkersをスケジュールするためのCloudflare Cron Triggersの実装に関する包括的な知識を提供します。定期的なタスクの設定、メンテナンスジョブ、自動化されたワークフローの構築を網羅し、無効なcron式やタイムゾーン問題といった一般的な課題への対処法も含みます。開発者はこれを使用して、スケジュールされたハンドラーの設定、cronトリガーのテスト、WorkflowsやGreen Computeとの連携を構成できます。
webapp-testing
テストこのClaude Skillは、Playwrightベースのツールキットを提供し、Pythonスクリプトを通じてローカルWebアプリケーションのテストを可能にします。フロントエンドの検証、UIデバッグ、スクリーンショット撮影、ログ表示を実現し、サーバーライフサイクルを管理します。ブラウザ自動化タスクにご利用いただけますが、コンテキストの汚染を避けるため、スクリプトのソースコードを読むのではなく直接実行してください。
finishing-a-development-branch
テストこのスキルは、開発者がテストの合格を確認し、構造化された統合オプションを提示することで、完成した作業を仕上げることを支援します。実装が完了した後のマージ、PR作成、ブランチの整理といったワークフローを案内します。コードが準備できてテスト済みの際に使用し、開発プロセスを体系的に完了させましょう。
