test-shiny-app
关于
This Claude Skill helps developers implement comprehensive testing for Shiny applications using shinytest2 for end-to-end browser testing and testServer() for unit testing module logic. It covers snapshot testing, CI integration, and external service mocking. Use it when adding tests to existing Shiny apps, establishing testing strategies for new projects, or integrating tests into CI/CD pipelines.
快速安装
Claude Code
推荐npx skills add pjt222/agent-almanac -a claude-code/plugin add https://github.com/pjt222/agent-almanacgit clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/test-shiny-app在 Claude Code 中复制并粘贴此命令以安装该技能
技能文档
name: test-shiny-app description: > 使用 shinytest2 进行端到端浏览器测试,以及使用 testServer() 对模块 server 逻辑进行单元测试。涵盖快照测试、CI 集成和外部服务模拟。适用于为现有 Shiny 应用添加测试、为新 Shiny 项目设置测试策略、在重构 Shiny 代码前编写回归测试, 或将 Shiny 应用测试集成到 CI/CD 流水线。 license: MIT allowed-tools: Read Write Edit Bash Grep Glob metadata: author: Philipp Thoss version: "1.0" domain: shiny complexity: intermediate language: R tags: shiny, testing, shinytest2, testServer, snapshot, CI locale: zh-CN source_locale: en source_commit: 6f65f316 translator: claude-opus-4-6 translation_date: 2026-03-16
测试 Shiny 应用
使用 shinytest2(端到端)和 testServer()(单元测试)为 Shiny 应用程序设置全面测试。
适用场景
- 为现有 Shiny 应用添加测试
- 为新 Shiny 项目设置测试策略
- 在重构 Shiny 代码前编写回归测试
- 将 Shiny 应用测试集成到 CI/CD 流水线
输入
- 必需:Shiny 应用路径
- 必需:测试范围(单元测试、端到端,或两者)
- 可选:是否使用快照测试(默认:端到端测试是)
- 可选:CI 平台(GitHub Actions、GitLab CI)
- 可选:要单独测试的模块
步骤
第 1 步:安装测试依赖项
install.packages("shinytest2")
# For golem apps, add as a Suggests dependency
usethis::use_package("shinytest2", type = "Suggests")
# Set up testthat infrastructure if not present
usethis::use_testthat(edition = 3)
预期结果: shinytest2 已安装,testthat 目录结构就绪。
失败处理: shinytest2 需要 chromote(无头 Chrome)。在系统上安装 Chrome/Chromium。WSL 上:sudo apt install -y chromium-browser。使用 chromote::find_chrome() 验证。
第 2 步:用 testServer() 为模块编写单元测试
创建 tests/testthat/test-mod_dashboard.R:
test_that("dashboard module filters data correctly", {
testServer(dataFilterServer, args = list(
data = reactive(iris),
columns = c("Species", "Sepal.Length")
), {
# Set inputs
session$setInputs(column = "Species")
session$setInputs(value_select = "setosa")
session$setInputs(apply = 1)
# Check output
result <- filtered()
expect_equal(nrow(result), 50)
expect_true(all(result$Species == "setosa"))
})
})
test_that("dashboard module handles empty data", {
testServer(dataFilterServer, args = list(
data = reactive(iris[0, ]),
columns = c("Species")
), {
# Module should not error on empty data
expect_no_error(session$setInputs(column = "Species"))
})
})
关键模式:
testServer()无需浏览器测试模块 server 逻辑- 通过
args列表传递响应式参数 - 使用
session$setInputs()模拟用户交互 - 直接按名称访问响应式返回值
- 测试边界情况:空数据、NULL 输入、无效值
预期结果: 模块测试通过 devtools::test()。
失败处理: 如果 testServer() 报错"不是模块 server 函数",确保函数内部使用了 moduleServer()。如果 session$setInputs() 没有触发响应式,在设置输入后添加 session$flushReact()。
第 3 步:编写 shinytest2 端到端测试
创建 tests/testthat/test-app-e2e.R:
test_that("app loads and displays initial state", {
# For golem apps
app <- AppDriver$new(
app_dir = system.file(package = "myapp"),
name = "initial-load",
height = 800,
width = 1200
)
on.exit(app$stop(), add = TRUE)
# Wait for app to load
app$wait_for_idle(timeout = 10000)
# Check that key elements exist
app$expect_values()
})
test_that("filter interaction updates the table", {
app <- AppDriver$new(
app_dir = system.file(package = "myapp"),
name = "filter-interaction"
)
on.exit(app$stop(), add = TRUE)
# Interact with the app
app$set_inputs(`filter1-column` = "cyl")
app$wait_for_idle()
app$set_inputs(`filter1-apply` = "click")
app$wait_for_idle()
# Snapshot the output values
app$expect_values(output = "table")
})
关键模式:
AppDriver$new()在无头 Chrome 中启动应用- 始终使用
on.exit(app$stop())进行清理 - 模块输入 ID 使用格式
"moduleId-inputId" app$expect_values()创建/比较快照文件app$wait_for_idle()确保响应式更新完成
预期结果: 端到端测试在 tests/testthat/_snaps/ 中创建快照文件。
失败处理: 如果找不到 Chrome,将 CHROMOTE_CHROME 环境变量设置为 Chrome 二进制文件路径。如果快照在 CI 上失败但本地通过,检查平台相关的渲染差异——使用 app$expect_values() 进行数据快照而非 app$expect_screenshot() 进行视觉快照。
第 4 步:交互式录制测试(可选)
shinytest2::record_test("path/to/app")
这会在带有录制面板的浏览器中打开应用。与应用交互,然后单击"保存测试"以自动生成测试代码。
预期结果: 在 tests/testthat/ 中生成包含录制交互的测试文件。
失败处理: 如果录制器未打开,先用 shiny::runApp() 确认应用能正常运行。录制器需要工作正常的应用。
第 5 步:设置快照管理
对于基于快照的测试,管理期望值:
# Accept new/changed snapshots after review
testthat::snapshot_accept("test-app-e2e")
# Review snapshot differences
testthat::snapshot_review("test-app-e2e")
将快照目录添加到版本控制:
tests/testthat/_snaps/ # Committed — contains expected values
预期结果: 快照文件在 git 中被跟踪,用于回归检测。
失败处理: 如果快照意外更改,运行 testthat::snapshot_review() 查看差异。使用 testthat::snapshot_accept() 接受有意更改。
第 6 步:与 CI 集成
添加到 .github/workflows/R-CMD-check.yaml 或创建专用工作流:
- name: Install system dependencies
run: |
sudo apt-get update
sudo apt-get install -y chromium-browser
- name: Set Chrome path
run: echo "CHROMOTE_CHROME=$(which chromium-browser)" >> $GITHUB_ENV
- name: Run tests
run: |
Rscript -e 'devtools::test()'
对于 golem 应用,确保在测试前安装应用包:
- name: Install app package
run: Rscript -e 'devtools::install()'
预期结果: 测试在 CI 上以无头 Chrome 通过。
失败处理: 常见 CI 问题:Chrome 未安装(添加 apt-get 步骤)、显示服务器缺失(shinytest2 默认使用无头模式,通常不是问题)、或慢速运行器上超时(增加 AppDriver$new() 中的 timeout)。
验证清单
-
devtools::test()运行所有测试无错误 - testServer() 测试覆盖模块 server 逻辑
- shinytest2 测试覆盖关键用户工作流
- 快照文件已提交到版本控制
- 测试在 CI 环境中通过
- 测试了边界情况(空数据、NULL 输入、错误状态)
常见问题
- 测试 UI 渲染而非逻辑:优先用
testServer()测试逻辑,用app$expect_values()测试数据。只在视觉外观重要时使用app$expect_screenshot()——截图在不同平台上易碎。 - 端到端测试中的模块 ID 格式:通过 AppDriver 设置模块输入时,使用
"moduleId-inputId"格式(连字符分隔),而非"moduleId.inputId"。 - 不稳定的时序:在
app$set_inputs()后始终调用app$wait_for_idle()。否则,断言可能在响应式更新完成前运行。 - 快照漂移:不要提交在不同平台(Mac vs Linux)上生成的快照。以 CI 平台为标准生成快照。
- CI 上缺少 Chrome:shinytest2 需要 Chrome/Chromium。在 CI 工作流中始终包含安装步骤。
相关技能
build-shiny-module— 创建具有清晰接口的可测试模块scaffold-shiny-app— 设置带测试基础设施的应用结构write-testthat-tests— R 包的通用 testthat 模式setup-github-actions-ci— R 包的 CI/CD 设置(golem 应用)
GitHub 仓库
相关推荐技能
evaluating-llms-harness
测试该Skill通过60+个学术基准测试(如MMLU、GSM8K等)评估大语言模型质量,适用于模型对比、学术研究及训练进度追踪。它支持HuggingFace、vLLM和API接口,被EleutherAI等行业领先机构广泛采用。开发者可通过简单命令行快速对模型进行多任务批量评估。
cloudflare-cron-triggers
测试这个Claude Skill提供了关于Cloudflare Cron Triggers的完整知识库,用于通过cron表达式定时执行Workers。它支持配置周期性任务、维护作业和自动化工作流,并能处理常见的cron触发错误。开发者可以用它来设置定时任务、测试cron处理器,并集成Workflows和Green Compute功能。
webapp-testing
测试该Skill为开发者提供了基于Playwright的本地Web应用测试工具集,支持自动化测试前端功能、调试UI行为、捕获屏幕截图和查看浏览器日志。它包含管理服务器生命周期的辅助脚本,可直接作为黑盒工具运行而无需阅读源码。适用于需要快速验证本地Web应用界面和交互功能的开发场景。
finishing-a-development-branch
测试这个Skill用于开发分支完成后的集成决策,当代码实现完成且测试通过时,它会引导开发者选择合适的工作流。它首先验证测试状态,然后提供合并、创建PR或清理等结构化选项。核心价值在于确保代码质量的同时,标准化分支收尾流程。
