test-shiny-app
Über
Diese Fähigkeit unterstützt Entwickler beim Testen von Shiny-Anwendungen durch Verwendung von shinytest2 für End-to-End-Browser-Tests und testServer() für Unit-Tests der Serverlogik. Sie behandelt Snapshot-Tests, CI-Integration und das Mocken externer Dienste. Nutzen Sie sie beim Hinzufügen von Tests zu bestehenden Shiny-Apps, beim Aufbau von Teststrategien für neue Projekte oder bei der Integration von Tests in CI/CD-Pipelines.
Schnellinstallation
Claude Code
Empfohlennpx skills add pjt222/agent-almanac -a claude-code/plugin add https://github.com/pjt222/agent-almanacgit clone https://github.com/pjt222/agent-almanac.git ~/.claude/skills/test-shiny-appKopieren Sie diesen Befehl und fügen Sie ihn in Claude Code ein, um diese Fähigkeit zu installieren
Dokumentation
name: test-shiny-app description: > Probar aplicaciones Shiny usando shinytest2 para tests de navegador de extremo a extremo y testServer() para tests unitarios de la lógica del server de módulos. Cubre pruebas de snapshot, integración con CI y simulación de servicios externos. Úsalo al añadir tests a una aplicación Shiny existente, al configurar una estrategia de tests para un nuevo proyecto Shiny, al escribir tests de regresión antes de refactorizar código Shiny, o al integrar tests de apps Shiny en pipelines CI/CD. locale: es source_locale: en source_commit: 6f65f316 translator: claude-opus-4-6 translation_date: 2026-03-16 license: MIT allowed-tools: Read Write Edit Bash Grep Glob metadata: author: Philipp Thoss version: "1.0" domain: shiny complexity: intermediate language: R tags: shiny, testing, shinytest2, testServer, snapshot, CI
Test Shiny App
Configurar tests completos para aplicaciones Shiny usando shinytest2 (extremo a extremo) y testServer() (tests unitarios).
Cuándo Usar
- Al añadir tests a una aplicación Shiny existente
- Al configurar una estrategia de tests para un nuevo proyecto Shiny
- Al escribir tests de regresión antes de refactorizar código Shiny
- Al integrar tests de apps Shiny en pipelines CI/CD
Entradas
- Requerido: Ruta a la aplicación Shiny
- Requerido: Alcance de los tests (tests unitarios, extremo a extremo, o ambos)
- Opcional: Si usar tests de snapshot (predeterminado: sí para e2e)
- Opcional: Plataforma CI (GitHub Actions, GitLab CI)
- Opcional: Módulos a probar en aislamiento
Procedimiento
Paso 1: Instalar las Dependencias de Test
install.packages("shinytest2")
# Para apps golem, añadir como dependencia de Suggests
usethis::use_package("shinytest2", type = "Suggests")
# Configurar infraestructura testthat si no está presente
usethis::use_testthat(edition = 3)
Esperado: shinytest2 instalado y estructura de directorios testthat en su lugar.
En caso de fallo: shinytest2 requiere chromote (Chrome sin cabeza). Instala Chrome/Chromium en el sistema. En WSL: sudo apt install -y chromium-browser. Verifica con chromote::find_chrome().
Paso 2: Escribir Tests Unitarios testServer() para Módulos
Crea tests/testthat/test-mod_dashboard.R:
test_that("dashboard module filters data correctly", {
testServer(dataFilterServer, args = list(
data = reactive(iris),
columns = c("Species", "Sepal.Length")
), {
# Establecer entradas
session$setInputs(column = "Species")
session$setInputs(value_select = "setosa")
session$setInputs(apply = 1)
# Verificar salida
result <- filtered()
expect_equal(nrow(result), 50)
expect_true(all(result$Species == "setosa"))
})
})
test_that("dashboard module handles empty data", {
testServer(dataFilterServer, args = list(
data = reactive(iris[0, ]),
columns = c("Species")
), {
# El módulo no debe dar error con datos vacíos
expect_no_error(session$setInputs(column = "Species"))
})
})
Patrones clave:
testServer()prueba la lógica del server del módulo sin un navegador- Pasa argumentos reactivos a través de la lista
args - Usa
session$setInputs()para simular interacciones del usuario - Accede a los valores de retorno reactivos directamente por nombre
- Prueba casos extremos: datos vacíos, entradas NULL, valores inválidos
Esperado: Los tests del módulo pasan con devtools::test().
En caso de fallo: Si testServer() da error con "not a module server function", asegúrate de que la función use moduleServer() internamente. Si session$setInputs() no activa los reactivos, añade session$flushReact() después de establecer las entradas.
Paso 3: Escribir Tests de Extremo a Extremo con shinytest2
Crea tests/testthat/test-app-e2e.R:
test_that("app loads and displays initial state", {
# Para apps golem
app <- AppDriver$new(
app_dir = system.file(package = "myapp"),
name = "initial-load",
height = 800,
width = 1200
)
on.exit(app$stop(), add = TRUE)
# Esperar a que la app cargue
app$wait_for_idle(timeout = 10000)
# Verificar que los elementos clave existen
app$expect_values()
})
test_that("filter interaction updates the table", {
app <- AppDriver$new(
app_dir = system.file(package = "myapp"),
name = "filter-interaction"
)
on.exit(app$stop(), add = TRUE)
# Interactuar con la app
app$set_inputs(`filter1-column` = "cyl")
app$wait_for_idle()
app$set_inputs(`filter1-apply` = "click")
app$wait_for_idle()
# Tomar snapshot de los valores de salida
app$expect_values(output = "table")
})
Patrones clave:
AppDriver$new()lanza la app en Chrome sin cabeza- Siempre usa
on.exit(app$stop())para limpiar - Los IDs de entrada del módulo usan el formato
"moduleId-inputId" app$expect_values()crea/compara archivos de snapshotapp$wait_for_idle()garantiza que las actualizaciones reactivas completen
Esperado: Los tests de extremo a extremo crean archivos de snapshot en tests/testthat/_snaps/.
En caso de fallo: Si Chrome no se encuentra, establece la variable de entorno CHROMOTE_CHROME a la ruta del binario de Chrome. Si los snapshots fallan en CI pero pasan en local, verifica las diferencias de renderizado dependientes de la plataforma — usa app$expect_values() para snapshots de datos en lugar de app$expect_screenshot() para snapshots visuales.
Paso 4: Grabar un Test de Forma Interactiva (Opcional)
shinytest2::record_test("path/to/app")
Esto abre la app en un navegador con un panel de grabación. Interactúa con la app, luego haz clic en "Save test" para generar automáticamente el código del test.
Esperado: Un archivo de test generado en tests/testthat/ con las interacciones grabadas.
En caso de fallo: Si la grabadora no abre, verifica que la app se ejecute exitosamente con shiny::runApp() primero. La grabadora requiere una app funcional.
Paso 5: Configurar la Gestión de Snapshots
Para tests basados en snapshots, gestiona los valores esperados:
# Aceptar snapshots nuevos/modificados después de revisión
testthat::snapshot_accept("test-app-e2e")
# Revisar diferencias en snapshots
testthat::snapshot_review("test-app-e2e")
Añade los directorios de snapshots al control de versiones:
tests/testthat/_snaps/ # Confirmado — contiene los valores esperados
Esperado: Archivos de snapshot rastreados en git para detección de regresiones.
En caso de fallo: Si los snapshots cambian inesperadamente, ejecuta testthat::snapshot_review() para ver las diferencias. Acepta los cambios intencionales con testthat::snapshot_accept().
Paso 6: Integrar con CI
Añade a .github/workflows/R-CMD-check.yaml o crea un workflow dedicado:
- name: Install system dependencies
run: |
sudo apt-get update
sudo apt-get install -y chromium-browser
- name: Set Chrome path
run: echo "CHROMOTE_CHROME=$(which chromium-browser)" >> $GITHUB_ENV
- name: Run tests
run: |
Rscript -e 'devtools::test()'
Para apps golem, asegúrate de que el paquete de la app esté instalado antes de las pruebas:
- name: Install app package
run: Rscript -e 'devtools::install()'
Esperado: Los tests pasan en CI con Chrome sin cabeza.
En caso de fallo: Problemas comunes de CI: Chrome no instalado (añade el paso apt-get), servidor de visualización faltante (shinytest2 usa modo sin cabeza por defecto, por lo que normalmente no es un problema), o tiempo de espera excedido en runners lentos (aumenta timeout en AppDriver$new()).
Validación
-
devtools::test()ejecuta todos los tests sin errores - Los tests testServer() cubren la lógica del server del módulo
- Los tests shinytest2 cubren los flujos de trabajo clave del usuario
- Los archivos de snapshot están confirmados en el control de versiones
- Los tests pasan en el entorno CI
- Se prueban los casos extremos (datos vacíos, entradas NULL, estados de error)
Errores Comunes
- Probar el renderizado de UI en lugar de la lógica: Prefiere
testServer()para la lógica yapp$expect_values()para los datos. Solo usaapp$expect_screenshot()cuando la apariencia visual importa — los screenshots son frágiles entre plataformas. - Formato de ID del módulo en tests e2e: Al establecer entradas de módulo via AppDriver, usa el formato
"moduleId-inputId"(separado por guión), no"moduleId.inputId". - Tiempos frágiles: Siempre llama a
app$wait_for_idle()después deapp$set_inputs(). Sin esto, las aserciones pueden ejecutarse antes de que las actualizaciones reactivas completen. - Deriva de snapshots: No confirmes snapshots generados en diferentes plataformas (Mac vs Linux). Estandariza en la plataforma CI para la generación de snapshots.
- Chrome faltante en CI: shinytest2 requiere Chrome/Chromium. Siempre incluye el paso de instalación en los workflows CI.
Habilidades Relacionadas
build-shiny-module— crear módulos comprobables con interfaces clarasscaffold-shiny-app— configurar la estructura de la app con infraestructura de testswrite-testthat-tests— patrones generales de testthat para paquetes Rsetup-github-actions-ci— configuración CI/CD para paquetes R (apps golem)
GitHub Repository
Verwandte Skills
evaluating-llms-harness
TestenDiese Claude Skill führt den lm-evaluation-harness aus, um LLMs über 60+ standardisierte akademische Aufgaben wie MMLU und GSM8K zu benchmarken. Sie wurde für Entwickler entwickelt, um Modellqualität zu vergleichen, Trainingsfortschritt zu verfolgen oder akademische Ergebnisse zu berichten. Das Tool unterstützt verschiedene Backends, einschließlich HuggingFace- und vLLM-Modelle.
cloudflare-cron-triggers
TestenDiese Fähigkeit bietet umfassendes Wissen zur Implementierung von Cloudflare Cron Triggers, um Workers mithilfe von Cron-Ausdrücken zu planen. Sie behandelt das Einrichten periodischer Aufgaben, Wartungsjobs und automatisierter Workflows, während häufige Probleme wie ungültige Cron-Ausdrücke und Zeitzonenprobleme behandelt werden. Entwickler können sie zum Konfigurieren geplanter Handler, zum Testen von Cron-Triggers und zur Integration mit Workflows und Green Compute verwenden.
webapp-testing
TestenDiese Claude Skill bietet ein Playwright-basiertes Toolkit zum Testen lokaler Webanwendungen durch Python-Skripte. Es ermöglicht Frontend-Verifizierung, UI-Debugging, Screenshot-Aufnahme und Log-Einblick bei gleichzeitiger Verwaltung von Server-Lebenszyklen. Nutzen Sie es für Browser-Automatisierungsaufgaben, führen Sie Skripte jedoch direkt aus, anstatt deren Quellcode zu lesen, um Kontextverschmutzung zu vermeiden.
finishing-a-development-branch
TestenDiese Fähigkeit unterstützt Entwickler dabei, abgeschlossene Arbeiten zu finalisieren, indem sie testet, ob Tests bestehen, und dann strukturierte Integrationsoptionen präsentiert. Sie leitet den Workflow für das Zusammenführen von Code, das Erstellen von PRs oder das Bereinigen von Branches nach Abschluss der Implementierung. Nutzen Sie sie, wenn Ihr Code bereit und getestet ist, um den Entwicklungsprozess systematisch abzuschließen.
