MCP HubMCP Hub
Volver a habilidades

define-hypothesis

product-on-purpose
Actualizado 2 days ago
6 vistas
238
33
238
Ver en GitHub
Pruebastestingdesign

Acerca de

La habilidad define-hypothesis crea predicciones comprobables con métricas de éxito claras y un enfoque de validación, transformando suposiciones en declaraciones explícitas para la experimentación. Se utiliza después de enmarcar el problema y antes de comprometerse con una solución, ayudando a los equipos a alinearse sobre cómo se ve el éxito. Esto evita construir funcionalidades basadas en creencias no probadas y es ideal para diseñar experimentos o pruebas A/B.

Instalación rápida

Claude Code

Recomendado
Principal
npx skills add product-on-purpose/pm-skills -a claude-code
Comando PluginAlternativo
/plugin add https://github.com/product-on-purpose/pm-skills
Git CloneAlternativo
git clone https://github.com/product-on-purpose/pm-skills.git ~/.claude/skills/define-hypothesis

Copia y pega este comando en Claude Code para instalar esta habilidad

Documentación

<!-- PM-Skills | https://github.com/product-on-purpose/pm-skills | Apache 2.0 -->

Hypothesis

A hypothesis is a testable prediction about how a change will affect user behavior or business outcomes. It transforms assumptions into explicit statements that can be validated or invalidated through experimentation. Well-formed hypotheses prevent teams from building features based on untested beliefs and create shared understanding of what success looks like.

When to Use

  • After problem framing, before committing to a solution
  • When designing experiments or A/B tests
  • When team members have differing assumptions about user behavior
  • Before investing significant engineering resources in a feature
  • When pivoting direction and need to validate the new approach

Instructions

When asked to create a hypothesis, follow these steps:

  1. State the Belief Articulate what you believe will happen. Use the structured format: "We believe that [action/change] for [target user] will [expected outcome]." Be specific about the intervention . vague hypotheses can't be tested.

  2. Identify the Target User Define who this hypothesis applies to. A hypothesis about "users" is too broad. Specify the segment: new users in their first week, power users with 10+ sessions, churned users returning, etc.

  3. Define the Expected Outcome What behavior change or result do you expect? Frame it in terms of user actions (complete onboarding, make a purchase, return within 7 days) rather than internal metrics when possible.

  4. Set Success Metrics Choose a primary metric that directly measures the expected outcome. Include secondary metrics that provide context and guardrail metrics that ensure you're not causing harm elsewhere.

  5. Describe Validation Approach How will you test this hypothesis? A/B test, user interviews, prototype testing, cohort analysis? Be specific about sample size, duration, and statistical requirements.

  6. Document Risks and Assumptions What could invalidate this hypothesis beyond the test results? What are you assuming to be true that you haven't validated?

Output Format

Use the template in references/TEMPLATE.md to structure the output.

Quality Checklist

Before finalizing, verify:

  • Hypothesis is falsifiable (possible to prove wrong)
  • Success metric has a specific numeric target
  • Target user segment is clearly defined
  • Validation approach is practical and time-bound
  • Pass/fail criteria are unambiguous
  • Hypothesis doesn't assume the solution works

Examples

See references/EXAMPLE.md for a completed example.

Repositorio GitHub

product-on-purpose/pm-skills
Ruta: skills/define-hypothesis
0
agent-skillsai-skillsclaude-codeclaude-desktopdesign-sprintfoundation-sprint

Habilidades relacionadas

evaluating-llms-harness

Pruebas

Esta Skill de Claude ejecuta el benchmark lm-evaluation-harness para evaluar modelos de lenguaje en más de 60 tareas académicas estandarizadas como MMLU y GSM8K. Está diseñada para que los desarrolladores comparen la calidad de los modelos, realicen seguimiento del progreso del entrenamiento o reporten resultados académicos. La herramienta admite varios backends, incluidos modelos de HuggingFace y vLLM.

Ver habilidad

cloudflare-cron-triggers

Pruebas

Esta habilidad proporciona conocimiento integral para implementar Cron Triggers de Cloudflare y programar Workers mediante expresiones cron. Cubre la configuración de tareas periódicas, trabajos de mantenimiento y flujos de trabajo automatizados, manejando problemas comunes como expresiones cron inválidas y inconvenientes de zonas horarias. Los desarrolladores pueden utilizarla para configurar manejadores programados, probar activadores cron e integrar con Workflows y Green Compute.

Ver habilidad

webapp-testing

Pruebas

Esta habilidad de Claude proporciona un kit de herramientas basado en Playwright para probar aplicaciones web locales mediante scripts de Python. Permite verificación de frontend, depuración de interfaz de usuario, captura de pantallas y visualización de registros, mientras gestiona los ciclos de vida del servidor. Úsela para tareas de automatización de navegadores, pero ejecute los scripts directamente en lugar de leer su código fuente para evitar contaminación del contexto.

Ver habilidad

finishing-a-development-branch

Pruebas

Esta habilidad ayuda a los desarrolladores a completar el trabajo terminado verificando que las pruebas pasen y luego presentando opciones estructuradas de integración. Guía el flujo de trabajo para fusionar, crear PRs o limpiar ramas después de que se completa la implementación. Úsala cuando tu código esté listo y probado para finalizar sistemáticamente el proceso de desarrollo.

Ver habilidad