Validez (Interna y Externa)
Definición
Validez se refiere a la precisión y confiabilidad de las conclusiones extraídas de los datos de evaluación. Tiene dos dimensiones distintas que los profesionales deben considerar por separado:
Validez interna pregunta: ¿El programa realmente causó los resultados observados? Se trata de establecer una inferencia causal creíble — descartar explicaciones alternativas como el sesgo de selección, maduración, o eventos externos que podrían haber producido los mismos resultados. Una alta validez interna significa que puedes atribuir con confianza el cambio a tu intervención en lugar de factores de confusión.
Validez externa pregunta: ¿Pueden estos hallazgos generalizarse más allá de este estudio específico? Esto concierne la aplicabilidad de los resultados a otros contextos, poblaciones, o periodos de tiempo. Un estudio con alta validez externa produce conocimientos que permanecen útiles incluso cuando las condiciones del programa difieren del entorno de evaluación.
Estas dimensiones a menudo se compensan entre sí — estudios estrictamente controlados maximizan la validez interna pero pueden limitar la generalizabilidad, mientras que las implementaciones del mundo real ofrecen conocimientos contextuales más ricos a costa de la claridad causal.
Por Qué Importa
La validez es la base de un M&E creíble. Sin ella, no puedes distinguir el éxito del programa de la coincidencia, ni puedes aprender lecciones que apliquen más allá de tu caso específico. Los profesionales enfrentan preocupaciones sobre la validez siempre que hacen afirmaciones causales — "nuestra capacitación mejoró las habilidades" o "la intervención redujo las tasas de deserción" — y estas afirmaciones impulsan decisiones de financiamiento, adaptaciones del programa y aprendizaje organizacional.
Una mala validez conduce a errores costosos: escalar programas que no funcionan, abandonar intervenciones que sí, o mal asignar recursos basados en correlaciones espurias. Por el contrario, la atención explícita a la validez fortalece el diseño de evaluación, aclara lo que se puede reclamar razonablemente, y construye la confianza de las partes interesadas en los hallazgos. Para evaluaciones de impacto y diseños cuasi-experimentales, la validez es el criterio de calidad principal — sin ella, la evaluación no puede cumplir su propósito.
En La Práctica
Amenazas a la validez interna incluyen:
- Sesgo de selección — los grupos de comparación difieren sistemáticamente antes de la intervención
- Historia — eventos externos coincidentes con el programa influyen en los resultados
- Maduración — cambios naturales con el tiempo confundidos como efectos del programa
- Efectos de prueba — la exposición previa a la prueba influye en las respuestas posteriores
- Instrumentación — cambios de medición con el tiempo crean efectos artificiales
Abordar esto requiere un diseño cuidadoso: aleatorización (cuando sea factible), grupos de comparación emparejados, mediciones pre-post, y controles estadísticos para factores de confusión.
Amenazas a la validez externa incluyen:
- Representatividad de la muestra — los participantes del estudio difieren de la población objetivo
- Especificidad contextual — los resultados dependen de condiciones locales únicas
- Limitaciones temporales — los hallazgos aplican solo a periodos de tiempo específicos
- Fidelidad de la implementación — el programa entregado de manera diferente a lo previsto
Fortalecer la validez externa implica muestreo intencional, documentar condiciones contextuales, probar en múltiples sitios, y ser explícito sobre las condiciones límite para la generalización.
En evaluaciones de impacto (P15), la validez interna es primordial — el estudio debe establecer causalidad antes de preguntar si se generaliza. En diseños cuasi-experimentales (P14), los profesionales usan técnicas como emparejamiento de puntaje de propensión o diferencia-en-diferencias para aproximar la aleatorización y fortalecer las afirmaciones causales. En todo momento, evaluación de calidad de datos asegura que la confiabilidad de la medición apoye la validez — los datos no confiables no pueden ser válidos.
Temas Relacionados
- Fiabilidad — consistencia de medición, un prerrequisito para la validez
- Diseño Cuasi-Experimental — métodos para establecer inferencia causal
- Evaluación de Impacto — donde la validez es la preocupación principal
- Evaluación de Calidad de Datos — asegurando la precisión de la medición
- Sesgo — errores sistemáticos que amenazan la validez
- Contrafactual — la comparación necesaria para las afirmaciones causales
Lecturas Adicionales
- Shadish, Cook, & Campbell (2002). Diseños Experimentales y Cuasi-Experimentales para la Inferencia Causal Generalizada. Houghton Mifflin. El texto definitivo sobre amenazas de validez y soluciones de diseño.
- OECD-DAC (2019). Orientación sobre el Uso de los Criterios del CAD para Evaluación. Cubre consideraciones de validez dentro de los estándares de calidad de evaluación.
- USAID (2020). Política y Orientación de Evaluación. Incluye requisitos de validez para evaluaciones de impacto.