Validez (Interna y Externa)

Definición

Validez se refiere a la precisión y confiabilidad de las conclusiones extraídas de los datos de evaluación. Tiene dos dimensiones distintas que los profesionales deben considerar por separado:

Validez interna pregunta: ¿El programa realmente causó los resultados observados? Se trata de establecer una inferencia causal creíble — descartar explicaciones alternativas como el sesgo de selección, maduración, o eventos externos que podrían haber producido los mismos resultados. Una alta validez interna significa que puedes atribuir con confianza el cambio a tu intervención en lugar de factores de confusión.

Validez externa pregunta: ¿Pueden estos hallazgos generalizarse más allá de este estudio específico? Esto concierne la aplicabilidad de los resultados a otros contextos, poblaciones, o periodos de tiempo. Un estudio con alta validez externa produce conocimientos que permanecen útiles incluso cuando las condiciones del programa difieren del entorno de evaluación.

Estas dimensiones a menudo se compensan entre sí — estudios estrictamente controlados maximizan la validez interna pero pueden limitar la generalizabilidad, mientras que las implementaciones del mundo real ofrecen conocimientos contextuales más ricos a costa de la claridad causal.

Por Qué Importa

La validez es la base de un M&E creíble. Sin ella, no puedes distinguir el éxito del programa de la coincidencia, ni puedes aprender lecciones que apliquen más allá de tu caso específico. Los profesionales enfrentan preocupaciones sobre la validez siempre que hacen afirmaciones causales — "nuestra capacitación mejoró las habilidades" o "la intervención redujo las tasas de deserción" — y estas afirmaciones impulsan decisiones de financiamiento, adaptaciones del programa y aprendizaje organizacional.

Una mala validez conduce a errores costosos: escalar programas que no funcionan, abandonar intervenciones que sí, o mal asignar recursos basados en correlaciones espurias. Por el contrario, la atención explícita a la validez fortalece el diseño de evaluación, aclara lo que se puede reclamar razonablemente, y construye la confianza de las partes interesadas en los hallazgos. Para evaluaciones de impacto y diseños cuasi-experimentales, la validez es el criterio de calidad principal — sin ella, la evaluación no puede cumplir su propósito.

En La Práctica

Amenazas a la validez interna incluyen:

Sesgo de selección — los grupos de comparación difieren sistemáticamente antes de la intervención
Historia — eventos externos coincidentes con el programa influyen en los resultados
Maduración — cambios naturales con el tiempo confundidos como efectos del programa
Efectos de prueba — la exposición previa a la prueba influye en las respuestas posteriores
Instrumentación — cambios de medición con el tiempo crean efectos artificiales

Abordar esto requiere un diseño cuidadoso: aleatorización (cuando sea factible), grupos de comparación emparejados, mediciones pre-post, y controles estadísticos para factores de confusión.

Amenazas a la validez externa incluyen:

Representatividad de la muestra — los participantes del estudio difieren de la población objetivo
Especificidad contextual — los resultados dependen de condiciones locales únicas
Limitaciones temporales — los hallazgos aplican solo a periodos de tiempo específicos
Fidelidad de la implementación — el programa entregado de manera diferente a lo previsto

Fortalecer la validez externa implica muestreo intencional, documentar condiciones contextuales, probar en múltiples sitios, y ser explícito sobre las condiciones límite para la generalización.

En evaluaciones de impacto (P15), la validez interna es primordial — el estudio debe establecer causalidad antes de preguntar si se generaliza. En diseños cuasi-experimentales (P14), los profesionales usan técnicas como emparejamiento de puntaje de propensión o diferencia-en-diferencias para aproximar la aleatorización y fortalecer las afirmaciones causales. En todo momento, evaluación de calidad de datos asegura que la confiabilidad de la medición apoye la validez — los datos no confiables no pueden ser válidos.

Temas Relacionados

Fiabilidad — consistencia de medición, un prerrequisito para la validez
Diseño Cuasi-Experimental — métodos para establecer inferencia causal
Evaluación de Impacto — donde la validez es la preocupación principal
Evaluación de Calidad de Datos — asegurando la precisión de la medición
Sesgo — errores sistemáticos que amenazan la validez
Contrafactual — la comparación necesaria para las afirmaciones causales

Lecturas Adicionales

Shadish, Cook, & Campbell (2002). Diseños Experimentales y Cuasi-Experimentales para la Inferencia Causal Generalizada. Houghton Mifflin. El texto definitivo sobre amenazas de validez y soluciones de diseño.
OECD-DAC (2019). Orientación sobre el Uso de los Criterios del CAD para Evaluación. Cubre consideraciones de validez dentro de los estándares de calidad de evaluación.
USAID (2020). Política y Orientación de Evaluación. Incluye requisitos de validez para evaluaciones de impacto.