Validity (Internal & External) - Bibliothèque S&E

Validité (Interne & Externe)

Définition

Validité fait référence à la précision et à la fiabilité des conclusions tirées des données d'évaluation. Elle comporte deux dimensions distinctes que les praticiens doivent considérer séparément :

Validité interne demande : Le programme a-t-il réellement causé les résultats observés ? Cela consiste à établir une inférence causale crédible — écarter les explications alternatives comme le biais de sélection, la maturation ou les événements externes qui auraient pu produire les mêmes résultats. Une validité interne élevée signifie que vous pouvez attribuer avec confiance le changement à votre intervention plutôt qu'à des facteurs confondants.

Validité externe demande : Ces résultats peuvent-ils être généralisés au-delà de cette étude spécifique ? Cela concerne l'applicabilité des résultats à d'autres contextes, populations ou périodes. Une étude avec une forte validité externe produit des enseignements qui restent utiles même lorsque les conditions du programme diffèrent du contexte d'évaluation.

Ces dimensions s'opposent souvent — les études étroitement contrôlées maximisent la validité interne mais peuvent limiter la généralisabilité, tandis que les mises en œuvre réelles offrent des éclairages contextuels plus riches au détriment de la clarté causale.

Pourquoi cela compte

La validité est le fondement d'une S&E crédible. Sans elle, vous ne pouvez pas distinguer le succès du programme de la coïncidence, ni apprendre des leçons applicables au-delà de votre cas spécifique. Les praticiens font face à des préoccupations de validité chaque fois qu'ils formulent des affirmations causales — "notre formation a amélioré les compétences" ou "l'intervention a réduit les taux d'abandon" — et ces affirmations guident les décisions de financement, les adaptations de programme et l'apprentissage organisationnel.

Une faible validité conduit à des erreurs coûteuses : mettre à l'échelle des programmes qui ne fonctionnent pas, abandonner des interventions qui fonctionnent, ou mal allouer des ressources sur la base de corrélations fallacieuses. Inversement, une attention explicite à la validité renforce la conception de l'évaluation, clarifie ce qui peut raisonnablement être affirmé, et renforce la confiance des parties prenantes dans les résultats. Pour les évaluations d'impact et les plans quasi-expérimentaux, la validité est le critère de qualité principal — sans elle, l'évaluation ne peut remplir sa fonction.

En pratique

Menaces à la validité interne incluent :

Biais de sélection — les groupes de comparaison diffèrent systématiquement avant l'intervention
Histoire — des événements externes coïncidant avec le programme influencent les résultats
Maturation — des changements naturels au fil du temps pris pour des effets du programme
Effets de test — l'exposition au pré-test influence les réponses au post-test
Instrumentation — des changements de mesure au fil du temps créent des effets artificiels

Y remédier nécessite une conception soignée : randomisation (lorsque possible), groupes de comparaison appariés, mesures pré-post, et contrôles statistiques pour les facteurs confondants.

Menaces à la validité externe incluent :

Représentativité de l'échantillon — les participants à l'étude diffèrent de la population cible
Spécificité contextuelle — les résultats dépendent de conditions locales uniques
Limites temporelles — les résultats s'appliquent uniquement à des périodes spécifiques
Fidélité de mise en œuvre — le programme est livré différemment de ce qui était prévu

Renforcer la validité externe implique un échantillonnage ciblé, la documentation des conditions contextuelles, des tests sur plusieurs sites, et être explicite sur les conditions limites de généralisation.

Dans les évaluations d'impact (P15), la validité interne est primordiale — l'étude doit établir la causalité avant de demander si elle se généralise. Dans les plans quasi-expérimentaux (P14), les praticiens utilisent des techniques comme l'appariement par score de propension ou la différence de différences pour approximer la randomisation et renforcer les affirmations causales. Tout au long, l'évaluation de la qualité des données assure que la fiabilité de la mesure soutient la validité — des données non fiables ne peuvent pas être valides.

Sujets Connexes

Fiabilité — cohérence de la mesure, un prérequis pour la validité
Plan Quasi-Expérimental — méthodes pour établir une inférence causale
Évaluation d'Impact — où la validité est la préoccupation principale
Évaluation de la qualité des données — assurer la précision de la mesure
Biais — erreurs systématiques menaçant la validité
Contrefactuel — la comparaison nécessaire pour les affirmations causales

Lectures Complémentaires

Shadish, Cook, & Campbell (2002). Conceptions Expérimentales et Quasi-Expérimentales pour l'Inférence Causale Généralisée. Houghton Mifflin. Le texte de référence sur les menaces de validité et les solutions de conception.
OECD-DAC (2019). Lignes directrices sur l'utilisation des critères du CAD pour l'évaluation. Couvre les considérations de validité dans les normes de qualité d'évaluation.
USAID (2020). Politique et Lignes directrices sur l'évaluation. Inclut les exigences de validité pour les évaluations d'impact.