Critères d'Évaluation
La chaîne causale est explicite et correctement orientée à chaque niveau (activité → extrant → effet → objectif). Chaque lien a une justification énoncée. Un évaluateur non familier avec le programme peut suivre la logique complète sans explication supplémentaire.
La chaîne causale est majoritairement cohérente avec 1 à 2 lacunes où une connexion est supposée plutôt qu'expliquée. La logique globale est plausible.
La chaîne causale est partiellement cohérente. Les niveaux clés sont présents et globalement séquencés correctement, mais plusieurs liens sont supposés plutôt qu'expliqués et un évaluateur aurait besoin d'informations supplémentaires pour suivre la logique.
Plusieurs lacunes dans le raisonnement causal. Certains extrants ne mènent pas clairement aux effets énoncés. Nécessite une explication significative pour avoir un sens.
Aucune logique causale claire. Les activités et les effets semblent sans rapport. Se lit comme une liste de livrables, pas un argument causal.
Tous les indicateurs sont spécifiques (qui, quoi, où), mesurables, limités dans le temps et mesurent directement le résultat énoncé. Les variables de désagrégation sont spécifiées le cas échéant.
La plupart des indicateurs répondent aux critères SMART. 1 à 2 manquent d'une dimension temporelle ou sont légèrement larges mais mesurables en pratique.
Certains indicateurs répondent aux critères SMART, mais environ la moitié manquent d'un ou plusieurs éléments (dimension temporelle, spécificité ou alignement direct avec l'énoncé du résultat). La collecte de données serait possible mais nécessiterait des clarifications sur plusieurs indicateurs.
Plusieurs indicateurs sont des mesures indirectes larges. Manque de dimensions temporelles ou de désagrégation. Nécessiterait des clarifications avant la collecte de données.
Les indicateurs sont vagues, immesurables ou ne correspondent pas aux énoncés des résultats. Ne peuvent pas être opérationnalisés sans révision majeure.
Les hypothèses sont énoncées aux niveaux des effets et de l'objectif. Chacune est spécifique, vérifiable et véritablement externe au contrôle du programme. Non trivialement vraie.
Hypothèses présentes à la plupart des niveaux. 1 à 2 dépendances majeures identifiées mais vagues.
Hypothèses présentes à certains niveaux. Les dépendances externes clés sont reconnues mais énoncées de manière générale, et certaines sont trivialement vraies ou pourraient être interprétées comme des activités du programme plutôt que des conditions externes.
Incomplet : présent à certains niveaux mais absent à d'autres. Beaucoup sont trivialement vraies ou sont en fait des activités du programme.
Aucune hypothèse énoncée. Les dépendances externes majeures n'ont pas été identifiées.
La hiérarchie suit une structure standard (les activités produisent des extrants ; les extrants permettent des effets ; les effets contribuent à l'objectif). Chaque niveau est clairement défini et constamment différencié.
Majoritairement correct. 1 à 2 éléments au mauvais niveau. La structure globale est reconnaissable.
La hiérarchie globale est reconnaissable, mais plusieurs éléments apparaissent au mauvais niveau. La distinction entre les extrants et les effets est appliquée de manière incohérente, et un évaluateur ne pourrait identifier le niveau visé qu'avec un contexte supplémentaire.
Plusieurs éléments au mauvais niveau. Extrants et effets systématiquement confondus.
Aucune hiérarchie reconnaissable. Activités et effets regroupés en une seule liste.
Sources de vérification spécifiées par indicateur. Fréquence de collecte, partie responsable et méthode documentées. Au moins un indicateur par niveau de résultat.
Sources listées pour la plupart des indicateurs. Fréquence ou partie responsable manquante pour 1 à 2. La plupart des niveaux ont une couverture d'indicateurs.
Sources de vérification listées pour la plupart des indicateurs mais sont souvent génériques. Au moins un des éléments suivants (fréquence de collecte, partie responsable ou méthode) est systématiquement manquant. La plupart des niveaux de résultats ont une certaine couverture d'indicateurs.
Sources génériques (« dossiers de projet ») sans spécifier comment les données seront réellement collectées. Plusieurs niveaux manquent d'indicateurs.
Aucune source de vérification. Les niveaux de résultats majeurs n'ont pas d'indicateurs. L'approche de suivi n'est pas abordée.
Interprétation des Scores
| Total (sur 25) | Niveau | Prochaine Étape |
|---|---|---|
| 22-25 | Solide | Raffinements mineurs uniquement |
| 17-21 | Adéquat | Traiter les dimensions signalées avant la soumission |
| 11-16 | Nécessite une Révision | Retour à l'équipe de conception avec la sortie de l'IA comme note de révision |
| 5-10 | Révision Substantielle | Faciliter un atelier de conception avant toute nouvelle rédaction |