Evaluation ToR Quality

AI Prompt Templates

Copy a prompt into Claude, ChatGPT, or Gemini. Paste your document at the bottom and run.

Paste a document and get a scored quality assessment with evidence and revision priorities.

5,601 characters

You are an expert M&E evaluation specialist. Score the evaluation Terms of Reference (ToR) I will provide using the rubric below.

SCORING RUBRIC - Evaluation ToR Quality
Score each dimension 1-5 using these criteria:

DIMENSION 1: Background and Scope Clarity
- Score 5: All four elements present and well-developed. Program described specifically (what, where, when, target population, scale), evaluation purpose explicit (formative, summative, or mixed; at what decision point), intended users named (named roles or organizations), decision context articulated (what decisions will be informed by findings).
- Score 4: At least three of four elements present. May lack named decision context or fully named users.
- Score 3: At least two of four elements present. Program description and purpose stated, but users or decision context generic.
- Score 2: One element present. Background reads as boilerplate without specific scope or users.
- Score 1: No clear background or scope. ToR jumps straight to tasks without context.

DIMENSION 2: Evaluation Questions and Criteria
- Score 5: All four elements present. Evaluation questions are specific and answerable with the proposed methods, each question is mapped to one or more evaluation criteria (relevance, coherence, effectiveness, efficiency, impact, sustainability, or alternatives), sub-questions identified for each main question, and the user or decision-maker for each question is named.
- Score 4: At least three of four elements present. Questions are answerable and mapped to criteria; sub-questions or named users partially present.
- Score 3: At least two of four elements present. Questions present but criteria mapping is implicit. No sub-questions or named users.
- Score 2: Questions are vague ("How successful was the program?") or unanswerable with the proposed methods. No criteria mapping. No sub-questions.
- Score 1: No evaluation questions, OR questions are tasks rather than questions ("Conduct an evaluation of...").

DIMENSION 3: Methodology Specification
- Score 5: All four elements present. Design type named (e.g., quasi-experimental, mixed-methods case study, contribution analysis) with rationale tied to evaluation questions, sampling expectations specified (probability or purposive, approximate size or range), primary and secondary data sources listed, analysis approach described (e.g., mixed-methods integration plan, qualitative coding, statistical methods).
- Score 4: At least three of four elements present. Design and approach named; sampling or analysis briefly described.
- Score 3: At least two of four elements present. Design type named but rationale generic. Sampling or analysis vague.
- Score 2: Methodology described as "mixed methods" or similar without specification. No design rationale.
- Score 1: No methodology specified, OR ToR specifies methods that cannot answer the evaluation questions.

DIMENSION 4: Deliverables, Timeline, and Budget Realism
- Score 5: All five elements present. Deliverables listed with content specifications (e.g., inception report, draft report, final report, presentation), milestones tied to specific dates or weeks, total days and cost or budget envelope stated, payment schedule linked to deliverables, communication plan with frequency and format.
- Score 4: At least four of five elements present. Deliverables and milestones clear; budget or payment schedule may be partial.
- Score 3: At least three of five elements present. Deliverables and timeline present but budget or payment schedule absent. No communication plan.
- Score 2: Two or fewer elements present. Deliverables listed but with no milestones, budget, or schedule.
- Score 1: No specified deliverables, timeline, or budget. ToR is unreasonable to bid on.

DIMENSION 5: Ethics and Stakeholder Engagement Plan
- Score 5: All four elements present. Consent and safeguarding requirements specified for all data subjects, vulnerable population protections defined (children, conflict-affected, marginalized groups), stakeholder validation plan included (when findings will be reviewed by program staff, beneficiaries, or partners), dissemination plan addresses post-evaluation communication.
- Score 4: At least three of four elements present. Consent and validation present; vulnerable population protections or dissemination plan partial.
- Score 3: At least two of four elements present. Consent referenced and one other element present. No detailed safeguarding or validation.
- Score 2: Ethics referenced as a checkbox ("evaluators will follow ethical standards") without specification. No validation or dissemination plan.
- Score 1: No ethics or stakeholder engagement provisions.

OUTPUT FORMAT:
Return your assessment as a table followed by a summary:

| Dimension | Score (1-5) | Evidence from ToR | Priority Revision |
|-----------|-------------|-------------------|-------------------|
| Background and Scope Clarity | | | |
| Evaluation Questions and Criteria | | | |
| Methodology Specification | | | |
| Deliverables, Timeline, and Budget Realism | | | |
| Ethics and Stakeholder Engagement Plan | | | |

**Total: X/25**
**Band:** Strong (22-25) / Adequate (17-21) / Needs Revision (11-16) / Substantial Revision (5-10)
**Single Most Important Revision:** [One specific sentence]
**Procurement Risk:** [None / Minor clarifications needed / Recommend revision before issuing / Do not issue without major revision]

For any dimension scored 1 or 2, add a brief explanation and a concrete revision example.

EVALUATION ToR TO SCORE:
[Paste your evaluation Terms of Reference here]

Critères d'Évaluation

Clarté du Contexte et du Périmètre

5Excellent

Les quatre éléments sont présents et bien développés. Programme décrit spécifiquement (quoi, où, quand, population cible, échelle), objectif d'évaluation explicite (formatif, sommatif, ou mixte ; à quel point de décision), utilisateurs visés nommés (rôles ou organisations nommés), contexte décisionnel articulé (quelles décisions seront éclairées par les conclusions).

4Bon

Au moins trois des quatre éléments sont présents. Peut manquer un contexte décisionnel nommé ou des utilisateurs entièrement nommés.

3Adéquat

Au moins deux des quatre éléments sont présents. Description du programme et objectif énoncés, mais utilisateurs ou contexte décisionnel génériques.

2Nécessite une Amélioration

Un élément présent. Le contexte se lit comme un texte standard sans périmètre ou utilisateurs spécifiques.

1Insuffisant

Aucun contexte ou périmètre clair. Les TdR passent directement aux tâches sans contexte.

Questions et Critères d'Évaluation

5Excellent

Les quatre éléments sont présents. Les questions d'évaluation sont spécifiques et auxquelles on peut répondre avec les méthodes proposées, chaque question est mappée à un ou plusieurs critères d'évaluation (pertinence, cohérence, efficacité, efficience, impact, durabilité, ou alternatives), des sous-questions sont identifiées pour chaque question principale, et l'utilisateur ou décideur de chaque question est nommé.

4Bon

Au moins trois des quatre éléments sont présents. Les questions sont auxquelles on peut répondre et mappées aux critères ; sous-questions ou utilisateurs nommés partiellement présents.

3Adéquat

Au moins deux des quatre éléments sont présents. Questions présentes mais le mappage aux critères est implicite. Aucune sous-question ou utilisateur nommé.

2Nécessite une Amélioration

Les questions sont vagues (« Quel est le succès du programme ? ») ou auxquelles on ne peut répondre avec les méthodes proposées. Aucun mappage aux critères. Aucune sous-question.

1Insuffisant

Aucune question d'évaluation, OU les questions sont des tâches plutôt que des questions (« Mener une évaluation de... »).

Spécification Méthodologique

5Excellent

Les quatre éléments sont présents. Type de conception nommé (par exemple, quasi-expérimental, étude de cas méthodes mixtes, analyse de contribution) avec justification liée aux questions d'évaluation, attentes d'échantillonnage spécifiées (probabiliste ou raisonné, taille approximative ou plage), sources de données primaires et secondaires listées, approche d'analyse décrite (par exemple, plan d'intégration méthodes mixtes, codage qualitatif, méthodes statistiques).

4Bon

Au moins trois des quatre éléments sont présents. Conception et approche nommées ; échantillonnage ou analyse brièvement décrits.

3Adéquat

Au moins deux des quatre éléments sont présents. Type de conception nommé mais justification générique. Échantillonnage ou analyse vagues.

2Nécessite une Amélioration

Méthodologie décrite comme « méthodes mixtes » ou similaire sans spécification. Aucune justification de la conception.

1Insuffisant

Aucune méthodologie spécifiée, OU les TdR spécifient des méthodes qui ne peuvent pas répondre aux questions d'évaluation.

Livrables, Calendrier et Réalisme Budgétaire

5Excellent

Les cinq éléments sont présents. Livrables listés avec spécifications de contenu (par exemple, rapport de démarrage, projet de rapport, rapport final, présentation), jalons liés à des dates ou semaines spécifiques, jours totaux et coût ou enveloppe budgétaire énoncés, calendrier de paiement lié aux livrables, plan de communication avec fréquence et format.

4Bon

Au moins quatre des cinq éléments sont présents. Livrables et jalons clairs ; budget ou calendrier de paiement peuvent être partiels.

3Adéquat

Au moins trois des cinq éléments sont présents. Livrables et calendrier présents mais budget ou calendrier de paiement absents. Aucun plan de communication.

2Nécessite une Amélioration

Deux éléments ou moins présents. Livrables listés mais sans jalons, budget ou calendrier.

1Insuffisant

Aucun livrable, calendrier ou budget spécifié. Les TdR ne sont pas raisonnables à soumissionner.

Plan d'Éthique et d'Engagement des Parties Prenantes

5Excellent

Les quatre éléments sont présents. Exigences de consentement et de sauvegarde spécifiées pour tous les sujets de données, protections des populations vulnérables définies (enfants, populations affectées par les conflits, groupes marginalisés), plan de validation avec les parties prenantes inclus (quand les conclusions seront examinées par le personnel du programme, les bénéficiaires ou les partenaires), plan de diffusion aborde la communication post-évaluation.

4Bon

Au moins trois des quatre éléments sont présents. Consentement et validation présents ; protections des populations vulnérables ou plan de diffusion partiels.

3Adéquat

Au moins deux des quatre éléments sont présents. Consentement référencé et un autre élément présent. Aucune sauvegarde ou validation détaillées.

2Nécessite une Amélioration

L'éthique est référencée comme une case à cocher (« les évaluateurs suivront les normes éthiques ») sans spécification. Aucun plan de validation ou de diffusion.

1Insuffisant

Aucune disposition d'éthique ou d'engagement des parties prenantes.

Interprétation du Score

Total (sur 25)	Niveau	Prochaine Étape
22-25	Solide	Les TdR sont prêts pour la passation de marché. Ajustements mineurs uniquement.
17-21	Adéquat	Aborder les dimensions signalées avant l'émission pour soumissions.
11-16	Nécessite une Révision	Révision substantielle requise avant la passation de marché. Utilisez l'invite de Révision avec la sortie de l'IA comme bref de révision.
5-10	Révision Substantielle	Ne pas émettre. Retourner à l'équipe d'évaluation pour une refonte complète.

Scoring Dimensions

1
Background and Scope Clarity
Whether the program is described specifically, the evaluation purpose is explicit, intended users are named, and the decision context is articulated.
2
Evaluation Questions and Criteria
Whether evaluation questions are specific and answerable, mapped to evaluation criteria, broken into sub-questions, and tied to the users who need each answer.
3
Methodology Specification
Whether the design type is named with rationale, sampling expectations are specified, data sources are listed, and the analysis approach is described.
4
Deliverables, Timeline, and Budget Realism
Whether deliverables, milestones, total cost, payment schedule, and communication plan are specified at a level of detail that allows credible bidding.
5
Ethics and Stakeholder Engagement Plan
Whether consent and safeguarding requirements are specified, vulnerable population protections are defined, validation with stakeholders is planned, and dissemination is addressed.

Each dimension scored 1–5. Maximum score: 25.

Retour à la bibliothèque de prompts