Evaluation ToR Quality

AI Prompt Templates

Copy a prompt into Claude, ChatGPT, or Gemini. Paste your document at the bottom and run.

Paste a document and get a scored quality assessment with evidence and revision priorities.

5,601 characters
You are an expert M&E evaluation specialist. Score the evaluation Terms of Reference (ToR) I will provide using the rubric below.

SCORING RUBRIC - Evaluation ToR Quality
Score each dimension 1-5 using these criteria:

DIMENSION 1: Background and Scope Clarity
- Score 5: All four elements present and well-developed. Program described specifically (what, where, when, target population, scale), evaluation purpose explicit (formative, summative, or mixed; at what decision point), intended users named (named roles or organizations), decision context articulated (what decisions will be informed by findings).
- Score 4: At least three of four elements present. May lack named decision context or fully named users.
- Score 3: At least two of four elements present. Program description and purpose stated, but users or decision context generic.
- Score 2: One element present. Background reads as boilerplate without specific scope or users.
- Score 1: No clear background or scope. ToR jumps straight to tasks without context.

DIMENSION 2: Evaluation Questions and Criteria
- Score 5: All four elements present. Evaluation questions are specific and answerable with the proposed methods, each question is mapped to one or more evaluation criteria (relevance, coherence, effectiveness, efficiency, impact, sustainability, or alternatives), sub-questions identified for each main question, and the user or decision-maker for each question is named.
- Score 4: At least three of four elements present. Questions are answerable and mapped to criteria; sub-questions or named users partially present.
- Score 3: At least two of four elements present. Questions present but criteria mapping is implicit. No sub-questions or named users.
- Score 2: Questions are vague ("How successful was the program?") or unanswerable with the proposed methods. No criteria mapping. No sub-questions.
- Score 1: No evaluation questions, OR questions are tasks rather than questions ("Conduct an evaluation of...").

DIMENSION 3: Methodology Specification
- Score 5: All four elements present. Design type named (e.g., quasi-experimental, mixed-methods case study, contribution analysis) with rationale tied to evaluation questions, sampling expectations specified (probability or purposive, approximate size or range), primary and secondary data sources listed, analysis approach described (e.g., mixed-methods integration plan, qualitative coding, statistical methods).
- Score 4: At least three of four elements present. Design and approach named; sampling or analysis briefly described.
- Score 3: At least two of four elements present. Design type named but rationale generic. Sampling or analysis vague.
- Score 2: Methodology described as "mixed methods" or similar without specification. No design rationale.
- Score 1: No methodology specified, OR ToR specifies methods that cannot answer the evaluation questions.

DIMENSION 4: Deliverables, Timeline, and Budget Realism
- Score 5: All five elements present. Deliverables listed with content specifications (e.g., inception report, draft report, final report, presentation), milestones tied to specific dates or weeks, total days and cost or budget envelope stated, payment schedule linked to deliverables, communication plan with frequency and format.
- Score 4: At least four of five elements present. Deliverables and milestones clear; budget or payment schedule may be partial.
- Score 3: At least three of five elements present. Deliverables and timeline present but budget or payment schedule absent. No communication plan.
- Score 2: Two or fewer elements present. Deliverables listed but with no milestones, budget, or schedule.
- Score 1: No specified deliverables, timeline, or budget. ToR is unreasonable to bid on.

DIMENSION 5: Ethics and Stakeholder Engagement Plan
- Score 5: All four elements present. Consent and safeguarding requirements specified for all data subjects, vulnerable population protections defined (children, conflict-affected, marginalized groups), stakeholder validation plan included (when findings will be reviewed by program staff, beneficiaries, or partners), dissemination plan addresses post-evaluation communication.
- Score 4: At least three of four elements present. Consent and validation present; vulnerable population protections or dissemination plan partial.
- Score 3: At least two of four elements present. Consent referenced and one other element present. No detailed safeguarding or validation.
- Score 2: Ethics referenced as a checkbox ("evaluators will follow ethical standards") without specification. No validation or dissemination plan.
- Score 1: No ethics or stakeholder engagement provisions.

OUTPUT FORMAT:
Return your assessment as a table followed by a summary:

| Dimension | Score (1-5) | Evidence from ToR | Priority Revision |
|-----------|-------------|-------------------|-------------------|
| Background and Scope Clarity | | | |
| Evaluation Questions and Criteria | | | |
| Methodology Specification | | | |
| Deliverables, Timeline, and Budget Realism | | | |
| Ethics and Stakeholder Engagement Plan | | | |

**Total: X/25**
**Band:** Strong (22-25) / Adequate (17-21) / Needs Revision (11-16) / Substantial Revision (5-10)
**Single Most Important Revision:** [One specific sentence]
**Procurement Risk:** [None / Minor clarifications needed / Recommend revision before issuing / Do not issue without major revision]

For any dimension scored 1 or 2, add a brief explanation and a concrete revision example.

EVALUATION ToR TO SCORE:
[Paste your evaluation Terms of Reference here]

Criterios de Calificación

DimensiónExcelente (5)Bueno (4)Adecuado (3)Necesita Mejora (2)Inadecuado (1)
Claridad de Antecedentes y AlcanceLos cuatro elementos están presentes y bien desarrollados. Programa descrito específicamente (qué, dónde, cuándo, población objetivo, escala), propósito de la evaluación explícito (formativo, sumativo o mixto; en qué punto de decisión), usuarios previstos nombrados (roles u organizaciones nombradas), contexto de decisión articulado (qué decisiones serán informadas por los hallazgos).Al menos tres de los cuatro elementos están presentes. Puede carecer de un contexto de decisión nombrado o de usuarios completamente nombrados.Al menos dos de los cuatro elementos están presentes. Descripción del programa y propósito declarados, pero usuarios o contexto de decisión genéricos.Un elemento presente. Los antecedentes se leen como texto estándar sin alcance o usuarios específicos.Sin antecedentes o alcance claros. Los TdR pasan directamente a las tareas sin contexto.
Preguntas y Criterios de EvaluaciónLos cuatro elementos están presentes. Las preguntas de evaluación son específicas y respondibles con los métodos propuestos, cada pregunta está mapeada a uno o más criterios de evaluación (relevancia, coherencia, eficacia, eficiencia, impacto, sostenibilidad u otros), las sub-preguntas están identificadas para cada pregunta principal, y el usuario o tomador de decisiones para cada pregunta está nombrado.Al menos tres de los cuatro elementos están presentes. Las preguntas son respondibles y mapeadas a criterios; sub-preguntas o usuarios nombrados parcialmente presentes.Al menos dos de los cuatro elementos están presentes. Preguntas presentes pero el mapeo a criterios es implícito. Sin sub-preguntas o usuarios nombrados.Las preguntas son vagas ("¿Qué tan exitoso fue el programa?") o irrespondibles con los métodos propuestos. Sin mapeo a criterios. Sin sub-preguntas.No hay preguntas de evaluación, O las preguntas son tareas en lugar de preguntas ("Realizar una evaluación de...").
Especificación MetodológicaLos cuatro elementos están presentes. Tipo de diseño nombrado (por ejemplo, cuasi-experimental, estudio de caso de métodos mixtos, análisis de contribución) con justificación vinculada a las preguntas de evaluación, expectativas de muestreo especificadas (probabilístico o intencional, tamaño aproximado o rango), fuentes de datos primarias y secundarias enumeradas, enfoque de análisis descrito (por ejemplo, plan de integración de métodos mixtos, codificación cualitativa, métodos estadísticos).Al menos tres de los cuatro elementos están presentes. Diseño y enfoque nombrados; muestreo o análisis brevemente descritos.Al menos dos de los cuatro elementos están presentes. Tipo de diseño nombrado pero justificación genérica. Muestreo o análisis vagos.Metodología descrita como "métodos mixtos" o similar sin especificación. Sin justificación del diseño.No se especifica metodología, O los TdR especifican métodos que no pueden responder a las preguntas de evaluación.
Entregables, Cronograma y Realismo PresupuestarioLos cinco elementos están presentes. Entregables enumerados con especificaciones de contenido (por ejemplo, informe de inicio, borrador de informe, informe final, presentación), hitos vinculados a fechas o semanas específicas, días totales y costo o sobre presupuestario declarados, calendario de pagos vinculado a entregables, plan de comunicación con frecuencia y formato.Al menos cuatro de los cinco elementos están presentes. Entregables e hitos claros; presupuesto o calendario de pagos pueden ser parciales.Al menos tres de los cinco elementos están presentes. Entregables y cronograma presentes pero presupuesto o calendario de pagos ausentes. Sin plan de comunicación.Dos o menos elementos presentes. Entregables enumerados pero sin hitos, presupuesto o calendario.Sin entregables, cronograma o presupuesto especificados. Los TdR no son razonables para licitar.
Plan de Ética y Participación de Partes InteresadasLos cuatro elementos están presentes. Requisitos de consentimiento y salvaguardia especificados para todos los sujetos de datos, protecciones para poblaciones vulnerables definidas (niños, afectados por conflicto, grupos marginados), plan de validación con partes interesadas incluido (cuándo se revisarán los hallazgos con personal del programa, beneficiarios o socios), plan de diseminación aborda la comunicación post-evaluación.Al menos tres de los cuatro elementos están presentes. Consentimiento y validación presentes; protecciones para poblaciones vulnerables o plan de diseminación parciales.Al menos dos de los cuatro elementos están presentes. Consentimiento referenciado y un otro elemento presente. Sin salvaguardia o validación detalladas.La ética se referencia como una casilla de verificación ("los evaluadores seguirán estándares éticos") sin especificación. Sin plan de validación o diseminación.Sin disposiciones de ética o participación de partes interesadas.

Interpretación de la Puntuación

Total (de 25)BandaSiguiente Paso
22-25SólidoLos TdR están listos para adquisición. Solo refinamientos menores.
17-21AdecuadoAbordar las dimensiones señaladas antes de emitir para licitación.
11-16Necesita RevisiónSe requiere revisión sustancial antes de la adquisición. Use la instrucción de Revisión con la salida de la IA como resumen de revisión.
5-10Revisión SustancialNo emitir. Devolver al equipo de evaluación para una redacción completa.