Las 6 decisiones de gobernanza que debes tomar antes de que la IA toque el trabajo
Son decisiones de preparación, no marcos de política. Cada una se corresponde con un modo de fallo que puedes prevenir si lo piensas antes de empezar. Las prácticas de ejecución (ver la guía de IA Fiable) y la validación de resultados (ver la guía de AC) son aspectos distintos. Acierta en estas seis y la mayor parte de lo que de otro modo saldría mal nunca llegará a ocurrir.
Adecuación de la tarea: elige aquello para lo que la IA es realmente buena
La IA no es igual de buena en todas las tareas de M&E. Es fuerte en extracción de patrones, síntesis de primera pasada, conversión de formatos y en hacer aflorar temas candidatos a partir de grandes volúmenes de texto. Es débil en juicio evaluativo, en razonamiento analítico novedoso sobre contextos poco familiares y en cualquier cosa que requiera una verificación sobre el terreno que solo un humano puede hacer. Antes de cualquier uso de IA, anota qué tareas específicas del flujo de trabajo asumirá la IA y cuáles seguirán siendo exclusivamente humanas. Resiste la expansión del alcance durante el trabajo. Una IA contratada para extraer citas de transcripciones no debería terminar redactando el capítulo de hallazgos.
Límites de datos: decide qué va a qué tipo de IA
No todos los datos pueden ir a todas las herramientas. Los datos identificables de participantes, el contexto sensible del programa y los hallazgos confidenciales necesitan un hogar diferente al de los resúmenes de cara al público o los extractos anonimizados. Antes de cualquier trabajo con IA, clasifica tus datos en tres categorías: seguros para IA en la nube, solo para modelo local y nada de IA. La clasificación es práctica, no de política: qué saldría realmente mal si estos datos terminaran en el servidor de un proveedor que no puedes auditar. Una vez que existe la clasificación, empareja los datos con la herramienta. Si no dispones de una capacidad de modelo local, eso determina qué tareas son elegibles para IA.
Ubicación de la revisión: decide dónde permanecen los humanos en el circuito
La revisión humana en el trabajo con IA es una decisión de diseño, no una ocurrencia tardía. Decide desde el principio dónde se sitúan los humanos en el flujo de trabajo: revisando cada resultado, comprobando una muestra, asumiendo determinadas decisiones por completo, o interviniendo solo cuando se activa una alerta. La ubicación correcta depende de la tarea y de lo que está en juego. Un resultado evaluativo de alto impacto requiere revisión humana completa. La extracción rutinaria puede comprobarse por muestreo. Un líder de equipo que formula recomendaciones a un financiador necesita apropiarse personalmente de ese resultado, por mucha ayuda que la IA haya prestado en su redacción. Nombra la ubicación de la revisión para cada tarea antes de que empiece el trabajo, no durante.
Ejecución y validación: saber dónde viven
Esta página trata de la preparación. Las prácticas de ejecución (cómo estructurar las instrucciones, cuándo usar modelos locales, cómo intercalar control de calidad entre pasos, cómo ejecutar para lograr estabilidad) viven en la guía de IA Fiable. La validación posterior al resultado (la pila de 6 capas para detectar errores) vive en la guía de AC de IA. Una buena preparación pasa el testigo a una buena ejecución, que a su vez pasa el testigo a una buena validación. Si falta cualquiera de las tres, las otras dos trabajan más de lo que deberían.
Documentación para ti mismo
Tres meses después de entregar un producto de M&E asistido por IA, alguien preguntará cómo se produjo. Quien pregunte, normalmente, serás tú. Para cada tarea asistida por IA, registra qué modelo usaste, qué instrucción, qué entrada y qué hiciste con el resultado. Guárdalo junto al resultado, no en un sistema aparte. Si el registro es difícil de mantener, las herramientas están mal elegidas. Mantenlo en un registro de una página por producto asistido por IA, no como un artefacto de cumplimiento.
Condiciones de parada y recuperación: saber cuándo desenchufar
Los enfoques asistidos por IA a veces dejan de funcionar. El modelo cambia. El patrón de los datos cambia. Los resultados empiezan a derivar. La tasa de fallo cruza un umbral que hace que validar sea más costoso que hacer el trabajo a mano. Antes de empezar, nombra las condiciones específicas que te llevarían a dejar de usar la IA para esta tarea. Nombra también la vía de recuperación cuando un producto asistido por IA resulte erróneo después de haber sido aceptado: cómo lo detectas, cómo lo corriges, qué les dices a los usuarios aguas abajo. La mayoría de los equipos no piensan en las condiciones de parada hasta que ya las han sobrepasado.
Decisiones de preparación en la práctica
Tres escenarios que muestran la diferencia entre un trabajo de M&E donde el uso de la IA se preparó con cuidado y otro donde no.
Usar la IA para una tarea en la que no es buena
El equipo le pide a la IA que «evalúe la eficacia del programa a partir de los documentos de evaluación adjuntos». La IA produce un juicio de eficacia fluido y de tono seguro. Nadie validó si la lógica evaluativa encaja con el contexto real del programa. El juicio impulsa una recomendación en el informe. Dos meses después, un revisor señala que la conclusión no se desprende de la evidencia; se desprende de los patrones interiorizados por la IA sobre qué aspecto tienen los «programas eficaces» en general.
Usar la IA para una tarea en la que no es buena
El equipo le pide a la IA que extraiga y categorice la evidencia de los documentos, con seguimiento de citas. Un evaluador sénior revisa la categorización de la evidencia, identifica vacíos y se apropia él mismo del juicio de eficacia. La IA aceleró la recuperación de evidencia. La decisión evaluativa quedó en manos del humano que puede defenderla.
Datos sensibles dirigidos al tipo equivocado de IA
Bajo presión de plazos, alguien sube 120 transcripciones de entrevistas con informantes clave, con los nombres de los participantes intactos, a una herramienta comercial de IA en la nube para codificación temática. Los datos quedan en los servidores del proveedor de forma indefinida. La organización no puede auditar qué ocurrió con ellos. Cuando un participante objeta más tarde que su nombre apareció en un documento sin su consentimiento, el equipo ni siquiera puede confirmar si los datos fueron eliminados.
Datos sensibles dirigidos al tipo equivocado de IA
La clasificación de datos se hizo antes de cualquier trabajo con IA. Las transcripciones identificables van a un modelo local que se ejecuta en el portátil del equipo. Los extractos anonimizados pueden ir a IA en la nube para la síntesis posterior. Cuando más tarde surge una pregunta sobre el tratamiento de los datos, hay una respuesta clara.
Sin documentación, imposible reproducir
El equipo usa la IA para ayudar a producir la codificación de un conjunto de datos cualitativo. Seis meses después, un revisor pregunta cómo se identificaron los temas. La persona del equipo que hizo el trabajo ya no está. Nadie puede reconstruir las instrucciones, la versión del modelo o qué ejecuciones produjeron qué temas. Los hallazgos existen técnicamente; el proceso que los sustenta ha desaparecido.
Sin documentación, imposible reproducir
Un registro de una página por tarea asistida por IA: modelo, instrucción, entrada, salida, qué se validó, qué se corrigió. El registro vive junto al resultado, no en un sistema aparte. Cuando el revisor pregunta, la respuesta lleva cinco minutos, no cinco días.
5 gestos de preparación que rinden de inmediato
Anota las tareas elegibles para IA antes de que toque nada
Antes de cualquier uso de IA, enumera las tareas específicas de este flujo de trabajo que asumirá la IA. Sé explícito sobre los límites. «La IA extrae y categoriza la evidencia de los documentos; el equipo se apropia de los juicios de eficacia.» La lista existe para que puedas frenarte cuando el alcance empiece a derivar durante el trabajo. Sin ella, el alcance siempre deriva.
Clasifica tus datos antes de que ninguno se mueva hacia la IA
Tres categorías: seguros para la nube, solo para modelo local, nada de IA. Haz la clasificación una vez, al inicio del proyecto, no tarea por tarea bajo la presión de los plazos. La clasificación se convierte en una referencia a la que puedes señalar cuando alguien pregunte por qué una transcripción concreta recibió o no procesamiento asistido por IA.
Pilota una tarea pequeña antes de escalar el enfoque
Ejecuta una versión pequeña del trabajo de principio a fin antes de comprometerte a hacer todo el conjunto asistido por IA. Codifica 10 transcripciones, no 200. Redacta una sección, no el informe completo. El piloto hace aflorar los modos de fallo que importan antes de que hayas montado tu calendario alrededor de un enfoque que en realidad no funciona.
Mantén un registro de una página por producto asistido por IA
Modelo, instrucción, entrada, salida, qué validaste, qué corregiste. Guárdalo junto al resultado. No por cumplimiento. Por ti mismo, tres meses después, cuando alguien pregunte y tengas que reconstruir el trabajo en menos de un día.
Incorpora un disparador de «pausa y revisión» en el flujo de trabajo
Elige un momento concreto en el que el equipo se detenga y se pregunte: ¿de verdad nos está ayudando la IA aquí, o estamos trabajando más en validarla de lo que trabajaríamos sin ella? El disparador puede basarse en el tiempo (revisión semanal), en el resultado (después de cada lote) o en el fallo (cuando los errores cruzan un umbral). Sin un disparador, los equipos se quedan en enfoques asistidos por IA más allá del punto en el que deberían haberse detenido.
Instrucción de adecuación de tareas para IA
Describe una tarea de M&E y esta instrucción devuelve una recomendación estructurada sobre si la IA debería tocarla, qué partes, con qué datos y dónde debe permanecer el humano en el circuito. Úsala antes de que la IA entre en el trabajo, no después.
Instrucción de adecuación de tareas de IA para M&E
Necesito decidir si la IA debería asistir en una tarea concreta de M&E y, en caso afirmativo, cómo. Produce una recomendación estructurada.
Descripción de la tarea:
- Cuál es la tarea: [p. ej., «codificación de 80 transcripciones de grupos focales de una evaluación intermedia» / «redacción de la sección de antecedentes de una propuesta» / «extracción de indicadores a partir de una plantilla de reporte»]
- Cuál es el resultado: [conjunto de datos codificado / texto borrador / datos estructurados / otro]
- Qué está en juego: [Bajo: uso interno / Medio: entregable de equipo / Alto: dirigido al financiador / Crítico: alimenta una decisión de financiación o de programa]
- Juicios evaluativos implicados: [ninguno / menores / sustantivos]
Entradas disponibles:
- Material fuente: [transcripciones / documentos / conjuntos de datos / fuentes externas]
- Sensibilidad de los datos: [públicos / anonimizados / identificables / confidenciales]
- Modelo de IA local disponible: [sí / no]
Contexto del equipo:
- Quién hará el trabajo: [una persona / equipo pequeño / equipo distribuido]
- Quién revisará el resultado: [la misma persona / revisor distinto / líder de equipo]
- Presión de plazos: [baja / moderada / alta]
Para esta tarea, produce:
1. Adecuación de la IA (un párrafo)
- ¿Es la IA adecuada para esta tarea en su conjunto, para una parte, o nada en absoluto?
- ¿Qué subtareas concretas debería asumir la IA y cuáles deberían quedar exclusivamente humanas?
- ¿Cuál es el modo de fallo más probable para este tipo de tarea si se hace un mal uso de la IA?
2. Decisión sobre los límites de datos (un párrafo)
- ¿Qué datos son seguros para IA en la nube, cuáles requieren solo modelo local y cuáles no deberían tocar la IA?
- ¿Cuál es la regla concreta de tratamiento de datos para esta tarea?
3. Ubicación de la revisión (un párrafo)
- ¿Dónde se sitúa el humano: revisión completa, muestreo, propietario de la decisión, o revisión por activación?
- ¿Qué no puede, en concreto, delegarse en la IA?
4. Condiciones de parada (lista con 2 a 3 viñetas)
- Condiciones específicas que dispararían la parada del enfoque asistido por IA para esta tarea.
5. Un párrafo de preparación
- Adecuado para pegar en una nota de arranque o en un descriptivo de proyecto, que describa el plan de asistencia por IA para esta tarea en lenguaje de profesional.