Cómo Diseñamos Pipelines

Un enfoque por etapas, con controles de calidad y prioridad local.

En etapas

Dividimos el proceso en pequeños pasos. Cada llamada a la IA realiza una tarea simple, lo que permite identificar fallos de manera progresiva en lugar de ocultarlos en un resultado final complejo.

Con controles de calidad

Implementamos controles de calidad entre cada etapa. Las validaciones de esquema, reglas de negocio y jueces con rúbricas de puntuación evitan la propagación de resultados incorrectos.

Prioridad local

Utilizamos modelos de IA locales para el manejo de datos sensibles. Cuando se requieren modelos en la nube, aplicamos desidentificación determinista. Usted tiene el control total sobre la ubicación de sus datos.

Enfoque por etapas: así construimos nuestros pipelines

En cada pipeline, tomamos cuatro decisiones clave: qué pasos son deterministas y cuáles requieren una llamada a la IA, la temperatura de ejecución de cada paso, cómo se fragmentan las entradas extensas y el patrón de organización de los pasos.

Nodos basados en reglas cuando es posible, nodos de IA cuando es indispensable

Los nodos basados en reglas ejecutan tareas que no requieren inteligencia artificial. No tienen costo de ejecución y sus fallos son predecibles. Los nodos de IA se reservan para trabajos que exigen juicio o generación. El pipeline más eficiente en costos es aquel que minimiza las llamadas a la IA. Antes de integrar un nodo de IA, siempre evaluamos si un nodo basado en reglas puede realizar la tarea. En la mayoría de los casos, es posible.

Basado en reglas (sin IA)

  • Dirigir un registro al paso siguiente correcto según el valor de un campo
  • Validar el formato de una fecha y que un campo numérico se encuentre dentro de los límites establecidos
  • Convertir entre formatos JSON y CSV, o entre diferentes plantillas de donantes
  • Verificar que un campo obligatorio no esté vacío
  • Desidentificar campos antes de que los datos salgan de su infraestructura

Requiere IA

  • Interpretar respuestas abiertas de encuestas
  • Resumir documentos extensos basándose en una pregunta específica
  • Aplicar un libro de códigos a la transcripción de una entrevista
  • Redactar un párrafo narrativo a partir de evidencia estructurada
  • Calificar un resultado según una rúbrica de calidad

Control de la temperatura

La temperatura controla el grado de aleatoriedad que introduce un modelo. Ajustar este parámetro a la tarea específica es crucial para obtener resultados fiables en cada etapa. No es una cuestión de estilo: temperaturas bajas reducen las alucinaciones en la extracción de datos, mientras que temperaturas más cálidas mejoran la calidad de la redacción.

FaseTemperaturaPor qué
Extracción y análisis0.0 – 0.2Misma entrada, misma salida. Menor riesgo de alucinación.
Redacción0.3 – 0.4El lenguaje necesita variación para no parecer una plantilla.
Pulido y evaluación0.0 – 0.1La consistencia importa más que la creatividad.

Fragmentación de entradas extensas

Los documentos extensos no se procesan en una única instrucción (prompt). Un informe de evaluación de 40 páginas, un manual de donantes de cien páginas o un conjunto de datos de encuestas de mil filas se dividen en fragmentos de tamaño adecuado para la tarea, se procesan en paralelo y luego se fusionan.

Hay tres razones principales. Primero, las ventanas de contexto tienen un costo: entradas más grandes implican mayores costos y una ejecución más lenta. Segundo, la atención del modelo disminuye con la longitud, aumentando la probabilidad de perder detalles importantes en una instrucción extensa. Tercero, el procesamiento paralelo por fragmentos puede reducir una ejecución que tomaría una hora como una única instrucción a solo unos minutos de trabajo simultáneo.

La estrategia de fragmentación varía según la tarea: utilizamos límites semánticos para documentos, agrupaciones de filas para tablas y turnos de transcripción para entrevistas.

Topología de los pipelines

Seis patrones principales cubren la mayoría de las topologías de pipelines que desarrollamos. La mayoría de los pipelines en producción combinan varios de ellos: estructuras jerárquicas, bucles de calidad iterativos en etapas creativas, selección por torneo cuando la calidad de las variantes difiere, y enrutamiento condicional para entradas mixtas que requieren un tratamiento diferenciado.

Six pipeline patterns

ABC

Linear

Steps run one after another. Used when each step builds on the output of the previous one, like extract, then code, then summarize.

AB1B2B3C

Parallel (fan-out / fan-in)

One input splits into concurrent branches that rejoin. Used when a document needs multiple independent analyses at once, like extracting themes and flagging risks in the same pass.

AB1B2C1C2D

Hierarchical

A multi-section output built by running a sub-pipeline per section, then assembled. Used for long documents like evaluation reports with distinct chapters.

ABJretry

Iterative

A step runs, a judge scores it, and if quality is low the step re-runs with feedback. Capped at three loops. Used when outputs need iterative polish, like narrative drafting.

AV1V2V3J

Tournament

Multiple variants of the same step run in parallel, a judge picks the best. Used for creative work where variant quality varies, like drafting a recommendation paragraph.

A?B1B2C1C2

Conditional

A router sends each item down the right branch based on its characteristics. Used when the same pipeline handles mixed inputs, like routing transcripts one way and reports another.

A = input · B/C/D = processing steps · V = variant · J = judge · ◆ = router

Con controles de calidad: asegurando la fiabilidad en cada etapa

Cada paso del pipeline debe superar un control de calidad antes de que se ejecute el siguiente. Si el control falla, el trabajo se envía a revisión humana, indicando la razón específica. El pipeline nunca avanza con un resultado incorrecto sin notificación.

Validadores de esquema

Confirman que el resultado tiene la estructura correcta: campos obligatorios, tipos de datos adecuados y formatos válidos. Son deterministas, de costo cero y se ejecutan en milisegundos.

Verificaciones basadas en reglas

Aplican la lógica de negocio: rangos numéricos, valores enumerados y restricciones entre campos. También son deterministas y de costo cero.

Jueces con rúbrica de puntuación

Utilizan un modelo de IA para calificar el resultado según una rúbrica de criterios específicos. Se emplean cuando la calidad es un aspecto que un humano evaluaría subjetivamente.

Torneos de variantes

Generan múltiples candidatos para el mismo paso, y luego un juez selecciona el mejor. Se utilizan cuando la calidad de las variantes es variable y el mejor resultado justifica el costo adicional.

Los pipelines establecen un umbral de aprobación de 0.85 para los resultados calificados con rúbrica. Cualquier resultado por debajo de este umbral se envía a revisión humana. Las verificaciones de esquema y basadas en reglas son de tipo 'pasa/falla'.

Descubra cómo funciona cada método de garantía de calidad

Prioridad local: gestión de datos sensibles

No todos los pipelines pueden o necesitan ejecutarse con modelos de IA locales. La decisión depende de la sensibilidad de los datos involucrados. Para ello, utilizamos una escala de decisión de tres niveles.

Which data goes where

1

Identifiable + sensitive

Interview transcripts, health records, household rosters

Local models only

2

Sensitive but de-identifiable

Survey data with personal fields, beneficiary tracking

Deterministic anonymization, then cloud

3

Public or depersonalized

Reports, indicator data, donor guidance, operational metadata

Cloud models directly

Cada pipeline registra el nivel de ejecución de cada paso, la versión del modelo utilizado y las transformaciones aplicadas. Esto le permite auditar dónde se procesaron sus datos y por qué.

Conozca nuestro enfoque integral de privacidad de datos

Hablemos de un piloto

Describa su tarea de datos de M&E, el volumen y el perfil de sensibilidad. Diseñaremos un piloto a su medida.