Cómo Diseñamos Pipelines
Un enfoque por etapas, con controles de calidad y prioridad local.
En etapas
Dividimos el proceso en pequeños pasos. Cada llamada a la IA realiza una tarea simple, lo que permite identificar fallos de manera progresiva en lugar de ocultarlos en un resultado final complejo.
Con controles de calidad
Implementamos controles de calidad entre cada etapa. Las validaciones de esquema, reglas de negocio y jueces con rúbricas de puntuación evitan la propagación de resultados incorrectos.
Prioridad local
Utilizamos modelos de IA locales para el manejo de datos sensibles. Cuando se requieren modelos en la nube, aplicamos desidentificación determinista. Usted tiene el control total sobre la ubicación de sus datos.
Enfoque por etapas: así construimos nuestros pipelines
En cada pipeline, tomamos cuatro decisiones clave: qué pasos son deterministas y cuáles requieren una llamada a la IA, la temperatura de ejecución de cada paso, cómo se fragmentan las entradas extensas y el patrón de organización de los pasos.
Nodos basados en reglas cuando es posible, nodos de IA cuando es indispensable
Los nodos basados en reglas ejecutan tareas que no requieren inteligencia artificial. No tienen costo de ejecución y sus fallos son predecibles. Los nodos de IA se reservan para trabajos que exigen juicio o generación. El pipeline más eficiente en costos es aquel que minimiza las llamadas a la IA. Antes de integrar un nodo de IA, siempre evaluamos si un nodo basado en reglas puede realizar la tarea. En la mayoría de los casos, es posible.
Basado en reglas (sin IA)
- Dirigir un registro al paso siguiente correcto según el valor de un campo
- Validar el formato de una fecha y que un campo numérico se encuentre dentro de los límites establecidos
- Convertir entre formatos JSON y CSV, o entre diferentes plantillas de donantes
- Verificar que un campo obligatorio no esté vacío
- Desidentificar campos antes de que los datos salgan de su infraestructura
Requiere IA
- Interpretar respuestas abiertas de encuestas
- Resumir documentos extensos basándose en una pregunta específica
- Aplicar un libro de códigos a la transcripción de una entrevista
- Redactar un párrafo narrativo a partir de evidencia estructurada
- Calificar un resultado según una rúbrica de calidad
Control de la temperatura
La temperatura controla el grado de aleatoriedad que introduce un modelo. Ajustar este parámetro a la tarea específica es crucial para obtener resultados fiables en cada etapa. No es una cuestión de estilo: temperaturas bajas reducen las alucinaciones en la extracción de datos, mientras que temperaturas más cálidas mejoran la calidad de la redacción.
| Fase | Temperatura | Por qué |
|---|---|---|
| Extracción y análisis | 0.0 – 0.2 | Misma entrada, misma salida. Menor riesgo de alucinación. |
| Redacción | 0.3 – 0.4 | El lenguaje necesita variación para no parecer una plantilla. |
| Pulido y evaluación | 0.0 – 0.1 | La consistencia importa más que la creatividad. |
Fragmentación de entradas extensas
Los documentos extensos no se procesan en una única instrucción (prompt). Un informe de evaluación de 40 páginas, un manual de donantes de cien páginas o un conjunto de datos de encuestas de mil filas se dividen en fragmentos de tamaño adecuado para la tarea, se procesan en paralelo y luego se fusionan.
Hay tres razones principales. Primero, las ventanas de contexto tienen un costo: entradas más grandes implican mayores costos y una ejecución más lenta. Segundo, la atención del modelo disminuye con la longitud, aumentando la probabilidad de perder detalles importantes en una instrucción extensa. Tercero, el procesamiento paralelo por fragmentos puede reducir una ejecución que tomaría una hora como una única instrucción a solo unos minutos de trabajo simultáneo.
La estrategia de fragmentación varía según la tarea: utilizamos límites semánticos para documentos, agrupaciones de filas para tablas y turnos de transcripción para entrevistas.
Topología de los pipelines
Seis patrones principales cubren la mayoría de las topologías de pipelines que desarrollamos. La mayoría de los pipelines en producción combinan varios de ellos: estructuras jerárquicas, bucles de calidad iterativos en etapas creativas, selección por torneo cuando la calidad de las variantes difiere, y enrutamiento condicional para entradas mixtas que requieren un tratamiento diferenciado.
Six pipeline patterns
Linear
Steps run one after another. Used when each step builds on the output of the previous one, like extract, then code, then summarize.
Parallel (fan-out / fan-in)
One input splits into concurrent branches that rejoin. Used when a document needs multiple independent analyses at once, like extracting themes and flagging risks in the same pass.
Hierarchical
A multi-section output built by running a sub-pipeline per section, then assembled. Used for long documents like evaluation reports with distinct chapters.
Iterative
A step runs, a judge scores it, and if quality is low the step re-runs with feedback. Capped at three loops. Used when outputs need iterative polish, like narrative drafting.
Tournament
Multiple variants of the same step run in parallel, a judge picks the best. Used for creative work where variant quality varies, like drafting a recommendation paragraph.
Conditional
A router sends each item down the right branch based on its characteristics. Used when the same pipeline handles mixed inputs, like routing transcripts one way and reports another.
A = input · B/C/D = processing steps · V = variant · J = judge · ◆ = router
Con controles de calidad: asegurando la fiabilidad en cada etapa
Cada paso del pipeline debe superar un control de calidad antes de que se ejecute el siguiente. Si el control falla, el trabajo se envía a revisión humana, indicando la razón específica. El pipeline nunca avanza con un resultado incorrecto sin notificación.
Validadores de esquema
Confirman que el resultado tiene la estructura correcta: campos obligatorios, tipos de datos adecuados y formatos válidos. Son deterministas, de costo cero y se ejecutan en milisegundos.
Verificaciones basadas en reglas
Aplican la lógica de negocio: rangos numéricos, valores enumerados y restricciones entre campos. También son deterministas y de costo cero.
Jueces con rúbrica de puntuación
Utilizan un modelo de IA para calificar el resultado según una rúbrica de criterios específicos. Se emplean cuando la calidad es un aspecto que un humano evaluaría subjetivamente.
Torneos de variantes
Generan múltiples candidatos para el mismo paso, y luego un juez selecciona el mejor. Se utilizan cuando la calidad de las variantes es variable y el mejor resultado justifica el costo adicional.
Los pipelines establecen un umbral de aprobación de 0.85 para los resultados calificados con rúbrica. Cualquier resultado por debajo de este umbral se envía a revisión humana. Las verificaciones de esquema y basadas en reglas son de tipo 'pasa/falla'.
Descubra cómo funciona cada método de garantía de calidadPrioridad local: gestión de datos sensibles
No todos los pipelines pueden o necesitan ejecutarse con modelos de IA locales. La decisión depende de la sensibilidad de los datos involucrados. Para ello, utilizamos una escala de decisión de tres niveles.
Which data goes where
Identifiable + sensitive
Interview transcripts, health records, household rosters
Local models only
Sensitive but de-identifiable
Survey data with personal fields, beneficiary tracking
Deterministic anonymization, then cloud
Public or depersonalized
Reports, indicator data, donor guidance, operational metadata
Cloud models directly
Cada pipeline registra el nivel de ejecución de cada paso, la versión del modelo utilizado y las transformaciones aplicadas. Esto le permite auditar dónde se procesaron sus datos y por qué.
Conozca nuestro enfoque integral de privacidad de datosPasos siguientes
Hablemos de un piloto
Describa su tarea de datos de M&E, el volumen y el perfil de sensibilidad. Diseñaremos un piloto a su medida.