Core ConceptRecolección de datos12 min read

Sampling Methods

Systematic approaches for selecting a subset of a population to represent the whole, balancing statistical validity with practical constraints.

Cuándo Usar

El muestreo es el enfoque adecuado cuando necesita hacer inferencias sobre una población pero no puede o no debe medir cada unidad. Use muestreo cuando:

  • Un censo es impráctico — su población de beneficiarios es demasiado grande, dispersa o fluida para enumerar completamente dentro de las restricciones presupuestarias y de tiempo
  • Se requiere inferencia estadística — necesita estimar parámetros poblacionales (medias, proporciones) con precisión y niveles de confianza conocidos
  • Existen restricciones de recursos — limitaciones presupuestarias, de personal o de tiempo hacen imposible la enumeración completa
  • La calidad sobre la cantidad importa — puede lograr una mayor calidad de datos con una muestra más pequeña y bien gestionada que con un censo apresurado

El muestreo es menos apropiado cuando:

  • La población es pequeña — si toda su población de beneficiarios es menor a 100-200 unidades, un censo es a menudo más práctico y elimina el error de muestreo
  • Necesita precisión a nivel de unidad — si cada hogar individual o beneficiario debe ser medido (por ejemplo, para la distribución de asistencia dirigida), el muestreo no funcionará
  • El análisis de subpoblaciones es crítico — si necesita estimaciones confiables para subgrupos pequeños y específicos (por ejemplo, hogares encabezados por mujeres en un distrito), puede necesitar muestreo estratificado con sobremuestreo o un diseño diferente
Escenario¿Usar Muestreo?Enfoque Recomendado
5,000 hogares beneficiarios en 10 distritosMuestreo por conglomerados estratificado
80 miembros de personal para capacitarNo (censo)Medir a todo el personal
50,000 personas desplazadas en una regiónMuestreo por conglomerados de dos etapas
Necesita estimaciones confiables para 200 hogares encabezados por mujeresQuizásEstratificado con sobremuestreo o intencional
Evaluación rápida de necesidades en zona inaccesibleMuestreo sistemático o intencional

Cómo Funciona

El muestreo efectivo sigue una secuencia estructurada. Cada paso se basa en el anterior.

  1. Definir la población objetivo. Sea explícito sobre quién está en el alcance: límites geográficos, criterios de inclusión/exclusión y la unidad de análisis (hogar, individuo, instalación). Esta definición determina sus requisitos de marco de muestreo.

  2. Determinar el tamaño de la muestra. Calcule el tamaño mínimo necesario basado en su precisión deseada (margen de error), nivel de confianza (típicamente 95%) y prevalencia esperada de indicadores clave. Tenga en cuenta los efectos de diseño si usa muestreo por conglomerados (típicamente 1.5-2.0) y no respuesta (típicamente 10-20%).

  3. Seleccionar el método de muestreo. Elija según las características de su población, marco disponible y necesidades de análisis:

    • Muestreo aleatorio simple (SRS) — cada unidad tiene igual probabilidad; ideal cuando tiene un marco completo y la población es homogénea
    • Muestreo sistemático — seleccione cada unidad k-ésima después de un inicio aleatorio; práctico cuando tiene una lista ordenada
    • Muestreo estratificado — divida la población en subgrupos (estratos) luego muestree dentro de cada uno; asegura representación de subgrupos clave
    • Muestreo por conglomerados — muestree grupos (conglomerados) luego unidades dentro de los conglomerados; costo-efectivo para poblaciones dispersas
    • Muestreo multietapa — combine métodos en etapas de selección; común en encuestas grandes
  4. Desarrollar el marco de muestreo. Cree o verifique la lista de la cual extraerá su muestra. El marco debe ser completo, actualizado y preciso. Documente cualquier brecha o error de cobertura conocido.

  5. Implementar la selección. Use generadores de números aleatorios o procedimientos sistemáticos para seleccionar sus unidades de muestra. Para muestreo por conglomerados, documente claramente los procedimientos de selección de conglomerados y dentro del conglomerado.

  6. Gestionar la no respuesta. Siga las tasas de respuesta en cada etapa. Planifique intentos de seguimiento y documente las razones de la no respuesta. Evite sustituir a los no respondedores con selecciones por conveniencia, lo cual introduce sesgo.

  7. Documentar todo. Registre todas las decisiones de muestreo, fuentes del marco, procedimientos de selección y tasas de respuesta. Esta documentación permite a otros evaluar la validez y replicar el enfoque.

Componentes Clave

Un diseño de muestreo robusto incluye estos elementos esenciales:

  • Definición clara de la población — criterios de inclusión/exclusión explícitos, límites geográficos y unidad de análisis que se alinean con sus preguntas de evaluación
  • Justificación del tamaño de la muestra — cálculo documentado que muestra cómo llegó a su tamaño de muestra, incluyendo supuestos sobre prevalencia, precisión, nivel de confianza, efecto de diseño y no respuesta esperada
  • Marco de muestreo — la lista o mecanismo real del cual extrae su muestra, con documentación de su fuente, completitud y limitaciones conocidas
  • Procedimiento de selección — descripción paso a paso de cómo se seleccionan las unidades, incluyendo métodos de aleatorización, puntos de inicio aleatorios y cualquier intervalo sistemático
  • Variables de estratificación — si usa muestreo estratificado, justificación clara de los estratos y método de asignación (proporcional u óptimo)
  • Protocolo de selección de conglomerados — para muestreo por conglomerados, método documentado para seleccionar conglomerados y unidades dentro del conglomerado, incluyendo cualquier procedimiento de probabilidad proporcional al tamaño
  • Gestión de la no respuesta — procedimientos de seguimiento planificados, reglas de sustitución (o falta de las mismas) y análisis de sesgo de no respuesta
  • Controles de calidad — pasos de verificación para asegurar que la selección se ejecutó según lo planeado, incluyendo verificaciones aleatorias y revisión de documentación

Mejores Prácticas

Acorde el método de muestreo a la estructura de su población. El muestreo aleatorio simple funciona cuando su población es homogénea y tiene un marco completo. El muestreo sistemático es eficiente cuando tiene una lista ordenada y el ordenamiento no está correlacionado con su resultado de interés. El muestreo estratificado supera problemas en el muestreo aleatorio simple dividiendo la muestra en subgrupos, luego seleccionando aleatoriamente encuestados dentro de cada grupo para asegurar representación.

Use muestreo estratificado cuando el análisis de subgrupos importa. Si el 38% de la población tiene educación universitaria y el 62% no ha ido a la universidad, entonces el 38% de su muestra debe ser seleccionado aleatoriamente del estrato con educación universitaria y el 62% del estrato sin educación universitaria. Esta asignación proporcional asegura que su muestra refleje la estructura de la población y le da estimaciones confiables para cada subgrupo.

Documente todos los procedimientos de muestreo en un protocolo detallado antes de que comience la recolección de datos. Su protocolo debe especificar el método de selección de conglomerados, procedimientos de muestreo dentro del conglomerado, métodos de aleatorización y manejo de no respuesta. Esta documentación es esencial para evaluar la validez y permitir la replicación.

Dentro de los conglomerados seleccionados, las unidades deben seleccionarse usando muestreo aleatorio simple o muestreo aleatorio sistemático para mantener la validez de las inferencias estadísticas. Usar selección por conveniencia dentro de los conglomerados invalida sus cálculos de tasa de error y socava la base probabilística de su diseño.

Cuando se muestrea a beneficiarios directamente usando una etapa de muestreo, siempre es preferible usar muestreo sistemático sobre el muestreo aleatorio simple (SRS). El muestreo sistemático es más práctico en condiciones de campo, requiere menos equipo y es menos propenso a sesgo de selección cuando los enumeradores siguen un procedimiento claro.

Use generadores de números aleatorios o muestreo sistemático con inicios aleatorios para la selección de conglomerados y unidades para asegurar una verdadera aleatorización. La selección manual introduce sesgo inconsciente. Use herramientas de aleatorización validadas y documente la semilla aleatoria o punto de inicio.

Compense el sesgo de respuesta usando sobremuestreo. Seleccione deliberadamente casos adicionales similares en características conocidas a aquellos que se negaron a participar, luego aplique pesos de respuesta durante el análisis. Este enfoque ayuda a mantener la precisión cuando la no respuesta es diferencial entre subgrupos.

Encuentre una forma de seleccionar muestras que sea práctica, se ajuste a su presupuesto y evite fuentes principales de sesgo. El método de muestreo ideal es inútil si no se puede implementar. Equilibre la pureza estadística con las realidades del campo, pero nunca sacrifique la aleatorización por conveniencia.

Errores Comunes

Aplicar fórmulas de muestreo aleatorio simple a datos de conglomerados. El muestreo por conglomerados introduce efectos de diseño que inflan la varianza. Aplicar fórmulas SRS a datos de conglomerados subestima severamente los errores estándar y produce intervalos de confianza artificialmente estrechos, llevando a una precisión falsa en sus estimaciones. Siempre tenga en cuenta el efecto de diseño en su cálculo de tamaño de muestra y use errores estándar robustos a conglomerados en el análisis.

Usar marcos de muestreo desactualizados o inexactos. Los errores de cobertura consisten en omisiones, inclusiones erróneas, duplicaciones y clasificaciones incorrectas de unidades en el marco de la encuesta. Usar una lista de beneficiarios desactualizada, por ejemplo, conduce a sesgo de cobertura y muestras no representativas, independientemente de qué tan bien se ejecute el procedimiento de muestreo. Verifique su marco contra los registros actuales del programa y documente las brechas conocidas.

Sustituir hogares o conglomerados que no responden. Reemplazar a los no respondedores con selecciones por conveniencia introduce sesgo desconocido e invalida los cálculos de tasa de error. Informe y analice solo las unidades realmente muestreadas. Si la no respuesta es alta, documente la tasa y realice un análisis de sesgo de no respuesta en lugar de sustituir.

Usar estrategias de muestreo inválidas. Algunos enfoques socavan fundamentalmente el muestreo probabilístico: seleccionar a sus amigos y familiares, encuestas web donde los encuestados se autoseleccionan, o encuestas telefónicas donde los encuestados deben llamar. Estos métodos de conveniencia introducen un sesgo de selección severo y no pueden soportar inferencias estadísticas sobre una población.

Subestimar los riesgos de sesgo del muestreo por conglomerados. El método de muestreo por conglomerados es potencialmente sesgado, ya que algunos hogares pueden no estar disponibles y dispuestos a responder una encuesta. Esta no respuesta dentro de los conglomerados puede introducir sesgo si los no respondedores difieren sistemáticamente de los respondedores. Planifique un seguimiento adecuado y documente las tasas de respuesta a nivel de conglomerado.

Ejemplos

Medios de Vida Agrícolas — África Oriental (Muestreo por Conglomerados Estratificado)

Un programa de resiliencia agrícola de 50,000 hogares en 10 distritos necesitaba datos de línea de base sobre seguridad alimentaria. El equipo usó muestreo por conglomerados estratificado de dos etapas: primero, los distritos se estratificaron por zona agroecológica; segundo, 50 conglomerados se seleccionaron con probabilidad proporcional al tamaño; tercero, 20 hogares por conglomerado se seleccionaron usando muestreo sistemático con inicio aleatorio. El diseño tuvo en cuenta un efecto de diseño de 1.5 y 15% de no respuesta esperada. Este enfoque logró una muestra representativa de 850 hogares mientras mantenía los costos de campo manejables. La estratificación aseguró que cada zona agroecológica estuviera representada proporcionalmente, permitiendo comparaciones confiables a nivel de zona.

Programa de Agua y Saneamiento — Asia Meridional (Muestreo Sistemático)

Un programa de agua y saneamiento que sirve a 3,000 hogares beneficiarios usó muestreo sistemático para la evaluación de línea media. El equipo obtuvo una lista ordenada de hogares de los registros del programa, calculó un intervalo de muestreo de 10 (3,000 / 300 tamaño de muestra), seleccionó un inicio aleatorio entre 1-10, y luego seleccionó cada 10mo hogar. Este enfoque fue práctico para los equipos de campo, requirió solo una lista impresa y un generador de números aleatorios, y logró una tasa de respuesta del 92%. La lista ordenada fue por pueblo y fecha de registro del hogar, lo cual el equipo verificó que no estaba correlacionado con los resultados de acceso al agua.

Respuesta de Emergencia — África Occidental (LQAS para Clasificación)

Una evaluación de seguridad alimentaria en una crisis de desplazamiento usó Muestreo de Aseguramiento de Calidad por Lotes (LQAS) para clasificar distritos como "aceptables" o "inaceptables" en tasas de desnutrición aguda. Con 19 hogares por distrito y una regla de decisión de 3 o menos casos, el equipo pudo clasificar cada distrito con 90% de confianza sobre si la desnutrición excedía el umbral del 15%. Este enfoque sacrificó la estimación precisa de prevalencia por una clasificación rápida para guiar la asignación de recursos. El diseño fue óptimo para el contexto de decisión: identificar distritos que necesitan intervención de emergencia versus aquellos que estaban estables.

Comparado Con

Los métodos de muestreo varían en sus supuestos, requisitos y compensaciones:

CaracterísticaMuestreo Aleatorio SimpleMuestreo SistemáticoMuestreo EstratificadoMuestreo por Conglomerados
Requisito de marcoLista completaLista ordenadaLista completa con etiquetas de estratosLista de conglomerados
Eficiencia estadísticaLínea baseSimilar a SRSMás eficiente que SRSMenos eficiente (efecto de diseño)
Practicidad de campoBajaAltaMediaAlta
Análisis de subgruposPosible pero variablePosible pero variableExcelenteRequiere post-estratificación
Costo para población dispersaAltoAltoAltoBajo
Mejor cuandoPoblación pequeña, homogéneaLista ordenada disponibleSe necesitan estimaciones de subgruposPoblación grande, dispersa

Indicadores Relevantes

12 indicadores en 4 marcos de donantes (USAID, FEWS NET, CHS Alliance, Global Food Security Cluster) se relacionan con el diseño e implementación del muestreo:

  • Calidad del método de muestreo — "Proporción de encuestas que usan métodos de muestreo basados en probabilidad" (USAID)
  • Adecuación del tamaño de la muestra — "Tamaño de muestra justificado contra la precisión deseada y nivel de confianza" (FEWS NET)
  • Tasa de respuesta — "Tasa de no respuesta por debajo del 20% para encuestas de hogares" (CHS Alliance)
  • Calidad del marco — "Marco de muestreo documentado y verificado contra registros del programa" (Global Food Security Cluster)

Herramientas Relacionadas

  • Calculadora de Tamaño de Muestra — Calculadora interactiva para determinar el tamaño de la muestra basado en precisión, nivel de confianza y prevalencia esperada
  • [Constructor de Marco de Muestreo](/free-tools