Muestreo PPS: probabilidad proporcional al tamaño Definición de muestreo, ejemplos

Muestreo PPS: probabilidad proporcional al tamaño Definición de muestreo, ejemplos

El procedimiento de muestreo de probabilidad proporcional al tamaño (PPC) es una variación del muestreo de múltiples etapas donde la probabilidad de seleccionar una PSU es proporcional a su tamaño y se muestrea un número igual de elementos dentro de cada PSU.

Si una UPM tiene el doble de población que otra, tiene el doble de posibilidades de ser seleccionada.

Si se selecciona el mismo número de personas de cada una de las UPM seleccionadas, la probabilidad general de selección de cualquier persona será la misma. El muestreo PPS exacto de las PSU logra así un control total sobre el tamaño de la muestra.

El método de selección de PPS es útil cuando las PSU varían mucho en tamaño.

La diferencia inherente entre el muestreo aleatorio simple y el muestreo PPS es que la probabilidad de extraer cualquier unidad específica en cualquier sorteo es la misma que en el método anterior.

Por el contrario, la probabilidad del último método difiere de un sorteo a otro. Como resultado, la teoría del muestreo PPS es más compleja que el muestreo aleatorio simple.

¿Cómo funciona en la práctica? Ilustraremos el método (llamado método total acumulativo) con un ejemplo.

Ejemplo de muestreo PPS

Una población consta de 10 aldeas con un total de 212 hogares. La segunda columna del cuadro adjunto muestra el número de hogares correspondientes a cada aldea. Se seleccionará una muestra de 6 aldeas mediante el método PPS.

Para ello se siguen los pasos:

  1. Prepare una columna de total acumulado con los hogares en la columna 2. Estos totales aparecen en la columna 3.
  2. Haga una columna que muestre el rango implícito en los totales acumulados.
  3. Lea los números aleatorios del Apéndice. Estos números aleatorios son 173, 95,210,...,32. (Ignore todos los números aleatorios que se encuentren fuera del rango 001-212).
  4. Las columnas correspondientes a nuestros números aleatorios seleccionados serán nuestras aldeas muestreadas.
  5. El Cuadro 5.9 muestra el submuestreo de las aldeas seleccionadas con y sin reemplazo.

El procedimiento ha garantizado que las probabilidades de inclusión sean proporcionales al tamaño de las aldeas (número de hogares) en cada sorteo.

Si no se conoce el tamaño de los hogares, se podrían utilizar como medida del tamaño otras variables auxiliares altamente correlacionadas con el tamaño de los hogares (como el tamaño de la población).

Tabla: Selección de muestra de PPS

AldeaNo. de hogaresTotal acumuladoRangoProbabilidad de selección
13535001-03535/212
22863036-06328/212
32083064-08320/212
425108084-10825/212
530138109-13830/212
619157139-15719/212
710167158-16710/212
812179168-17912/212
918197180-19718/212
1015212198-21215/212
Total2121.000
Aleatorio# 1739521011914015232
Pueblo # 84105661
ROE 123456
JURAR* 1
ROE Muestreo con reemplazo, SWOR: Muestreo sin reemplazo
23456
Tabla: Resultados del muestreo de PPS

Muestreo Sistemático PPS

Ya está familiarizado con el concepto de muestreo PPS. Esta sección ilustra cómo este método también puede emplearse en el muestreo sistemático.

Ilustramos este enfoque con el ejemplo anterior de muestreo sin reemplazo. Para encajar el problema en el contexto del muestreo lineal sistemático, seleccionamos 4 aldeas de modo que el total de 212 sea divisible por el tamaño de la muestra.

Consulte las primeras cuatro columnas de la Tabla 5.7. Ahora para seleccionar 4 aldeas, siga los pasos que se detallan a continuación:

  1. Divida el número total de hogares (aquí 212) por 4, el tamaño de la muestra. Esto da el intervalo de muestreo. k=53.
  2. Elija un número aleatorio entre 1 y 33 inclusive. Digamos que este número es 20. Se encuentra ubicado en el rango 001-035. Esto identifica el pueblo que lleva el número de serie 1 como nuestra primera selección.
  3. Agregar k (=53) al número 20 elegido en el paso 2. Esto da como resultado 53+20=73, que se encuentra en el rango de 64-83. Esto nos lleva a seleccionar el pueblo que lleva el número de serie 3.
  4. Para seleccionar la tercera unidad, suma 53 a 73, lo que da 126, que se encuentra en el rango 109-138. Esto nos obliga a seleccionar una aldea con el número de serie 5.
  5. Finalmente, suma 53 a 126, lo que da como resultado un total de 179. Esto selecciona la aldea 8.
  6. Esto completa el procedimiento de selección de muestras. Hemos seleccionado pueblos con números de serie: 1,3,5 y 8.

Si este hubiera sido un caso de n=6,k habría sido 35,33 llevar el procedimiento de selección al muestreo circular sistemático.

Para realizar la tarea según este procedimiento, redondeamos el intervalo de muestreo al siguiente dígito superior, 36. Según lo dicta el método, elegimos nuestro número aleatorio entre 1 y 212 inclusive para garantizar la misma probabilidad de selección.

Es fácil verificar que elegir cualquier número aleatorio entre 1 y 32 no causará ningún problema al seleccionar 6 aldeas. Si va más allá de eso, debe seguir la estrategia de muestreo sistemático circular para garantizar 6 aldeas.

Supongamos que el número aleatorio elegido es 40. Esto se encuentra en el rango 36-63, lo que nos da la aldea 2 como nuestra selección. Agregue ahora 36 a 40, lo que da como resultado 76. Esto cae en el rango 64-83, identificando la aldea 3 como nuestra segunda selección.

Continuando con el proceso, las 4 aldeas seleccionadas restantes son aquellas que llevan los números de serie 5, 6, 9 y 1. La tabla adjunta muestra el número aleatorio elegido y las aldeas seleccionadas asociadas.

Número aleatorioRangoPueblos seleccionados
40036-0632
76064-0833
112109-1385
148139-1576
184180-1978
220001-0351
220-212=8, que se encuentra en el primer rango, identificando la primera aldea.
Selección de Muestras bajo el Método PPS