O procedimento de amostragem de probabilidade proporcional ao tamanho (PPC) é uma variação da amostragem em vários estágios, onde a probabilidade de selecionar uma PSU é proporcional ao seu tamanho e um número igual de elementos é amostrado dentro de cada PSU.
Se uma UPA tiver uma população duas vezes maior que outra, ela terá duas vezes mais chances de ser selecionada.
Se o mesmo número de pessoas for selecionado de cada uma das UPAs selecionadas, a probabilidade geral de seleção de qualquer pessoa será a mesma. A amostragem PPS exata de PSUs alcança, assim, controle completo sobre o tamanho da amostra.
O método de seleção PPS é útil quando as PSUs variam muito em tamanho.
A diferença inerente entre a amostragem aleatória simples e a amostragem PPS é que a probabilidade de sortear qualquer unidade especificada em qualquer sorteio é a mesma do método anterior.
Em contraste, a probabilidade do último método difere de sorteio para sorteio. Como resultado, a teoria da amostragem PPS é mais complexa do que a amostragem aleatória simples.
Como isto funciona na pratica? Ilustraremos o método (chamado método total cumulativo) com um exemplo.
Exemplo de amostragem PPS
Uma população consiste em 10 aldeias com um total de 212 famílias. A segunda coluna da tabela anexa mostra o número de agregados familiares correspondentes a cada aldeia. Uma amostra de 6 aldeias será selecionada pelo método PPS.
Para fazer isso, siga as etapas:
- Prepare uma coluna de total cumulativo com os agregados familiares na coluna 2. Estes totais aparecem na coluna 3.
- Faça uma coluna exibindo o intervalo implícito nos totais acumulados.
- Leia os números aleatórios no Apêndice. Esses números aleatórios são 173, 95.210, ..,32. (Ignore todos os números aleatórios fora do intervalo 001-212).
- As colunas correspondentes aos nossos números aleatórios selecionados serão as nossas aldeias amostradas.
- A Tabela 5.9 mostra a subamostragem das aldeias seleccionadas com e sem reposição.
O procedimento garantiu que as probabilidades de inclusão sejam proporcionais ao tamanho das aldeias (número de agregados familiares) em cada sorteio.
Se o tamanho dos agregados familiares não for conhecido, algumas outras variáveis auxiliares, altamente correlacionadas com o tamanho do agregado familiar (tais como o tamanho da população), poderiam ser utilizadas como medida de tamanho.
Tabela: Seleção da Amostra PPS
Vila | Nº de domicílios | Total cumulativo | Faixa | Probabilidade de seleção |
1 | 35 | 35 | 001-035 | 35/212 |
2 | 28 | 63 | 036-063 | 28/212 |
3 | 20 | 83 | 064-083 | 20/212 |
4 | 25 | 108 | 084-108 | 25/212 |
5 | 30 | 138 | 109-138 | 30/212 |
6 | 19 | 157 | 139-157 | 19/212 |
7 | 10 | 167 | 158-167 | 10/212 |
8 | 12 | 179 | 168-179 | 12/212 |
9 | 18 | 197 | 180-197 | 18/212 |
10 | 15 | 212 | 198-212 | 15/212 |
Total | 212 | – | – | 1.000 |
Aleatório# 173 | 95 | 210 | 119 | 140 | 152 | 32 |
Aldeia # 8 | 4 | 10 | 5 | 6 | 6 | 1 |
ROE 1 | 2 | 3 | 4 | 5 | 6 | – |
SWOR * 1 Amostragem SWR com reposição, SWOR: Amostragem sem reposição | 2 | 3 | 4 | 5 | – | 6 |
Amostragem Sistemática PPS
Você já está familiarizado com o conceito de amostragem PPS. Esta seção ilustra como esse método também pode ser empregado na amostragem sistemática.
Ilustramos esta abordagem pelo exemplo anterior para amostragem sem reposição. Para enquadrar o problema no contexto da amostragem linear sistemática, selecionamos 4 aldeias de modo que o total de 212 seja divisível pelo tamanho da amostra.
Consulte as primeiras quatro colunas da Tabela 5.7. Agora, para selecionar 4 aldeias, siga as etapas detalhadas abaixo:
- Divida o número total de domicílios (aqui 212) por 4, o tamanho da amostra. Isso dá o intervalo de amostragem k=53.
- Escolha um número aleatório entre 1 e 33 inclusive. Digamos que este número seja 20. Ele está localizado no intervalo 001-035. Isto identifica a aldeia com o número de série 1 como a nossa primeira seleção.
- Adicionar k (=53) ao número 20 escolhido na etapa 2. Isso resulta em 53+20=73, que fica no intervalo de 64-83. Isso nos leva a selecionar a aldeia com número de série 3.
- Para selecionar a terceira unidade, adicione 53 a 73, resultando em 126, que está no intervalo 109-138. Isso nos obriga a selecionar uma aldeia com número de série 5.
- Finalmente, adicione 53 a 126, resultando num total de 179. Isto seleciona a aldeia 8.
- Isso completa o procedimento de seleção da amostra. Selecionamos aldeias com números de série: 1,3,5 e 8.
Se este fosse um caso de n = 6, k teria sido 35,33, levando o processo de seleção a uma amostragem circular sistemática.
Para realizar a tarefa neste procedimento, arredondamos o intervalo de amostragem para o próximo dígito mais alto, 36. Conforme determina o método, escolhemos nosso número aleatório entre 1 e 212 inclusive para garantir uma seleção de probabilidade igual.
É fácil verificar que a escolha de qualquer número aleatório no intervalo de 1 a 32 não causará nenhum problema na seleção de 6 aldeias. Se for além disso, deverá seguir a estratégia de amostragem sistemática circular para garantir 6 aldeias.
Suponha que o número aleatório escolhido seja 40. Isso está no intervalo 36-63, dando-nos assim a aldeia 2 como nossa seleção. Adicione agora 36 a 40, o que resulta em 76. Isto situa-se no intervalo 64-83, identificando a aldeia 3 como a nossa segunda selecção.
Continuando o processo, as restantes 4 aldeias selecionadas são aquelas que possuem os números de série 5, 6, 9 e 1. A tabela anexa mostra o número aleatório escolhido e as aldeias selecionadas associadas.
Número aleatório | Faixa | Aldeias Selecionadas |
---|---|---|
40 | 036-063 | 2 |
76 | 064-083 | 3 |
112 | 109-138 | 5 |
148 | 139-157 | 6 |
184 | 180-197 | 8 |
220 | 001-035 | 1 |
220-212=8, que se enquadra na primeira faixa, identificando a primeira aldeia. |