Échantillonnage aléatoire stratifié : procédure, types, exemples

Échantillonnage aléatoire stratifié : procédure, types, exemples

Un plan d’échantillonnage restreint, qui peut être plus efficace qu’un simple échantillonnage aléatoire, est échantillonnage aléatoire stratifié.

Qu’est-ce que l’échantillonnage aléatoire stratifié ?

La procédure nécessite une connaissance préalable de la population. Le processus de stratification consiste à diviser la population en plusieurs groupes ou classes qui ne se chevauchent pas, appelés couches.

Au sein de chacune de ces strates, les éléments sont plus semblables (homogènes) que ne le sont les éléments de la population dans son ensemble en ce qui concerne les caractéristiques à étudier.

Autrement dit, vous créez un ensemble d’échantillons homogènes basés sur les variables que vous souhaitez étudier.

Dans chaque strate, un sous-échantillon est prélevé par la procédure d'échantillonnage aléatoire simple, et l'échantillon global est obtenu en combinant les sous-échantillons de toutes les strates.

Les étudiants universitaires, par exemple, peuvent être divisés ou stratifiés selon leur niveau universitaire (sciences, arts, commerce, etc.), leur religion (musulmane, hindoue, bouddhiste, etc.), leur sexe (homme, femme), etc.

Après cette stratification, des échantillons aléatoires simples de la taille souhaitée peuvent être prélevés au sein de chaque strate.

Les résultats de l'échantillonnage peuvent ensuite être pondérés et combinés en estimations de population appropriées.

Plus précisément, le processus de stratification possède les caractéristiques principales suivantes :

  • La population entière est divisée en plusieurs sous-populations distinctes, appelées strates ;
  • Au sein de chaque strate, un échantillon distinct et indépendant est sélectionné ;
  • Pour chaque strate, la moyenne, la proportion, la variance et d'autres statistiques de la strate sont calculées ;
  • Ces estimations sont ensuite correctement pondérées pour former une estimation combinée pour l’ensemble de la population.

Exemple d'échantillonnage aléatoire stratifié

Supposons qu’une population comprenne 700 musulmans, 200 hindous et 100 chrétiens.

Si l’on souhaite un échantillon aléatoire simple de 100 personnes (10% du total), nous n’obtiendrons probablement pas exactement 70 musulmans, 20 hindous et 10 chrétiens : la proportion de chrétiens, en particulier, pourrait être trop faible.

Un échantillon stratifié de 70 musulmans, 20 hindous et 10 chrétiens garantirait une meilleure représentation des groupes.

Les strates sont généralement formées sur la base de la variable principale étudiée.

Si le chercheur avait souhaité s’assurer que les religions étaient adéquatement représentées dans l’échantillon, il aurait pu stratifier les étudiants selon leur religion. La religion est alors appelée facteur de stratification ou variable de stratification.

Il est important de noter qu'il n'y aura aucun gain en précision à stratifier par un facteur sans rapport avec l'objet de l'étude, car les caractéristiques des différentes strates ne différeraient pas les unes des autres, et il n'y aurait rien à gagner à exclure de l'échantillonnage erreur sur la variation entre les strates.

Ainsi, idéalement, on souhaite stratifier un échantillon en fonction des facteurs considérés comme étant les plus étroitement liés au sujet de l’étude.

Supposons que le chercheur, par exemple, étudiant les conditions de vie et de travail de la population, ait souhaité s'assurer que différents types de zones (par exemple, municipalité, zone municipale, urbaine, semi-urbaine, rurale, etc.) soient représentées de manière adéquate dans l'échantillon.

Dans ce cas, il aurait pu stratifier la population par type de zone.

Ici, le type de zone est la variable de stratification, qui est clairement liée aux variables de l'étude (à savoir les conditions de vie et de travail).

Dans l'étude des habitudes d'écoute de la télévision chez les étudiants universitaires, les résultats scolaires (élevé, moyen, faible) ou le lieu de résidence (urbain, rural) peuvent servir de variables de stratification puisque chacune de ces variables est considérée comme étant liée aux habitudes d'écoute de la télévision. des étudiants.

Attribution de la taille de l'échantillon aux strates

Une fois que nous avons précisé le nombre total n d’observations à inclure dans l’échantillon, la prochaine tâche importante consiste à décider du nombre d’observations à prendre dans chaque strate individuelle, sous la contrainte qu’un total de n observations ou éléments doivent être pris dans toutes les strates.

C'est ce qu'on appelle le problème d'attribution.

En supposant que la taille globale de l’échantillon n est fixe, il n'est pas immédiatement évident quelles sont les valeurs de nX,n2,…,nk devrait être tel que nX+n2+… + nk =n.

Il est donc important de définir certaines règles ou principes pour attribuer la taille des échantillons aux différentes strates.

Types de procédures d’échantillonnage aléatoire stratifié

Il existe généralement quatre méthodes d’attribution de la taille de l’échantillon à différentes strates dans une procédure d’échantillonnage stratifié. Ceux-ci sont,

  1. Allocation arbitraire
  2. Allocation égale
  3. Allocation proportionnelle
  4. Allocation de Kish
  5. Allocation de racine carrée

Allocation arbitraire

Dans cette répartition, le choix de la taille de l'échantillon pour différentes strates dépend entièrement de la commodité de l'échantillonneur.

Il s’agit donc d’une allocation délibérée. La seule restriction est que la somme des tailles d'échantillon dans différentes strates s'ajoutera à n, la taille totale de l’échantillon. C'est,

méthode d'allocation arbitraire

Allocation égale

Le même nombre d'éléments est tiré de chaque strate dans cette allocation. Autrement dit, pour la strate je, la taille de l'échantillon est donnée par

allocation égale

n, est la taille de l'échantillon à tirer de la z-ème strate, n est la taille globale de l’échantillon, et k est le nombre de strates dans la population.

Ainsi, par exemple, si une population est composée de k=4 strates et un échantillon de n=500 doit être alloué à ces strates, alors le principe d'allocation égale affirme que nje = 500/4 = 125. Cela implique que 125 unités seront tirées de chacune des quatre strates.

L'approche d'allocation égale présente un intérêt pratique considérable pour des raisons de commodité administrative ou de facilité de travail sur le terrain.

Cette répartition sera la répartition de choix si l’objectif principal de l’enquête par sondage est de tester les hypothèses sur les différences entre les strates en ce qui concerne les niveaux des variables d’intérêt, en supposant que les variations au sein des strates sont égales.

Allocation proportionnelle

L'échantillonnage au sein de chaque strate peut être effectué de manière proportionnelle ou disproportionnée. UN proportionné un échantillon stratifié est obtenu si la fraction d'échantillonnage de chaque strate (n/N) est la même (c'est-à-dire uniforme).

Dans ce plan, les éléments de l'échantillon sont répartis entre les strates proportionnellement au nombre relatif d'éléments dans chaque strate de la population.

L'échantillonnage stratifié avec une fraction d'échantillonnage uniforme a tendance à avoir une plus grande précision que l'échantillonnage aléatoire simple, et il est également généralement pratique pour des raisons pratiques.

Mais il est bien entendu essentiel que la sélection au sein des strates soit effectuée de manière aléatoire.

Dans cette procédure, les éléments de l'échantillon sont répartis entre les strates proportionnellement au nombre relatif d'éléments dans chaque strate de la population.

Autrement dit, plus la taille de la strate est grande, plus la taille de l’échantillon à choisir dans cette strate est grande. C’est peut-être la méthode d’attribution la plus utilisée.

Si nt représente la taille de l'échantillon et la TV, la taille de la population dans la zième strate, puis la fraction d'échantillonnage nje/Nje est spécifié comme étant le même pour chaque strate. Cela implique également que la fraction d'échantillonnage globale n/N est la fraction extraite de chaque strate. Autrement dit, le nombre d'éléments nje les prélèvements dans chaque strate sont donnés par :

Allocation proportionnelle

Cette équation implique que l'échantillonnage stratifié réparti proportionnellement donne à chaque unité d'échantillonnage la même probabilité de sélection dans l'ensemble de la population.

Ainsi si N=300 et n=30, alors 10% des observations de chaque strate doivent être incluses dans l'échantillon.

Allocation de Kish

L'allocation proportionnelle attribue une petite proportion de l'échantillon à des strates trop petites.

Cela peut poser problème lorsque les strates principales sont des régions administratives d'un pays pour lesquelles des estimations distinctes sont nécessaires et lorsque les divisions diffèrent considérablement en taille.

Lorsque tel est le cas, la répartition égale entraînera une variation substantielle des fractions d’échantillonnage entre les strates.

Cela conduira à une fraction d’échantillonnage plus grande pour la plus petite strate que pour les strates les plus peuplées.

Un compromis entre répartition proportionnelle et répartition égale est la répartition proposée par Kish, connue sous le nom de Allocation de Kish.

La formule d’allocation des Kish apparaît ci-dessous :

formule d'allocation de kish

Allocation de racine carrée

Une allocation supplémentaire est fréquemment utilisée, appelée allocation racine carrée.

Celui-ci est formulé ainsi :

méthode d'allocation de racine carrée