Méthodes d'échantillonnage : techniques, types, exemples

Échantillonnage est une procédure statistique consistant à extraire un petit nombre d'éléments d'une population et à tirer des conclusions concernant la population.

Comprendre l'échantillonnage et les méthodes d'échantillonnage en recherche

Qu’est-ce que l’échantillonnage ?

L'échantillonnage est le processus de sélection d'un sous-ensemble de personnes ou des phénomènes sociaux à étudier à partir de l’univers plus vaste.

L'objectif principal de l'échantillonnage est de tirer des conclusions sur le plus grand groupe sur la base des informations obtenues auprès du petit groupe.

Le principal moyen d’y parvenir est de sélectionner un échantillon représentatif. Un échantillon représentatif doit refléter toutes les variables qui existent dans la population.

Le terme « population » désigne tous ceux qui pourraient être inclus dans le enquête. Une variable est toute caractéristique sur laquelle des personnes ou des groupes diffèrent.

Une variable est un ensemble d'attributs mutuellement exclusifs d'une unité d'échantillonnage : sexe, âge, statut d'emploi, etc. Les éléments d'une population donnée peuvent être décrits en termes de leurs attributs sur une variable donnée.

La variable est étroitement associée au terme base de sondage. La base de sondage répertorie toutes les unités de la population à partir desquelles l'échantillon sera sélectionné.

La méthode d'échantillonnage est moins coûteuse et prend moins de temps que la technique de recensement. Il est pratique d’administrer une méthode d’échantillonnage car les petites unités d’échantillonnage peuvent être facilement gérées.

La méthode d'échantillonnage est également utile pour l'étude intensive et élaborée d'unités sélectionnées.

L’hypothèse principale qui sous-tend la technique d’échantillonnage est que, bien que les phénomènes socio-juridiques soient complexes, il semble exister une unité dominante dans la diversité et qu’il est possible de constituer un échantillon représentatif.

Cependant, le choix de l’unité doit être clair, sans ambiguïté et définitif. De plus, l’unité d’échantillonnage doit être de taille adéquate pour être fiable.

Toutefois, pour être fiable, le choix des unités d’échantillonnage doit être effectué avec le soin nécessaire et le sujet de l’enquête doit être homogène.

Le principal avantage de la méthode d’échantillonnage est qu’elle peut faciliter l’estimation des caractéristiques de la population dans un délai beaucoup plus court qu’il ne serait possible autrement.

C’est également moins coûteux car il faut interroger moins de personnes.

Cependant, la méthode d’échantillonnage présente également certains inconvénients, comme la possibilité de biais dans la sélection des unités, conduisant à de fausses conclusions.

Le biais se produit lorsque les décisions du chercheur concernant les personnes à échantillonner sont trop influencées par des jugements personnels, la disponibilité des répondants potentiels ou ses critères implicites d'inclusion.

Un échantillon biaisé ne représente pas la population à partir de laquelle l'échantillon a été sélectionné.

L'utilisation de méthodes d'échantillonnage nécessite également la connaissance de l'échantillonnage et la sélection d'échantillons appropriés.

De plus, si les unités échantillonnées sont susceptibles de changer, il n'est pas facile de maintenir l'homogénéité.

Quel est le principal objectif de l’échantillonnage en recherche ?

L'échantillonnage est le processus de sélection d'un sous-ensemble de personnes ou de phénomènes sociaux dans un univers plus vaste avec pour objectif principal de tirer des conclusions sur le groupe plus large sur la base des informations obtenues auprès du petit groupe.

Quels sont les inconvénients potentiels de la méthode d’échantillonnage ?

La méthode d’échantillonnage peut introduire des biais dans la sélection des unités, conduisant à des conclusions inexactes. Cela nécessite également une connaissance des techniques d'échantillonnage, et si les unités sous-échantillonnées changent, il est difficile de maintenir l'homogénéité.

Qu’est-ce que la population dans l’échantillonnage de recherche ?

UN population (également appelé univers) est la collection totale de tous les éléments de population, dont chacun est un cas potentiel.

Tous les étudiants d'un collège, par exemple, constituent une population d'intérêt, et chaque étudiant du collège interrogé sur son âge, sa taille, son poids ou son opinion sur une question quelconque est un élément de population.

Qu’est-ce que le recensement ?

UN recensement est une enquête ou un décompte de tous les éléments de la population. Toute partie de la population est une échantillon. Si un échantillon est sélectionné selon les règles de probabilité, c’est un échantillon probabiliste ou échantillon aléatoire.

Si un échantillon est aléatoire, il est possible de calculer dans quelle mesure il est représentatif de la population plus large à partir de laquelle il a été tiré. La contrepartie de l’échantillon probabiliste est ce qu’on appelle l’échantillon non probabiliste.

Qu’est-ce que l’échantillonnage non probabiliste ?

Échantillonnage non probabiliste est une méthode d'échantillonnage non aléatoire et subjective dans laquelle la sélection des unités dépend du jugement personnel de l'échantillonneur.

Qu'est-ce qu'une enquête ?

Un sondage est un terme général qui fait référence à collecte de données à l’aide d’entretiens, de questionnaires ou d’observations.

Qu’est-ce qu’une enquête par sondage ?

UN enquête par sondage est une étude impliquant un sous-ensemble (ou échantillon) d’individus sélectionnés dans une population plus large par des méthodes statistiques acceptées.

Qu’est-ce que la population cible ?

Une distinction est parfois faite entre la population cible et la population échantillonnée. Dans la recherche, le population cible représente l’ensemble des unités pour lesquelles les données de l’enquête sont utilisées pour tirer des conclusions et faire des inférences.

Elle peut également être définie comme la population éligible incluse dans les travaux de recherche. On l'appelle aussi le population enquêtée.

Idéalement, les deux seront identiques, mais pour des raisons pratiques, il y aura généralement des différences entre eux.

Cette différence s'explique notamment par le fait qu'une partie de la population couverte par une enquête n'est pas couverte et qu'aucune information n'est donc obtenue à leur sujet.

Selon que les unités d'échantillonnage sont finies ou infinies, une population peut être finie ou infinie.

Qu’est-ce que la population finie ?

UN population finie contient un nombre dénombrable d'unités d'échantillonnage, par exemple tous les électeurs inscrits dans une ville particulière au cours d'une année donnée ou tous les clients qui ont visité le magasin de la ville en mai 2006.

Qu’est-ce que la population infinie ?

Un population infinie se compose d'un nombre infini d'unités d'échantillonnage, telles que le nombre de lancers de pièces jusqu'à ce qu'une face apparaisse. L'échantillonnage conçu pour produire des informations sur les caractéristiques particulières d'une population finie est généralement appelé échantillonnage d’enquête.

Qu’est-ce que l’unité d’échantillonnage ?

Une unité d'échantillonnage ou simplement une unité est un élément ou un groupe d'éléments bien défini, distinct et identifiable sur lequel une observation est effectuée.

Dans certaines études, un individu dans un ménage peut être une unité d'échantillonnage, tandis que dans une autre étude, le ménage peut être une unité d'échantillonnage. UN base de sondage est une liste d’unités ou de groupes d’unités de la population à échantillonner.

Qu’est-ce que la taille de l’échantillon ?

Taille de l'échantillon fait référence au nombre d'unités contenues dans un échantillon, tandis que taille de la population est le nombre d’unités qui constituent la population.

Les caractéristiques de la population sur lesquelles les inférences sont faites sont appelées paramètres.

Pour un plan d’échantillonnage donné, un estimateur est une méthode ou une formule pour estimer la valeur du paramètre.

Un estimation est la valeur numérique de l'estimateur obtenu à partir de l'échantillon. Biais est un terme qui fait référence à la distance entre la valeur moyenne de l'estimateur et le paramètre.

Plan d’échantillonnage fait référence aux plans et aux méthodes à suivre pour sélectionner un échantillon dans la population cible et à la technique d'estimation par rapport à la formule de calcul des statistiques d'échantillon.

Ces statistiques sont les estimations utilisées pour déduire les paramètres de population.

Implicite dans le concept, le plan d'échantillonnage inclut également des questions telles que le choix de la base de sondage, la détermination de la taille de l'échantillon, l'estimation de la fiabilité des estimations, la procédure de stratification, la méthode de répartition de l'échantillon, le regroupement de l'échantillon, etc.

Conception de l'enquête prépare un plan complet d’opérations à suivre pour mener une enquête et diffuser les résultats escomptés.

Nous détaillerons concevoir une enquête dans un article séparé.

Nous soulignons toutefois que les objectifs de l'enquête couverts par le plan d'enquête déterminent le plan d'échantillonnage. En pratique, le plan d’échantillonnage doit être élaboré en tant que partie intégrante du plan d’enquête global.

Le plan d’enquête et le plan d’échantillonnage sont donc deux concepts interdépendants et complémentaires l’un de l’autre.

Il est presque toujours souhaité qu'un plan d'échantillonnage soit évalué pour sa perfection, et un plan d'échantillonnage parfait doit répondre à certains critères, qui comprennent, entre autres, les critères d'exactitude, de fiabilité, de validité et d'efficacité.

Importance de l’échantillonnage

Un échantillon est presque toujours prélevé pour fournir des données statistiques sur un large éventail de sujets, à des fins de recherche et d'administration.

Les exemples suivants sont conçus pour illustrer l’importance de l’échantillonnage dans la vie réelle :

Dans un sondage d'opinion, un nombre relativement restreint de les personnes sont interrogées, et leurs avis sur des questions d'actualité sont sollicités afin de découvrir l'attitude de la communauté dans son ensemble.
Les agences de marketing et de publicité mènent d'innombrables enquêtes pour déterminer les attentes, les attitudes, les habitudes d'achat ou les habitudes d'achat des clients. Ces informations sont utiles aux fabricants de biens pour promotion de ventes. Puisqu’il est impossible d’obtenir ces informations auprès d’un nombre incalculable de clients, cela est réalisé en interrogeant une partie des clients.
De grands lots de produits manufacturés sont acceptés ou rejetés par les services d'achat des entreprises ou du gouvernement après inspection d'un nombre relativement restreint d'articles tirés de ces lots.
Aux postes frontières, les agents des douanes appliquent les lois en vérifiant les effets personnels d'un petit nombre seulement de voyageurs traversant la frontière.
Un grand magasin souhaite déterminer s'il perd ou gagne des clients en prélevant un échantillon de sa liste de titulaires de cartes de crédit en sélectionnant un nom sur dix.
Les auditeurs jugent souvent dans quelle mesure les procédures comptables ont été suivies en examinant un petit nombre de transactions sélectionnées parmi un grand nombre de ces transactions ayant lieu au cours d’une période de temps spécifiée.
Le ministère de la Santé et du Bien-être familial pourrait être intéressé de connaître l'état des connaissances de la population adulte de la ville de Dhaka sur le danger de la pollution environnementale en interrogeant quelques adultes sélectionnés de la ville.

D'innombrables mesures de l'économie, de la santé, de la main-d'œuvre, de l'utilisation des contraceptifs, de la vaccination, du chômage, des revenus, des exportations, des importations, produits industriels, et autres s'appuient sur des échantillons plutôt que sur une énumération complète.

De nombreuses enquêtes sont menées pour développer, tester et affiner des hypothèses en sociologie, psychologie, démographie, sciences politiques, anthropologie, géographie, économie, éducation et santé publique.

Les gouvernements locaux et centraux font un usage considérable des données d'enquête pour connaître les diverses caractéristiques de la population à des fins de planification et de développement.

Dans tous les cas, un échantillon est sélectionné parce qu’il est impossible, peu pratique, lent ou peu rentable de surveiller l’ensemble de la population.

Il est désormais largement admis qu’une enquête par sondage est une méthode de collecte de données populaire et scientifique.

Types d'échantillonnage

Échantillonnage probabiliste

Il fait référence à un échantillon qui a été sélectionné au hasard afin que chaque unité de la population ait une chance connue d'être sélectionnée.

En d’autres termes, les unités individuelles sont choisies parmi l’ensemble du groupe, non pas délibérément mais par certains processus mécaniques.

Ainsi, l’échantillonnage probabiliste est également appelé « échantillonnage aléatoire ».

L'échantillonnage probabiliste est essentiel lorsque les chercheurs souhaitent des descriptions statistiques précises de grandes populations - par exemple, le pourcentage de populations au chômage ou les projets de vote pour le candidat X, etc.

Ainsi, l'échantillonnage probabiliste est utilisé dans les enquêtes à grande échelle. L'échantillonnage probabiliste présente l'avantage d'éliminer les biais humains dans l'échantillonnage. L’erreur d’échantillonnage dans cette méthode peut être réduite au minimum.

L'échantillonnage probabiliste améliore la représentativité de l'échantillonnage et permet la généralisation d'un échantillon à la population.

Il existe trois types de méthodes d'échantillonnage probabiliste : (1) l'échantillonnage aléatoire simple, (2) l'échantillonnage aléatoire stratifié et (3) l'échantillonnage non probabiliste.

1.1) Échantillonnage aléatoire simple

Il s’agit de la forme de base d’un échantillon probabiliste. Dans cet échantillon aléatoire, chaque unité de population a une probabilité égale d’être incluse dans l’échantillon.

Les étapes clés de la conception d’un échantillon aléatoire simple comprennent la définition de la population, le choix de la taille de l’échantillon et la sélection du processus mécanique.

Généralement, dans ce type d'échantillonnage, les unités composant une population se voient attribuer des numéros.

Ensuite, un ensemble de nombres aléatoires est généré et les unités possédant ces nombres sont incluses dans l’échantillon. L'échantillonnage aléatoire simple est exempt de biais et est généralement plus représentatif.

1.2) Échantillonnage aléatoire stratifié

L’échantillonnage aléatoire inclura probablement, par hasard, une proportion plus élevée d’un groupe de personnes qu’elle ne devrait l’être pour qu’il soit véritablement représentatif.

Pour éviter ce problème, un échantillonnage aléatoire stratifié est utilisé. L'échantillonnage aléatoire stratifié est utilisé lorsque la population à partir de laquelle un échantillon est tiré ne constitue pas un groupe homogène..

Ainsi, la stratification consiste à regrouper les unités composant une population en unités homogènes avant échantillonnage. Dans ce type d'échantillonnage, la population est stratifiée selon des critères, puis la sélection est effectuée par échantillonnage aléatoire simple à partir des strates résultantes.

En d’autres termes, selon cette méthode, la population est divisée en plusieurs sous-populations individuellement plus homogènes que la population totale.

Ensuite, la sélection est effectuée dans chaque strate pour constituer un échantillon représentatif.

L'échantillonnage aléatoire stratifié garantit que l'échantillon résultant sera distribué de la même manière que la population en termes de critère de stratification.

L'échantillonnage stratifié peut garantir une plus grande représentativité de l'échantillon si le processus de stratification est basé sur des critères objectifs.

1.3) Échantillonnage systématique

Dans échantillonnage systématique, la population est répertoriée de manière à ce que son ordre puisse identifier de manière unique chaque élément de la population.

La liste des éléments de la population est généralement classée de manière aléatoire en fonction du caractère à mesurer. En ce sens, cela équivaut également à un échantillonnage aléatoire simple.

Cependant, ici, l'échantillon est sélectionné à chaque intervalle d'échantillonnage.

En règle générale, un échantillonnage aléatoire simple nécessite une liste d'éléments. Lorsqu'une telle liste est disponible, les chercheurs ont généralement recours à un échantillonnage systématique.

Par exemple, si la liste contient 10 000 éléments et que le chercheur souhaite un échantillon de 1 000, il doit sélectionner un élément sur dix pour son échantillon.

Échantillonnage non probabiliste

L'échantillonnage non probabiliste désigne un échantillon qui n'a pas été sélectionné à l'aide d'une méthode aléatoire.. Dans cette méthode, les unités de l'échantillon sont sélectionnées délibérément par le chercheur.

Ainsi, dans l'échantillonnage non probabiliste, le le chercheur choisit délibérément des unités de population particulières présentant certaines caractéristiques pour constituer un échantillon, car ces unités représenteront l’ensemble de la population.

Il existe deux principaux types d'échantillonnage non probabiliste : (1) le jugement de l'échantillonnage raisonné et (2) l'échantillonnage par quota.

2.1) Jugement de l’échantillonnage raisonné

Dans le cadre de l'échantillonnage raisonné, le chercheur sélectionne les unités pour former son échantillon selon son propre jugement.

L'essence de ceci méthode est que le chercheur, ayant vraisemblablement une connaissance suffisante de la population et de ses éléments, utilise son expérience pour sélectionner un échantillon qui sera le plus utile ou le plus représentatif.

Cette technique est utile dans les cas où l’ensemble des données est homogène et où le chercheur connaît parfaitement les différents aspects du problème.

2.2) Échantillonnage par quotas

Cela combine des procédures de jugement et de probabilité. Ici, la population est classée en plusieurs catégories en fonction du jugement, des hypothèses ou des connaissances antérieures.

Premièrement, les personnes sont sélectionnées globalement : sexe, âge, classe sociale, localité, etc.

Par exemple, en menant une recherche, le chercheur peut avoir besoin de savoir quelles proportions de la population sont des hommes et quelle proportion est des femmes, quelles proportions de chaque sexe appartiennent à différentes catégories d'âge, niveaux d'éducation, groupes ethniques, etc.

L'échantillonnage par quotas vise à produire un échantillon qui reflète une population en termes de proportions relatives de personnes dans différentes catégories.

L’échantillonnage par quotas est beaucoup plus rapide et moins coûteux que l’échantillonnage probabiliste approprié.

Échantillonnage avec et sans remplacement

Un échantillon peut être tiré avec remplacement (SWR) ou sans remplacement (SWOR).

Supposons que l'échantillon soit prélevé avec remplacement à partir d'une population, finie ou infinie.

Dans ce cas, l'unité tirée est restituée à la population et le nombre d'unités disponibles pour un tirage futur n'est pas affecté.

Par conséquent, la probabilité de tirer une unité restante lors de sélections successives restera inchangée.

Lors d'un échantillonnage sans remise, l'unité tirée n'est pas restituée à la population lors des tirages ultérieurs. Contrairement à l’échantillonnage avec remise, la probabilité de tirer une unité restante lors de sélections successives sera augmentée.

L'échantillonnage avec remise est parfois appelé échantillonnage sans restriction. En général, l’échantillonnage avec remise est moins précis que l’échantillonnage sans remise.

Intuitivement, l’échantillonnage avec remplacement semble plutôt inutile.

En pratique, presque tous les échantillonnages sont effectués sans remise, car il est peu justifié d'étudier les caractéristiques des unités déjà incluses dans la sélection précédente.

L'échantillonnage avec remise présente un intérêt principalement théorique puisque les formules de variance et de variance estimée des estimateurs sont souvent plus simples lorsque l'échantillonnage est effectué avec remise que lorsqu'il est effectué sans remise.

Exemple#1

Supposons que nous ayons 4 membres dans une famille auxquels nous attribuons les numéros de série 1, 2, 3, 4.

Nous devons en sélectionner deux pour un entretien. Dans ce cas particulier, nous disons que nous avons une population de taille 4 (c'est-à-dire AM) à partir de laquelle un échantillon de taille 2 (c'est-à-dire m=2) doit être sélectionné.

Pour sélectionner ces deux membres sans remplacement, il y aura au total 6 échantillons possibles de chacun des 2 membres. Le tableau ci-joint présente tous les échantillons possibles de taille 2 :

Tableau : Échantillons de taille 2 sans remplacement

Échantillon #	Échantillons constitués de numéros de série
1	(1.2)
2	(1,3)
3	(1,4)
4	(2,3)
5	(2,4)
6	(3,4)

En pratique, nous ne traitons qu’un seul échantillon, qui peut correspondre à l’un des cas ci-dessus.

Si l'échantillon numéro 3 est sélectionné, nous rechercherons des informations auprès des membres 1 et 4 pour atteindre les objectifs de notre enquête.

Exemple# 2

Reportez-vous à l'exemple ci-dessus. Si l'échantillonnage est effectué avec remise, il y aura 16 échantillons possibles, chacun de taille 2. Le tableau 5.2 présente ces échantillons.

Tableau : Échantillons de taille 2 avec remplacement

Échantillon #	Numéros de série	Échantillon #	Numéros de série
1	(1-1)	9	(3,1)
2	(1,2)	10	(3,2)
3	(1,3)	11	(3,3)
4	(1,4)	12	(3,4)
5	(2, 1)	13	(4,1)
6	(2, 2)	14	(4, 2)
7	(2, 3)	15	(4,3)
8	(2, 4)	16	(4, 4)

Notez que l’échantillon 3 (par exemple) et l’échantillon 9 sont en fait identiques. Si nous sélectionnons l'échantillon 3, nous n'obtenons aucune information supplémentaire en sélectionnant l'échantillon 9.

Comment fonctionne une méthode d’échantillonnage aléatoire simple ?

L'échantillonnage aléatoire simple est une forme de base d'échantillon probabiliste dans lequel chaque unité de population a une probabilité égale d'inclusion. Les unités se voient attribuer des numéros, un ensemble de nombres aléatoires est généré et les unités portant ces numéros sont incluses dans l'échantillon.

Quelle est la différence entre l’échantillonnage probabiliste et l’échantillonnage non probabiliste ?

L'échantillonnage probabiliste utilise une sélection aléatoire, garantissant que chaque unité de la population a une chance connue d'être sélectionnée. L'échantillonnage non probabiliste est non aléatoire et subjectif, la sélection des unités dépendant du jugement du chercheur.

Qu’est-ce que l’échantillonnage aléatoire stratifié et quand est-il utilisé ?

L'échantillonnage aléatoire stratifié est utilisé lorsque la population n'est pas homogène. La population est divisée en plusieurs sous-populations ou strates, puis des sélections sont effectuées dans chaque strate pour constituer un échantillon représentatif.

En quoi l’échantillonnage avec remise diffère-t-il de l’échantillonnage sans remise ?

Dans l'échantillonnage avec remplacement, une unité tirée est renvoyée à la population pour des tirages futurs, en gardant constante la probabilité de tirer une unité. Dans l'échantillonnage sans remplacement, une fois qu'une unité est tirée, elle n'est pas renvoyée, ce qui modifie la probabilité des sélections successives.

Quelle est la différence entre une population finie et une population infinie en échantillonnage ?

Une population finie contient un nombre dénombrable d’unités d’échantillonnage, comme tous les électeurs inscrits dans une ville. Une population infinie se compose d’un nombre infini d’unités d’échantillonnage, comme le nombre de lancers de pièces jusqu’à ce qu’une face apparaisse.