Procédure d'échantillonnage
- LES CARACRERISTIQUE DE L'ÉCHANTILLON
Les objectifs et contraintes ont dicté le plan de sondage. L'échantillon possède les caractéristiques suivantes:
- Les 12 mois de collecte ont été divisés en 11 périodes de 33 ou 34 jours appelées cycles. Chaque cycle comprend 30 jours de collecte et 3 ou 4 jours pour le bouclage des interviews et le déplacement des équipes.
- Durant un cycle, une équipe travaille dans deux districts de recensements (DR). Les DR sont des unités géographiques formées lors du recensement de 1988. La taille varie généralement entre 50 et 300 ménages, avec une moyenne de 100 ménages. En zone rurale, une équipe effectue un passage de 15 jours dans un DR. Il revient environ 6 mois plus tard dans le meme DR. En zone urbaine, chaque enquêteur principal travaille dans un DR pendant 30 jours. Les deux DR urbains sont situés dans la même commune.
- Les ménages à enquêter seront visités tous les trois jours. Au Sénégal, les dépenses d'alimentation se font souvent au jour le jour et une durée plus longue augmenterait le risque d'oubli de certaines dépenses. Dans cet intervalle de temps l'équipe rend visite aux deux groupes avant de revenir au premier.
- Il est prévu qu'une équipe couvre 30 ménages urbains (soit 2 DR) ou 24 ménages ruraux (soit 1 DR) par passage. En zone urbaine, il faut dix visites à l'enquêteur pour remplir le questionnaire. Il devrait pouvoir interviewer 5 ménages par jour (15 tous les trois jours). Les deux passages en zone rurale permettront aussi dix visites auprès des ménages, mais la charge de travail par visite sera plus importante parce que certaines sections du questionaire devront être administrées à chaque passage. Il est donc supposé que dans un DR rural un enquêteur ne peut interviewer que 4 ménages par jour (12 en trois jours). Noter qu'en zone urbaine les deux enquêteurs travaillent dans deux DR différents en zone urbaine et dans le même DR en zone rurale. Le nombre de ménages enquêtés par DR est de 15 et 24 respectivement.
- LA BASE DE SONDAGE
Comme pour la plupart des enquêtes-ménages, le plan de sondage prévoit l'utilisation d'unités aréolaires (les DR) desquelles seront tirés des ménages à enquêter. En plus des avantages pratiques liés au contrôle et au transport, cette méthodologie d'échantillonnage à plusieurs degrés permet une mise à jour de la liste des ménages des DR échantillonnés. Si celle-ci est faite peu de temps avant le passage de l'équipe, le biais causé par l'omission de nouveaux ménages est presque éliminé.
Au Sénégal, outre la liste des DR du recensement de 1988 (RGPH/88), on bénéficie d'un échantillon maître de secteurs de dénombrement (regroupements de DR) qui présente certains avantages pour l'ESAM. Dans les grandes villes cette base a déjà été stratifiée selon quelques caractéristiques socio-économiques. Finalement, en tirant l'échantillon de l'ESAM de celui de l'Echantillon-maître les résultats de cette dernière seront plus comparables avec ceux d'autres enquêtes-ménages ayant utilisé de l'Echantillon-maître.
Pour ces raisons, l'échantillon de DR de l'ESAM a été tiré de celui des secteurs de dénombrement de l'Echantillon-maître. Le plan de sondage de l'Echantillon-maître est présenté dans la section suivante.
- L'ÉCHANTILLON-MAÎTRE
L'Echantillon-maître a été proposé en 1990 pour améliorer l'efficacité des opérations des enquêtes-ménage (voir D. Megill, 1990). C'est un échantillon à deux degrés d'unités aréolaires. L'unité primaire de sélection est la commune en zone urbaine et la communauté rurale en zone rurale. L'unité secondaire de sélection dans les deux cas est le secteur de dénombrement (SD). Dans les unités primaires, les secteurs de dénombrement ont été formés en regroupant des DR adjacents de sorte à obtenir des unités d'une taille minimum de 200 ménages en zone urbaine et 250 ménages en zone rurale. Cela donne en moyenne deux DR urbains et trois DR ruraux par secteur de dénombrement.
La stratification de l'Echantillon-maître est effectuée à plusieurs niveaux. En premier lieu une stratification est faite suivant le découpage administratif du Sénégal. En zone urbaine, la région urbaine de Dakar, les autres grandes villes ou communes, et les petites communes forment le second niveau de stratification. La région représente l'unique niveau de stratification dans la zone rurale.
A Dakar et dans chaque "grande ville" (les 9 capitales régionales et Mbour), les secteurs de dénombrement ont été ensuite groupés en strates socio-économiques. Le nombre de strates dans une commune peut varier de un à quatre. La région urbaine de Dakar, avec ses cinq communes (Dakar, Pikine, Rufisque, Guédiawaye et Bargny), a 14 strates en tout.
La taille de l'échantillon-maître a été déterminée de façon à permettre aux enquêtes-ménages qui nécessitent un grand échantillon de pouvoir utiliser celui-ci comme base de sondage. Les enquêtes plus petites utiliseront un sous-échantillon de l'Echantillon-maître. Le nombre de secteurs de dénombrement retenu est de 396 pour la zone urbaine et 204 pour la zone rurale, ce qui donne un taux plus élevé en zone urbaine.
L'échantillon de secteurs de dénombrement est un échantillon tiré avec probabilité proportionnelle à la taille (PPT) dans chaque zone, la taille du secteur de dénombrement étant le nombre de ménages. Cet échantillon permet d'obtenir un échantillon autopondéré de ménages pour toute enquête qui se sert du même nombre de ménages dans chaque secteur de dénombrement. Par autopondéré on veut dire que chaque ménage aura la même probabilité de figurer dans l'échantillon et donc le même poids pour l'estimation.
La sélection de l'Echantillon-maître a été faite indépendamment dans chaque strate. Pour que l'échantillon soit avec probabilité proportionnelle à la taille à travers les strates, le nombre de secteurs de dénombrement tirés dans chaque strate a été déterminé pour être approximativement proportionnel au nombre de ménages dans la strate. Le nombre voulu de secteurs de dénombrement a ensuite été tiré selon la méthode d'échantillon systématique avec probabilité proportionnelle à la taille.
Des méthodes pour la sélection d'un échantillon systématique avec probabilité proportionnelle à la taille sont données dans Scott et Sylla (1989) et Megill (1990). On dresse la liste des unités de la population et calcule le cumul des tailles de ces unités (nombre de ménages). On calcule un pas de sondage P égal à la taille de la population divisée par le nombre d'unités à tirer N. On choisit comme point de départ un nombre aléatoire A inférieur à P et on retient l'unité i dont le résultat du cumul est supérieur ou égal à:
A + (i - 1)* P avec (i = 1 à N).
Une caractéristique de l'échantillon systématique est que celui-ci est réparti également à travers la liste de la population. Si cette liste est triée géographiquement et/ou par sous-strate, l'échantillon sera réparti proportionnellement à la taille des régions et/ou des sous-strates. La base de l'Echantillon-maître a été triée géographiquement dans chaque strate (selon le département et le numéro de commune dans les petites communes; selon le département, l'arrondissement et la communauté rurale en zone rurale).
La méthode de sélection présentée ci-dessus a été légèrement modifiée dans la zone rurale et pour les petites communes. Pour les petites communes de chaque région, des communes ont été sélectionnées en premier avec probabilité proportionnelle à la taille, puis des secteurs de dénombrement selon le même principe. Dans certaines régions qui n'avaient pas suffisamment de communes les secteurs de dénombrement ont été retenus directement sans passer par la commune. Pour les autres régions au moins deux secteurs de dénombrement ont été sélectionnés dans chaque commune choisie.
Pour l'échantillon rural dans chaque région, des communautés rurales ont été d'abord tirées avec probabilité proportionnelle à la taille, puis deux secteurs de dénombrement ont été tirés de chaque communauté, selon la même méthode. Deux exceptions sont à noter: les communautés de Touba Mosquée et de Mboro, dont les tailles justifient une sélection de 6 et de 4 secteurs de dénombrement, respectivement (un nombre pair étant recherché).
- LE TIRAGE DES DR DE L'ÉCHANTILLON DE L'ESAM
Stratification et répartition de l'échantillon
Le nombre de districts de recensement (DR) à choisir est fonction de la taille de l'échantillon de ménages. Elles sont de 1980 ménages pour la zone urbaine et 1320 pour la zone rurale. A raison de 24 ménages par DR rural et 15 par DR urbain, on obtient des tailles d'échantillon de 55 DR ruraux et 132 DR urbains.
La stratification de l'échantillon de l'ESAM n'est pas très poussée à cause du nombre relativement petit de DR qui doivent être répartis parmi les 11 cycles. Il y a donc trois niveaux de stratification : urbain contre rural; urbain à Dakar contre urbain hors Dakar; et à l'intérieur de Dakar selon le niveau socio-économique.
Les 132 DR de l'échantillon urbain ont été répartis proportionnellement au nombre de ménages pour donner 74 DR à Dakar et 58 hors Dakar. Ces chiffres sont pairs pour permettre de choisir un nombre pair de DR dans chaque commune urbaine comme prévu par la méthode de collecte.
En zone rurale et en zone urbaine hors Dakar, une stratification géographique implicite a été obtenue du fait que la base de sondage a été triée par région avant la sélection d'un échantillon systématique. L'échantillon est donc réparti proportionnellement au nombre de ménages de chaque région, mais les tailles d'échantillon par région sont aléatoires du fait que le nombre de ménages par région n'est pas multiple du pas de sondage utilisé.
A Dakar, une deuxième stratification explicite a été faite selon les strates socio-économiques de l'Echantillon-maître pour améliorer la précision des résultats. Il y a 4 strates dans la commune de Dakar (niveaux "élevé", "moyen-élevé", "moyen-faible" et "faible"), une seule dans la commune de Bargny, et trois dans chacune des autres communes (les niveaux "élevé" et "moyen-élevé" ont été regroupés). On a retenu les trois dernières strates pour l'ensemble de la région rebaptisées strates des niveaux "élevé", "moyen" et "faible". La répartition proportionnelle de l'échantillon dans ces trois strates donne 28 DR de niveau "élevé", 22 DR de niveau "moyen" et 24 DR de niveau "faible".
Les secteurs de la commune de Bargny, quoique dans une même strate de l'Echantillon-maître, ont été répartis parmi les trois strates de l'ESAM. Dans deux des strates, cela ne posait pas de problème puisque chacune avait deux secteurs dans l'Echantillon-maître. L'unique secteur de la strate élevée n'était pas dans l'Echantillon-maître. Cependant il a été décidé de faire comme si ce secteur était représenté dans l'Echantillon-maître par les secteurs choisis dans la strate élevée de la commune avoisinante de Rufisque, c'est-à-dire qu'on a ajouté ce secteur à la liste des secteurs de la strate élevée de la commune de Rufisque.
Sélection de l'échantillon
L'échantillon de l'ESAM est un échantillon de DR tiré de l'Echantillon-maître de secteurs de dénombrement. Les DR ont été choisis en sélectionnant dans un premier temps un nombre équivalent de secteurs de dénombrement parmi ceux de l'Echantillon-maître, puis en choisissant un DR par secteur de dénombrement avec probabilité proportionnelle à la taille. Si l'échantillon de secteurs de dénombrement de l'ESAM est tiré avec probabilité proportionnelle à la taille, celui de DR l'est également.
La sélection de l'échantillon de secteurs de dénombrement est expliquée séparément pour chaque strate de l'ESAM.
- Sélection de l'échantillon dans la région urbaine de Dakar
Si l'Echantillon-maître est choisi avec probabilité proportionnelle à la taille, un sous-échantillon de secteurs de dénombrement sera lui aussi avec probabilité proportionnelle à la taille si on donne à chaque secteur de dénombrement la même probabilité d'être retenu dans le sous-échantillon. Dans les strates de l'ESAM, l'Echantillon-maître n'est qu'approximativement avec probabilité proportionnelle à la taille du fait que chaque strate regroupe plusieurs strates de l'Echantillon-maître. A moins d'ajuster la méthode de sélection, ce caractère approximatif se répercute dans le sous-échantillon de l'ESAM tiré de l'Echantillon-maître.
Pour rectifier le fait que l'Echantillon-maître n'est plus exactement avec probabilité proportionnelle à la taille dans les strates de l'ESAM on choisit l'échantillon de cette dernière à l'intérieur des strates de l'Echantillon-maître (où ce dernier est à probabilité proportionnelle à la taille). Si le nombre de secteurs de dénombrement tiré dans chaque strate de l'Echantillon-maître est, en moyenne, exactement proportionnel à la taille de la strate et que le sous-échantillon de secteurs de dénombrement est choisi avec probabilités égales alors le sous-échantillon sera probabilité proportionnelle à la taille.
Pour déterminer la taille de l'échantillon à tirer dans chaque strate de l'Echantillon-maître on peut choisir un premier échantillon de secteurs de dénombrement avec probabilité proportionnelle à la taille à partir d'une liste complète des secteurs de dénombrement triée par le numéro de strate de l'Echantillon-maître. On ne retient pas l'échantillon choisi, puisqu'il peut inclure des secteurs de dénombrement qui ne font pas partie de l'Echantillon-maître, mais le nombre de secteurs de dénombrement sélectionné dans chaque strate de l'Echantillon-maître indique le nombre de secteurs de dénombrement qu'il faudra choisir de l'Echantillon-maître pour cette strate.
Pour chaque strate de l'ESAM à Dakar, le sous-échantillon de secteurs de dénombrement a été tiré suivant la méthode ci-dessus. Une fois qu'on a identifié le nombre de secteurs à tirer dans chaque strate de l'Echantillon-maître, on a choisi ce nombre de secteurs avec probabilités égales à partir de l'Echantillon-maître (un tirage systématique a été utilisé). Il est utile de rappeler que l'unique secteur de niveau élevé dans Bargny a été rattaché à la strate Rufisque-élevé de l'Echantillon-maître pour cette étape.
- Sélection de l'échantillon urbain hors Dakar
L'Echantillon-maître hors Dakar est stratifié par strates socio-économiques dans les grandes villes et par région ailleurs. Il n'est qu'approximativement avec probabilité proportionnelle à la taille pour l'ensemble de la zone urbaine hors Dakar. De plus, le fait que l'ESAM doit avoir un nombre pair de secteurs de dénombrement dans chaque commune complique un peu la sélection de l'échantillon.
On a identifié la taille de l'échantillon de l'ESAM dans chaque commune suivant la méthode qui a été proposée au point 6.2.1. On a obtenu d'abord le nombre de "paires" de secteurs de dénombrement par commune en tirant un échantillon de 29 DR avec probabilité proportionnelle à la taille (soit la moitié du nombre voulu) à travers toute la zone urbaine hors Dakar. La taille de l'échantillon retenue dans chaque commune est le double de celle dans l'échantillon de "paires".
Neuf des "paires" ont été tirées dans les petites communes. La sélection de 2 secteurs de dénombrement dans chacune a été simple parce que l'Echantillon-maître n'était pas stratifié dans ces petites communes et, avec une exception, il avait échantillonné au moins deux secteurs dans chacune. On a donc choisi 2 des ces secteurs avec probabilités égales. La commune de Guinguinéo n'avait qu'un secteur dans l'Echantillon-maître. Il a été retenu deux fois dans l'ESAM (chacun de ses deux DR a été retenu).
Dans les grandes villes, où l'Echantillon-maître est stratifié, on a choisi le nombre voulu de secteurs de dénombrement comme à Dakar. On a identifié d'abord le nombre de secteurs à tirer dans chaque strate de l'Echantillon-maître puis on a choisi ce nombre par un sous-échantillon à probabilités égales à l'intérieur de la strate.
L'échantillon urbain hors Dakar ainsi choisi est un échantillon avec probabilité proportionnelle à la taille.
- Sélection de l'échantillon rural
L'Echantillon-maître rural est stratifié par région, et donc le regroupement des régions donne ici aussi un Echantillon-maître qui n'est qu'approximativement avec probabilité proportionnelle à la taille. Pour que l'échantillon de secteurs de dénombrement tiré pour l'ESAM soit avec probabilité proportionnelle à la taille, il a fallu procéder en deux temps comme il a été expliqué précédemment. On a tiré un premier échantillon pour obtenir le nombre de secteurs de dénombrement dans chaque région. On a ensuite tiré ce nombre de secteurs en prenant un sous-échantillon avec probabilités égales de l'Echantillon-maître dans la région.
- Résultats de la sélection
L'échantillon renferme 187 DR. A Chaque DR est attribué un numéro de trois chiffres propre à l'ESAM. Le premier chiffre indique la strate : 1 pour Dakar élevé; 2 pour Dakar moyen; 3 pour Dakar faible; 4 pour Autre urbain; et 5 pour Rural. Les deux autres chiffres sont une numérotation séquentielle simple des DR. Par exemple, les DR ruraux sont numérotés de 501 à 555.