Link Search Menu Expand Document
Boîte à outils analyse de données quantitatives

2.4.3 Formuler un plan d’analyse


TABLE DES MATIÈRES


Plan de recherche

Une fois la ou les questions ou le problème à l’origine de votre analyse et les ressources à votre disposition identifiées, il est temps d’élaborer un plan d’analyse global sur la façon de procéder.

Vous trouverez ci-dessous un tableau des informations nécessaires pour vous permettre de commencer à élaborer un plan de recherche. Il ne s’agit là que d’un point de départ, vous pourrez apporter des modifications à ce modèle en fonction de votre contexte spécifique.

Question de recherche Indicateur / variable Question du questionnaire Unités de collecte des données Désagrégation souhaitée Type d’analyse
Question de recherche spécifique à laquelle vous essayez de répondre Indicateur calculé (à partir de votre cadre logique !) Question pertinente posée lors de l’enquête Individu ; ménage ; communauté ; etc. Village ; district ; région ; pays ; etc. Répartition des fréquences ; statistiques descriptives ; corrélation ; etc.

Ce n’est pas toujours le cas, mais il est également possible d’intégrer dans le plan d’analyse des détails concernant la manière dont doivent être visualiser des données. Cela peut aider à se projeter sur le type d’analyse que l’on souhaite, et d’anticiper sur le rendu final.

L’élaboration d’un plan de recherche vous aidera à mieux connaître les données dont vous disposez déjà et celles dont vous avez réellement besoin. Pour connaître vos besoins en matière de données, vous pouvez également recourir à la partie 4 - 1 Making decisions to get the data we need et la partie 4 - 4 Hands-on Review with External Data sets of the Module 4: Getting the data we need de l’IFRC Data Playbook (disponible en anglais).
N’hésitez pas à vous pencher également sur le point d’une page 1D Élaboration du plan d’analyse de la ressource Collecte de données : méthodes pour les enquêtes quantitatives, l’exemple des enquêtes CAP qui donne des indications théoriques et concrètes sur le plan d’analyse.

Des exemples spécifiques de chaque section sont fournis dans le plan d’analyse de l’étude de cas qui peut être consulté ici.

Echantillonnage

Pour que qu’une analyse soit correcte, l’échantillon enquêté doit être représentatif de ce que l’on essaye d’étudier. Pour décider de son échantillon, plusieurs étapes sont nécessaires :

  • Les premiers éléments à connaître sont la taille de la population étudiée (par exemple, la population totale d’une ville ou d’un camp), et l’unité d’échantillonnage (par exemple, les individus ou les ménages).
  • Ensuite, il faut choisir la méthode d’échantillonnage : elle peut être aléatoire ou non aléatoire. Pour obtenir des résultats statistiquement représentatifs, l’échantillonnage aléatoire est recommandé mais pas toujours possible :
    • Il existe 5 principaux types de méthodes d’échantillonnage non aléatoires : l’auto-sélection, la boule de neige, le quota, la commodité et le choix raisonné (non étudiés ici). Mais gardez à l’esprit que la représentativité de votre échantillon pourrait ne pas être optimale et pourrait biaiser votre observation.
    • De même, il existe 3 principaux types d’échantillonnage aléatoire : L’échantillonnage aléatoire simple, l’échantillonnage aléatoire systématique et l’échantillonnage en grappes.

Méthodes d’échantillonnage non-aléatoire

L’auto-sélection

Principe : Les individus faisant partie de la population cible sont invités à répondre au sondage. Ils sont libres d’y répondre ou non.

Exemple d’utilisation : Evaluation des besoins en santé
L’organisation présente sur le terrain a mis en place un questionnaire. Elle est présente dans une commune où elle souhaite évaluer les besoins en santé. Les habitants sont invités à venir répondre au questionnaire. Il n’y a pas d’obligation ni de contrepartie à répondre à l’enquête.

  • Avantages : Facile à administrer
  • Limites :
    • Difficulté à obtenir un échantillon représentatif de la population cible
    • Nécessite que toute la population cible ait accès à l’information et soit en mesure de manifester son intérêt à participer au sondage
  • Biais potentiels :
    • Surreprésentation des personnes coopératrices
    • Surreprésentation des personnes qui ont une sensibilité / un attrait pour la thématique de l’enquête

L’échantillonnage boule de neige - « snowball sampling »

Principe :

  1. Choix des n1 premiers répondants (= les germes) parmi la population cible
  2. Les répondants nous redirigent vers d’autres personnes = les répondants de la vague suivante.
  3. (… etc …) Idéalement : Jusqu’à ce qu’on ait une composition de l’échantillon final indépendante de la composition des germes initiaux.

Exemple d’utilisation : Evaluation des besoins d’une population de sans-abris dans une ville.
Comme il n’existe pas de liste de tous les sans-abri de la ville, un échantillonnage aléatoire n’est pas possible. Grâce aux ONGs œuvrant auprès de cette population, vous entrez en contact avec des personnes qui acceptant de répondre. Vous leur demandez ensuite de vous mettre en contact avec d’autres sans-abri de cette ville.

  • Avantages :
    • Permet d’accéder à des répondants difficiles à atteindre.
    • Meilleur taux de participation (*)
    • Réponses plus sincères (*)

(*) Car les répondants sont identifiés et sollicités via un réseau personnel

  • Limites :
    • Difficulté à obtenir un échantillon représentatif de la population cible.
  • Biais potentiels :
    • Surreprésentation des personnes ayant un réseau social étendu. A l’inverse, manque de personnes isolées.
    • Surreprésentation des personnes coopératrices..

La méthode des quotas

Principe : établir des quotas de personnes à enquêter en fonction des caractéristiques et des proportions de la population. L’objectif est d’essayer de donner à l’échantillon une structure similaire à la population mère sur certains critères (hypothèse de normalisation).

image info

Les variables de quotas (x1 et x2) doivent être corrélées avec la variable d’intérêt. Cela nécessite une connaissance a priori des phénomènes étudiés et des principales variables qui déterminent le comportement. Cette méthode est utilisée lorsque la population mère est bien connue.

  • Avantages : Facile à administrer
  • Limites : Il y a un manque fréquent d’informations sur les quotas croisés. Il suffit que l’enquêteur respecte les quotas marginaux pour qu’il soit possible d’obtenir des quotas croisés.
  • Biais potentiels: La probabilité de sélection des individus est inconnue. Un type de population restera non enquêté (biais de sélectivité).

Méthodes d’échantillonnage aléatoire

L’échantillonnage aléatoire simple

Principe: Tous les individus de la population cible ont la même probabilité d’être sélectionnés dans l’échantillon.

Exemple d’utilisation :
Population cible : tous (N) les membres d’un camp de réfugiés.
Sélection de n individus à partir d’une liste de réfugiés tenue à jour par le UNHCR.

En pratique, utilisez la fonction ALEA d’Excel pour générer un nombre aléatoire pour chaque individu, puis sélectionnez les n premiers individus.

  • Limites:
    • Nécessite d’avoir une liste exhaustive de toute la population cible : Bases très lourdes à gérer.
    • La liste doit permettre d’identifier et de contacter les individus sans ambiguïté.
    • Les informations doivent être à jour et de qualité.
    • Dispersion géographique des individus sélectionnés : Coûts et logistique supplémentaires.
  • Biais potentiels:
    • Si la liste ne respecte pas les critères ci-dessus.
    • Si les individus de la population cible ont des caractéristiques très différentes (population cible très hétérogène).

Exemple : Listes administratives : exclusion des ménages qui ne sont pas répertoriés.
Les ménages exclus ont-ils des comportements différents en matière de santé ? Si oui, alors l’échantillonnage est biaisé.

L’échantillonnage aléatoire simple peut être utilisé pour des évaluations approfondies et surtout lorsque :

  • Des données sur la population existent
  • Toutes les parties de la zone affectée sont accessibles
  • La situation est raisonnablement stable
  • Il y a suffisamment de temps pour visiter tous les ménages sélectionnés et réaliser le nombre requis d’entretiens.

L’échantillonnage aléatoire stratifié

Principe : Les individus sont partitionnés en sous-groupes (= strates) homogènes (par rapport à certaines caractéristiques bien distinctes de la population cible). Puis extraction aléatoire simple pour chaque strate.

Dans quels cas utiliser cette méthode ? Lorsque les individus de la population cible ont des caractéristiques très différentes. Auquel cas, un échantillon aléatoire simple pourrait être catastrophique.

Exemple d’utilisation : Evaluation finale d’un programme de santé
Population cible : les membres de 2 villages voisins au sein desquels le programme de santé communautaire a eu lieu.
Strates

  1. Village 1 sans clinique - N1 inhabitants
  2. Village 2 avec clinique - N2 inhabitants

Si n1/N1=n2/N2 –> Même probabilité pour tous les individus d’être sélectionnés = Stratification à allocation proportionnelle

Sélection des individus à enquêter

  • Village 1: n1 habitants sélectionnés aléatoirement
  • Village 2: n2 habitants sélectionnés aléatoirement

Exemple 2: Une école compte 180 élèves filles et 260 élèves garçons. Vous voulez vous assurer que l’échantillon reflète l’équilibre entre les genres, vous triez donc les élèves en 2 strates basées sur le genre. Vous utilisez ensuite un échantillonnage aléatoire sur chaque groupe, en sélectionnant 40 filles et 60 garçons, ce qui vous donne un échantillon représentatif de 100 élèves.

image info

  • Avantages :
    • Permet de représenter l’hétérogénéité de la population cible. Pour cela… les comportements des individus dans une strate donnée doivent être les plus semblables possibles vis-à-vis de la variable d’intérêt.
    • Reflète la représentation réelle de la population – s’il est bien réalisé.
  • Limites :
    • Difficulté à choisir la variable de stratification.
    • Nécessite de l’information auxiliaire pour toutes les unités de la population cible.

Souvent les variables de stratification sont qualitatives et non quantitatives ce qui complexifie la stratification.

L’échantillonnage par marche aléatoire « random walk »

Principe : L’enquêteur marche dans la zone d’enquête en suivant un schéma précis, afin de sélectionner aléatoirement les individus à interroger

Exemple d’un schéma de marche aléatoire :

  1. Sélectionnez aléatoirement un point de départ (par exemple, une intersection sélectionnée au hasard).
  2. Quand vous arrivez à cet endroit, faites tourner un stylo pour choisir la direction dans laquelle vous marcherez en premier.
  3. Pour décider quel ménage vous visiterez en premier, choisissez au hasard un nombre de 1 à 10 et visitez le ménage donné (par exemple, si vous choisissez au hasard 5, visitez le 5ème ménage).
  4. Continuez l’enquête tous les X ménages (par exemple, tous les 7 ménages) en vous basant sur le nombre total de ménages et la taille de votre échantillon (ce que l’on appelle l’intervalle d’échantillonnage).
  5. Lorsque vous arrivez à la fin de la zone selon la direction donnée, vous tournez à nouveau le stylo.
  6. Continuez dans cette direction jusqu’à ce que vous ayez interrogé le nombre de répondants requis.
  • Avantages : Ne nécessite pas d’avoir une liste de ménages en amont de la collecte.
  • Limites : Représentativité de la population en cas d’absence de certains ménages lors de l’enquête.

Définir la taille de l’échantillon

La taille de l’échantillon varie selon :

  • La taille de la population d’d’intérêt
  • Le niveau de confiance souhaité
  • Le niveau de precision souhaité (erreur d’échantillonnage)

Niveau de confiance

Avant toute chose, vous devez définir le niveau de confiance.souhaité. Il s’agit de la certitude que les résultats de l’échantillon reflètent fidèlement (sont représentatifs de) l’ensemble de la population étudiée. Le niveau de confiance généralement utilisé est de 95%.
Un niveau de confiance de 95% signifie que 95 fois sur 100, les résultats de l’échantillon reflèteront fidèlement l’ensemble de la population. Si les évaluateurs sont prêts à être certains à 90 %, ils pourront utiliser un échantillon plus petit. S’ils veulent être sûrs à 99%, ils auront besoin d’un échantillon plus grand.

Niveau de précision

Il est ensuite important de réfléchir au niveau de précision des estimations souhaité. On parle d’erreur d’échantillonnage, ou encore de marge d’erreur. Il s’agit de la différence moyenne entre toutes les estimations pour tous les échantillons possibles et la valeur obtenue si la population totale avait été étudiée.

Exemple : un sondage peut indiquer que 48 % des femmes fréquentent un centre de santé, avec une erreur d’échantillonnage de +/- 3 points, ce qui signifie que si toutes les femmes de la population mère étaient interrogées, la proportion réelle serait de 45 à 51 % (48 +/-3 %) de femmes qui fréquentent un centre de santé. C’est ce qu’on appelle l’intervalle de confiance.

Définir la taille de l’échantillon

La taille de l’échantillon est fonction de la taille de la population d’intérêt, du niveau de confiance souhaité et du niveau de précision souhaité. La taille de l’échantillon peut être déterminée en :

  1. Utilisant une formule. Les calculateurs en ligne suivants permettent d’estimer la taille de l’échantillon dont vous avez besoin pour :
  2. Utilisant un tableau de référence qui indique la taille de l’échantillon nécessaire pour un niveau de confiance donné:

image info

Selon la méthode d’échantillonnage, la taille de l’échantillon, la marge d’erreur et le niveau de confiance vont varier :

  • Taille de l’échantillon : nombre d’unités enquêté = taille de la population fille/observée.
  • Niveau de confiance: la certitude que les résultats de l’échantillon reflètent la réalité, en restant en-dessous de la marge d’erreur. Un niveau de confiance plus élevé nécessite une taille d’échantillon plus importante.
    • Généralement 95%
  • Erreur d’échantillonnage: marge d’erreur : la différence moyenne entre toutes les estimations pour tous les échantillons possibles et ce qui existe dans la population cible/mère ( = valeur réelle – valeur estimée/observée).
    • Généralement 5%

Le niveau de confiance et la précision souhaités peuvent être améliorés en augmentant la taille de l’échantillon. La norme à viser est un niveau de confiance de 95 % (marge d’erreur +/- 5 %). Plus la marge d’erreur est grande, moins les résultats sont précis. Plus la population est petite, plus le rapport entre la taille de l’échantillon et la taille de la population est important.

Pour aller plus loin, voir :