Link Search Menu Expand Document
Boîte à outils visualisation de données

4.4 Diagrammes de dispersion


Quand les utiliser : Les diagrammes de dispersion sont utiles pour afficher la corrélation ou le regroupement dans de grands ensembles de données, notamment lorsque l’ordre des points dans l’ensembles de données n’est pas essentiel (par exemple, si non recueillis dans le temps). Les lignes de tendance peuvent également être utilisées pour afficher les relations linéaires ou exponentielles dans des directions positives ou négatives, tout en ayant la possibilité de mettre en évidence les valeurs aberrantes.

Dans notre étude de cas, nous avons créé un diagramme de dispersion qui représente la taille des ménages de nos enquêtés et le nombre de jours que dure l’aide alimentaire pour les ménages. Étant donné que l’aide à alimentaire est souvent une taille standardisée (ou une valeur, dans le cas de l’aide en espèces), notre hypothèse était que la durée de l’aide alimentaire diminue en fonction de la taille du ménage.

image info

Comme nous l’avons vu ci-dessus, à travers nos graphiques et la ligne de tendance, il existe un schéma clair montrant que le nombre de jours que dure l’aide alimentaire diminue en fonction de la taille des ménages.

Bonnes pratiques : Il est préférable de ne jamais dépasser les deux lignes de tendance, car sinon les relations entre les variables peuvent devenir surchargées et difficiles à déchiffrer. Les diagrammes de dispersion doivent également être utilisés uniquement pour les variables quantitatives.

Quand les éviter : Les diagrammes de dispersion ne fournissent de valeur à la reconnaissance de schémas que s’il y a un ensemble de données volumineux. Évitez donc d’y avoir recours lorsque vous n’avez pas beaucoup de données. En outre, les diagrammes de dispersion fournissent une valeur visuelle uniquement s’ils affichent une corrélation claire ou un regroupement entre deux variables. Parce qu’ils ne peuvent être utilisés qu’avec des variables quantitatives, les diagrammes de dispersion ne sont donc pas pertinents pour visualiser la distribution des fréquences (combien de fois apparait une valeur), courante dans le secteur humanitaire.