5.5.3 Erreurs fréquentes de débutants
À force de travailler avec des formulaires d’enquêtes conçus directement en ligne dans des interfaces ergonomiques, beaucoup en oublie les bonnes pratiques de base en conception d’enquête !
Voici une liste des 6 recommandations les plus fréquentes pour les débutants. Elle n’est en aucun cas complète, mais vous aidera à éviter les pièges habituels que nous avons tous traversés.
- Limitez autant que possible votre collecte de données
- Vérifiez trois fois vos schémas de saut
- Fermez vos questions ouvertes lorsque vous le pouvez
- Assurez-vous que votre liste d’options est complète
- Ajoutez des listes en cascade lorsque vous le pouvez
- Assurez-vous que vos noms de variables sont significatifs
Pour en savoir plus sur les paramètres que vous pouvez inclure dans votre formulaire pour garantir la qualité des données de sortie, veuillez vous reporter à la section 5.6.7 Aide-mémoire XLSForm pour des exemples de contraintes, de répétitions, de calculs, de regex, de listes en cascade, de paramètres d’apparence.
TABLE DES MATIÈRES
- Contraignez autant que possible votre collecte de données
- Vérifiez trois fois vos schémas de saut de questions
- Fermez vos questions ouvertes quand vous le pouvez
- Assurez-vous que votre liste d’options est complète
- Ajoutez des listes en cascade lorsque vous le pouvez
- Assurez-vous que vos noms de variables sont significatifs
Contraignez autant que possible votre collecte de données
Afin de faciliter le traitement futur des données et donc la qualité de ces dernières, il est possible de spécifier des contraintes lors de la création d’un formulaire.
Risque à ne pas respecter cette suggestion : Cela permet d’éviter les valeurs incohérentes (et donc éviter un nettoyage des données trop conséquent au moment de l’analyse des données)
Il est donc conseillé :
- D’empêcher la saisie de valeurs négatives quand ce n’est pas possible (Ex : Il ne peut y avoir -3L d’eau dans un récipient), et plus globalement de toujours spécifier les valeurs minimales et maximales d’un chiffre à renseigner.
- Dans une question à choix multiple, d’empêcher la sélection de deux valeurs incompatibles (Ex : « raison 1 » et « ne sais pas »).
- Vérifier la concordance des valeurs, par exemple en imposant l’adéquation du sous-ensemble avec les ensembles : conditionner la validation d’une valeur saisie à une réponse précédente (Ex : Il ne peut pas y avoir une composition d’un ménage avec un nombre plus important d’enfants que de membres du ménage dans son ensemble, tout comme la date du jour ne peut pas se situer dans le futur).
- Obliger la saisie d’un certain format quand c’est nécessaire : utilisation de la contrainte regex (Ex : Tel qu’un numéro de téléphone ou une adresse email qui doit être du format __@__._).
A propos des regex vous pouvez consulter 5.7.5 Pour aller plus loin
Attention: Dans le cas d’un formulaire d’enquête conçu pour être repris et adapté dans différents contextes, avoir des contraintes difficilement compréhensibles peut complexifier sa prise en main par quelqu’un d’autre qui n’a pas votre niveau de connaissances en la matière. Assurez-vous dans ce cas de bien documenter les aspects qui peuvent paraitre complexes de prime abord.
Vérifiez trois fois vos schémas de saut de questions
Il est fréquent pour un questionnaire d’avoir des sauts de question, c’est-à-dire des questions qui ne sont que posées en fonction de la réponse à d’autres questions. Si ceux-ci sont mal paramétrés, cela peut avoir un impact sur la qualité de vos données, sachant que celles-ci seront incomplètes ou inadaptées (Ex : demander à un ménage qui n’a pas bénéficié d’une distribution de semences ce qu’ils ont pensé de cette dernière).
Risque à ne pas respecter cette suggestion :
- Perte de temps pour les enquêtés sur des questions qui ne les concernent pas.
- Etre forcé de choisir des réponses incohérentes afin de passer aux questions suivantes si celles-ci sont obligatoires.
- D’avoir des incohérences lors de l’analyse des données (dont certaines pourraient être rattrapables par du nettoyage fastidieux à posteriori, mais d’autres non).
Il est donc conseillé :
- D’identifier les questions qui ne sont pertinentes que dans certains cas.
- De conditionner la possibilité de répondre à ce type de question aux réponses précédentes.
- De s’assurer que vous gérez aussi les sauts de questions de manière cohérente dans les calculs effectués (voir section “Calculations: dealing with blanks” dans le premier tutoriel avancé dans la section 5.7.5 Pour aller plus loin
Fermez vos questions ouvertes quand vous le pouvez
Il est fréquent que l’on ait besoin d’avoir des questions ouvertes pour avoir un retour qualitatif sur un aspect. Néanmoins, si l’analyse a besoin d’être également quantitative, il est important de toujours se demander si cette question ne pourrait pas être constituée d’options possibles de réponse si certaines options reviennent fréquemment, quitte à avoir une option « autre » ou une variable texte « commentaire » associée en complément pour pouvoir rajouter du détail dans les cas où c’est nécessaire.
Risque à ne pas respecter cette suggestion :
- Perte de temps lié au nettoyage de données
- Qualité des données réduite
C’est pourquoi lors de la conception d’un formulaire où l’on souhaite privilégier l’analyse quantitative, il est suggéré de privilégier une question fermée plutôt qu’une question ouverte. Cela…
- Facilite le choix de réponse pour l’enquêteur avec une liste bien établie.
- Evite le recodage des réponses lors de l’analyse. (Ex : au lieu de laisser une réponse ouverte pour « Qu’avez-vous mangé ce midi ? » il est possible de proposer une liste comme : « légumes, féculents, viande, fruits, autre, rien » et de laisser la possibilité aux répondants de sélectionner plusieurs réponses).
Attention: Avoir une question à choix unique ou multiple induit le besoin d’inclure les garde-fous nécessaires !
Assurez-vous que votre liste d’options est complète
Travailler avec des questions à choix unique ou multiple comme suggéré dans le point ci-dessus nécessite de bien réfléchir à la liste d’options que l’on prévoit, pour s’assurer que l’on en oublie aucune.
Risque à ne pas respecter cette suggestion :
- Des réponses erronées et sélectionnées au hasard (si la question est obligatoire), et également difficilement identifiables lors du nettoyage de données
- Des frustrations des enquêteurs et enquêtés
Pour chaque liste d’options de réponses, pensez à identifier tous les gardes fous qui pourraient être nécessaires pour cette question :
- Autre
- Aucun
- Ne sait pas
- Non applicable
- Ne souhaite pas répondre
- La bonne personne pour répondre est absente
- …
Ajoutez des listes en cascade lorsque vous le pouvez
Comme évoqué dans le point numéro deux, il arrive que certaines questions ne soient pas pertinentes en fonction de réponses précédentes : c’est également le cas pour certains choix de réponses. En effet, l’exemple le plus probant est lorsqu’un questionnaire traite de différents niveaux administratifs et demande par exemple à l’enquêté de sélectionner la région, puis le district et enfin la localité (Ex : Si un formulaire demande au répondant son pays d’origine et sa ville de naissance, il est assez étrange que celui-ci sélectionne “République Démocratique du Congo” pour son pays et est ensuite ait la possibilité de sélectionner “Ouagadougou” pour sa ville).
Risque à ne pas respecter cette suggestion :
- Qualité des données si une donnée incorrecte a été saisie par mégarde
- Lourdeur pour les enquêteurs
Il est donc nécessaire de mettre en place une liste en cascade pour :
- Faciliter la saisie pour les répondants en évitant des listes de réponses interminables
- Faciliter l’analyse car cela réduit les variables possibles pour chaque couche renseignée
Pour plus d’informations sur les listes en cascade, reportez-vous à la partie 5.6.7 Aide-mémoire XLSForm
Assurez-vous que vos noms de variables sont significatifs
Un des derniers aspects à prendre en compte lors de la création directe de formulaire en ligne est le fait que les « names » (noms informatiques) attribués aux questions par l’outil de conception sont générés automatiquement. Le fait de les renommer est plutôt une bonne pratique en gestion de données : elle s’applique majoritairement dans le cas où le questionnaire va être utilisé par plusieurs personnes ou à plusieurs reprises, ou que la base de données est très conséquente et donc qu’on souhaitera voir en noms de colonnes des noms courts et parlants plutôt que des libellés complets. Si le concepteur du formulaire comprendra de quoi il s’agit, quelqu’un qui prend en main une base de données sans avoir travaillé à sa conception peut vite se retrouver bloqué dans sa compréhension.
Risque à ne pas respecter cette suggestion :
- Cela complique l’analyse : les noms informatiques des variables sont les noms que porteront les questions dans l’export des données que vous pouvez utiliser à la place des libellés des questions parfois un peu longs. Attention, si ceux-ci ne sont pas clairs cela nécessitera la consultation du questionnaire initial pour comprendre à quoi ils font référence.
- Cela rend difficile la compréhension technique du formulaire : lire un nom informatique de variable non retravaillé ne permet pas forcément d’identifier de quoi on parle, ni de distinguer deux variables proches facilement - notamment pour celui qui n’a pas conçu le formulaire. (Ex : ici 001 indique une question concernant les moins de 30 ans mais nous n’avons aucun moyen de le savoir)
Il est donc conseillé de :
- Nommer directement les variables de manière compréhensible pour permettre aux personnes extérieures à la construction du formulaire de comprendre celui-ci (pensez à éviter les caractères spéciaux, accents, et espaces qui ne seront pas considérés valides)
- Faire en sorte que les noms ne soient pas trop longs pour rester facilement lisibles dans l’outil d’analyse
Reportez-vous à la section précédente pour connaître les bonnes pratiques en matière de dénomination des variables et des options. Reportez-vous à la section 5.6.2 Démarrer avec le constructeur de formulaire pour savoir où renommer les variables et les options dans le constructeur de formulaires en ligne KoBoToolbox et dans XLSForm.