5.5.1 Éléments clés
16-Sept-2022
5 mins
L’objectif de cette section est de construire votre formulaire de manière à ce que les données saisies soient courtes et simples et que les données collectées soient aussi “prêtes à l’emploi “ que possible pour l’analyse. N’oubliez pas que “le bon sens n’existe pas”.
- Demandez-vous s’il n’y a pas des données disponibles dans une autre base de données que vous pourriez soit éviter de collecter dans cette enquête, soit réinjecter directement dans vos soumissions par le biais de valeurs calculées en utilisant les fonctions “CSV externe” pour réduire les erreurs et limiter la saisie de données.
- Considérez tout multimédia que vous pourriez vouloir inclure et qui pourrait être pertinent pour votre compréhension opérationnelle, le contrôle de la qualité ou la responsabilité/le rapportage (ajouter une photo de l’infrastructure pour vérifier sa catégorisation, un point GPS, un enregistrement audio de la personne interrogée, un dessin…)
- Appliquer une logique exhaustive de validation des données : il ne devrait jamais y avoir de champs numériques ouverts (les contraintes maximales et minimales peuvent presque toujours être dérivées de données secondaires et/ou du pilotage/de l’expérience), vous pouvez également utiliser des contraintes Regex, limiter le nombre de caractères saisis pour les champs de texte si cela a du sens, s’assurer que les réponses aux options multiples sélectionnées sont adaptées (c’est-à-dire que vous avez sélectionné un nombre minimum ou maximum d’options, que vous n’avez pas sélectionné “aucun” en même temps qu’une autre option, etc.
- Rendez obligatoires autant de questions que possible- ne considérez toutefois que les questions qui peuvent être remplies dans 100 % des cas (par exemple, ne rendez pas obligatoire un point GPS, car cette fonction dépend de la stabilité de votre appareil mobile).
- Vérifiez que les questions obligatoires à choix unique/options multiples comportent toutes les garanties nécessaires (“Ne sait pas”, “Inconnu”, “Autre”, “N/A”, “Aucune de ces réponses”, “Refuse de répondre”, etc.) pour éviter de forcer votre recenseur à saisir des informations incorrectes pour pouvoir soumettre ses données.
- Veillez à n’utiliser les questions à réponses multiples que pour les questions où cela a vraiment du sens et que vous êtes sûr de pouvoir analyser (car elles peuvent être plus complexes à analyser que les questions à option unique). Envisagez d’utiliser des questions de “classement” qui vous donneront une compréhension “réfléchie” des réponses aux options, telles que “Quelle est votre source principale d’eau”/”Quelle est votre source secondaire d’eau”…).
- Mettez en place les calculs nécessaires pour vos indicateurs directement dans le formulaire pour éviter d’avoir à les mettre en place plus tard dans les outils d’analyse.
- Réfléchissez aux moyens de trianguler correctement les données relatives à certains indicateurs clés afin de vérifier leur pertinence (par exemple en montrant le résultat des calculs à l’enquêteur directement sur le terrain et en lui demandant confirmation), en ajoutant des messages d’alerte en cas de données éventuellement incohérentes.
- Ajouter les conseils nécessaires (astuces, messages de contrainte personnalisés, explications audio) concernant toutes les définitions/ notions/ jargon/ acronymes/ unités de mesure difficiles, ou fournir un guide de l’enquêteur si nécessaire.
- Groupez les questions et mettez des titres de section ainsi que de la couleur dans vos étiquettes pour faciliter la compréhension visuelle par l’enquêteur.
-
Identifiez toutes vos questions en texte libre et vérifiez s’il ne serait pas pertinent d’avoir à la place une liste d’options possibles avec la garantie “autre” (informations administratives, nom des agents recenseurs…).
- Prévoir des travaux préparatoires tels que des discussions de groupe en cas de doute sur la liste des réponses possibles dans un contexte donné.
- Évitez les questions ouvertes, en particulier pour les données que vous souhaitez analyser quantitativement ou à des fins de désagrégation (et aussi pour que votre recenseur gagne du temps pour remplir ses soumissions et pour réduire la fatigue des personnes interrogées).
- Gardez à l’esprit que l’utilisation de méthodes qualitatives et quantitatives combinées peut être très utile, mais qu’il n’est pas forcément pertinent de combiner les méthodes dans le cadre de la collecte électronique de données
- Donnez à votre formulaire un titre qui parle de lui-même et dont vous êtes sûr qu’il ne créera pas de malentendus pour les recenseurs (avec les informations pertinentes telles que la composante thématique, le lieu, l’année, etc.)
- Inclure les métadonnées nécessaires au projet. (enregistrant la date et l’heure de début de la soumission, y compris les horodateurs intermédiaires, le numéro IMEI du téléphone utilisé, etc.) Voir la partie 5.6.6 Controle qualité.
- Examinez la possibilité de constituer un identifiant unique pour votre ensemble de données s’il est pertinent pour votre projet et voyez comment le saisir au mieux (calculé automatiquement sur la base d’autres informations, sélectionné dans une liste, rempli manuellement avec des contraintes avancées, scanné à partir d’un code-barres ou d’un code QR, etc.)
-
Essayez d’intégrer autant que possible les normes. Par exemple :
- Si vous utilisez des données administratives, intégrez des P-codes (codes de lieu ou de position) standards et interopérables qui seront compréhensibles si vous devez relier votre ensemble de données à d’autres collectes de données passées ou futures. Reportez-vous à la partie 5.7.3 Gerer des données administratives - P-codes (lien vers le message de HR sur la question).
- Essayez d’utiliser les normes HXL pour rendre vos données plus interopérables et facilement compréhensibles pour quelqu’un d’autre.
N’hésitez pas à consulter le Module 5: Making data useful, useable and shareable de l’IFRC Data Playbook (en anglais), en particulier:
- Exercise 5 - 5 Generating a Data Quality Checklist qui pourrait être très utile pour réfléchir à la façon de coder correctement le formulaire.
- Exercice 5 - 6 Data Quality: Opportunities and Barriers pourrait également être utile pour comprendre ce qui peut être amélioré (en termes de ressources, de compétences, de temps, etc.) pour obtenir une meilleure qualité des données.
- La présentation 5 - 7 Data Quality Workflows de la page 34 clarifie aussi grandement pourquoi la qualité est importante pour prendre des décisions fondées sur des preuves et quelles sont les dimensions de la qualité des données.