Link Search Menu Expand Document
Boîte à outils gestion responsable de données

6.6 Analyser


TABLE DES MATIÈRES


Cas d’étude : Perte de données pour cause de surpotection

La situation

Vous venez de rejoindre une ONG médicale où les procédures de protection de données sont particulièrement strictes. En effet, le contexte d’intervention est particulièrement dégradé : des groupes armés sévissent dans la région qui a été déstabilisée récemment tandis que des entreprises étrangères bien implantées dans le pays sont connus pour des pratiques prédatrices en matière d’espionnage industriel et de collecte de données agressives pour mieux cibler leurs consommateurs. Le staff nouvellement arrivé, fraichement émoulu des différents briefings particulièrement denses en protection des données et risques sécuritaires, est ainsi chargé de procéder au traitement des données issues de la dernière enquête, sans explication spécifique autre que de « préparer les données pour l’analyse ». Le staff s’exécute en anonymisant l’entièreté des données collectées pour s’assurer qu’aucun bénéficiaire ne soit identifiable. Malheureusement, la base de données était nécessaire pour des besoins d’audit auprès du bailleur, et pour du suivi ultérieur des personnes concernées.

Quels sont les risques potentiels ?

  • Perte de données, et donc de crédibilité de l’ONG
  • Réponse ultérieure non adaptée
  • Risques réputationnels vis-à-vis du bailleur de fond, et donc potentielles pertes économiques (pour non-respect des engagements), voir projets ultérieurs avec ce bailleur compromis
  • Pertes financières ou mauvaise utilisation des ressources si ces données doivent être collectées à nouveau (et perte de confiance des bénéficiaires vis-à-vis de l’ONG)

Que faire ?

Si l’anonymisation des données a déjà été effectuée, il est IMPOSSIBLE de revenir en arrière, les données sont définitivement perdues et ce, de manière irrémédiable. C’est pourquoi il faut être particulièrement prudent sur l’utilisation de telles procédures puisque celles-ci impliquent un changement irréversible. Si vous avez par exemple besoin d’un suivi patient individualisé, l’anonymisation ne sera généralement pas une solution viable par exemple.

Comment la situation aurait pu être évitée ?

Dans le cas où la procédure n’a pas encore été lancée, ou si l’organisation réfléchit à ce qu’elle souhaite mettre en place, il faut qu’elle démarre en faisant un premier diagnostic : si elle a besoin de données individuées, ou à minima d’un certain niveau de granularité pour son analyse, elle pourra se tourner vers des procédures de pseudonymisation, ou d’agrégation, qui pourront permettre une analyse différentiée tout en conservant un certain niveau de protection des données. Si elle n’a réellement pas besoin de données personnelles, elle peut réfléchir à l’utilisation de techniques d’anonymisation, mais il faut aussi disposer de staff aptes à traiter ce type de données agrégées afin d’en tirer une analyse pertinente (ce qui peut être complexe dans certains cas). Laisser les fichiers sans aucun traitement n’est généralement pas une solution, sauf le cas où l’on ne collecte aucune données personnelles/sensibles.

Dans tous les cas nécessitant un certain niveau de dé-identification, il est important de faire preuve d’imagination, car avec les techniques actuelles de big data/data harvesting, même des données qui semblent anodines (la quantité d’eau distribuée par exemple, les besoins prioritaires etc…) peuvent permettre une réidentification des personnes (tant qu’elles font référence à une personne/un groupe d’usager d’un certain type).

Quoi qu’il en soit, l’exemple est un cas flagrant de mal-dimensionnement des moyens par rapport aux fins fréquent quand on parle de gestion responsable de données. On peut retrouver le même cas de figure dans l’utilisation de technologies ou procédés complexes (VPN, Sandboxes, etc…) de manière systématique et non-différentiée au sein d’une structure, ce qui peut entrainer des contournements, oublis, voire même stratégie d’évitement de la part de certains staffs bien plus problématiques que la situation que l’on cherche à éviter.

Cas d’étude : Analyse non documentée et changement de personnel

La situation

Une analyse de données a été commencée par une personne mais elle n’a pas pu être finie car cette personne a quitté l’organisation précipitamment et il n’a pas été possible d’effectuer de passation. Malheureusement, la procédure n’a pas été documentée et en l’état actuel le document d’analyse comporte de multiples onglets et d’innombrables tableaux et formules sans aucune explication. Une nouvelle personne arrive et doit reprendre l’analyse en cours de route.

Quels sont les risques potentiels ?

  • Allongement du temps prévu pour compléter l’analyse et surcoûts inutiles
  • Mauvais emplois des ressources, perte de temps, frustration des équipes
  • Une analyse erronée voire hors sujet

Que faire ?

Contacter la personne qui est partie précipitamment pour voir si elle peut fournir une note d’information sur ce qu’elle a déjà fait

Afin d’éviter de cumuler perte de temps et analyse erronée et il peut être plus judicieux de recommencer l’analyse depuis le début plutôt que d’essayer de comprendre ce qui a été fait

S’il existe, suivre le plan d’analyse afin de limiter au maximum les analyses inutiles, s’il n’existe pas, en développer un, même succinct, pour permettre une reprise de l’analyse la plus efficace possible.

Comment la situation aurait pu être évitée ?

Développer systématiquement un plan d’analyse lors de la construction d’un protocole d’enquête. Celui-ci permet de donner un cadre à une analyse pour qu’elle reste pertinente par rapport aux objectifs d’un programme. En limitant le travail d’analyse aux thèmes choisis, il permet de suivre l’évolution du travail d’analyse. Si possible, instaurer une communication ponctuelle lors de la phase d’analyse entre le responsable de projet et la personne qui effectue l’analyse des données afin d’anticiper les problèmes et éviter les surprises lors du rendu final de l’analyse.

Cas d’étude : Obtention de données provenant des autorités locales

La situation

Voulant éviter de collecter des données qui existent peut-être déjà, vous contactez un employé au sein du département des affaires sociales de l’autorité locale de la région où votre projet (sécurité alimentaire des populations nomades) aura lieu. Suite à un premier échange, votre interlocuteur vous fait passer, de manière impromptue, par un intermédiaire et sur une clé USB (non encryptée), une base de données contenant toute une gamme de données. Après une évaluation rapide, vous estimez qu’une partie de ces données peuvent en effet être utiles pour votre projet.

Cependant, la base de données contient également des données personnelles issues de collectes qui semblent avoir eu lieu à différentes périodes. De plus aucune métadonnée, ni information sur les méthodes de collecte ou sur le consentement fourni, ou non, par les bénéficiaires sollicités pour ces enquêtes n’est présente. Que faire ?

Quels sont les risques potentiels ?

  • Pour les bénéficiaires dont les données sont partagées, une perte de confiance en l’action des autorités locales
  • Pour votre ONG, une perte de crédibilité vis-à-vis des populations concernées
  • Données personnelles et sensibles accessibles par des tiers dû à une méthode de partage non sécurisée
  • Divulgation de données personnelles et sensibles non conformes aux principes humanitaires et de la protection des données
  • Risque de biais (de sélection, sociaux ou de processus) présents dans les données et sur lesquels vous n’auriez aucune visibilité

Que faire ?

Contactez votre interlocuteur afin d’établir pour quels usages et dans quelles conditions ces données ont été collectées. Par exemple, essayez de déterminer si le consentement des personnes sollicitées a été obtenu pour ces collectes de données. S’il s’avère qu’aucun consentement n’a été obtenu, ou si vous avez un doute sur le fait que les personnes n’étaient pas pleinement informées de la possibilité de partage de leurs données avec des ONG œuvrant dans la région, vous ne devez pas utiliser ces données pour vos besoins.

Comment la situation aurait pu être évitée ?

N’étant pas responsable de la collecte de ces données, il n’y avait effectivement rien que vous auriez pu faire en amont pour éviter cette situation. Par contre, il est maintenant de votre responsabilité de ne pas utiliser ces données pour votre projet même si cela vous forcera peut-être à organiser une nouvelle collecte.

En revanche, la situation peut aussi représenter une opportunité pour sensibiliser les autorités locales aux questions de protection des données personnelles et les accompagner pour qu’elles montent en compétences et améliorent leurs pratiques sur ces sujets. Dans de nombreux pays, la protection des données personnelles est encore perçue comme sujet non essentiel, même si parfois une législation est en place, et par conséquent reléguée au bas de la liste des priorités avec très peu de ressources allouées pour mettre en place de meilleures pratiques. Mais il est peut-être possible d’impliquer les autorités locales lorsque que vous formez vos propres équipes à la gestion responsable des données afin de les faire profiter de formations de sensibilisation et de ressources pertinentes à leur travail.

Attention à ne pas se dire que puisque vous n’étiez pas responsable de la collecte de ces données, il n’est pas de votre ressort d’effectuer la vérification et que personne n’en saura jamais rien, ce qui peut être une tendance pour des raisons d’efficacité - en termes éthiques, cette approche serait tout à fait contraire aux principes humanitaires, et le danger que cela peut faire porter sur le projet et l’ONG en termes réputationnels est trop important pour ne pas être considéré avec attention.

Ressources clés

  • Les boites à outils Analyse de données et Visualisation de données sont des ressources utiles sur les aspects méthodologiques associées
  • Ce guide du Urban Institute pour mieux comprendre comment s’assurer de présenter des visualisations responsables (en anglais)
  • Si vous n’êtes pas conscients de cet état de fait, nous vous conseillons cette lecture, à partager de manière générale avec vos collègues (en anglais): ici et ici