Link Search Menu Expand Document
Boîte à outils SIG

4.4 La gestion de données


De par les formats utilisés et la quantité de données que nous sommes amenés à utiliser en SIG, mettre en place de bonnes pratiques en gestion de données s’avère indispensable pour pérenniser son travail. Que vous stockiez vos données en local sur votre ordinateur ou sur un espace partagé en ligne, avoir une bonne organisation des données SIG permet de s’y retrouver plus facilement et de gagner en efficacité. Les deux aspects de base en gestion de données que nous allons couvrir dans ce document sont :

  • L’organisation structurée des dossiers et fichiers
  • La nomenclature (Naming Convention)

TABLE DES MATIÈRES


Stockage des données

Concernant le stockage de données, plusieurs possibilités s’offrent à vous, selon vos besoins et capacités :

  • Stockage local sur son ordinateur
  • Stockage d’un dossier sur une plateforme en ligne type Cloud
  • Stockage et centralisation sur un serveur organisationnel (capable de gérer des données géographiques).

Si vous optez pour un stockage en ligne, ou si vous partagez vos dossiers avec des collègues, prenez bien garde à passer par des canaux/infrastructures sécurisées, dans le cas où vous hébergez de la donnée personnelle ou sensible.

Une donnée personnelle correspond à toute information relative à une personne physique susceptible d’être identifiée (nom, adresse, matricule…). Une donnée personnelle est dite sensible si elle regroupe des informations liées à l’origine raciale ou ethnique, les opinions politiques, etc.

Organisation des données

L’organisation structurée des dossiers et fichiers est une première étape vers une structuration efficiente des données. Il est conseillé de classer les données en dossiers et sous-dossiers. Cette organisation s’applique pour les deux premiers types de stockages identifiés précédemment.

Nous vous proposons ci-dessous un exemple d’organisation des dossiers par pays.

image info

Exemple d’organisation de données

Il faut néanmoins noter qu’il n’y a pas une meilleure façon d’organiser les dossiers et fichiers, n’hésitez donc pas à les adapter à vos besoins.

Comme on peut le voir sur la figure, il existe un dossier principal qui indique le nom du pays, et ensuite des sous-dossiers par thématiques (Données, Cartes, Projets). Chaque dossier est nommé par le type de fichier qu’il comporte Ainsi, il est très facile pour un autre utilisateur·trice de se retrouver dans nos dossiers.

Il est également possible d’adopter une classification par dossiers et sous dossiers thématiques. Par exemple, le principal dossier indique le nom d’un projet, et ensuite des sous dossiers qui regroupent des thèmes différents (données, cartes, etc.).

Ne pas respecter une organisation structurée de ses fichiers, c’est risquer de perdre des données au fil du temps, et de rompre le lien entre les données et les fichiers projets des différents logiciels SIG (QGIS, Arcgis Pro, etc.).

La nomenclature

La nomenclature des fichiers est aussi importante que l’organisation des fichiers. Il est important de suivre une règle pour le nommage de fichiers. Ces règles permettent d’identifier plus facilement des documents recherchés. Ainsi, cela facilite la tâche lors des échanges et transferts de fichiers.

L’exemple ci-dessous montre la comparaison entre un fichier mal nommé et un fichier avec un nommage conventionnel.

image info

Exemple de nommage de fichiers

Sur cet exemple, on remarque que les noms des fichiers dans l’encadré rouge ne permettent pas de comprendre leur contenu. La nomenclature mise en place dans l’encadré vert permet tout de suite de savoir à quoi ils font référence (lieux, type, format, date, etc.) sans les ouvrir.

La nomenclature des cartes

Pour une meilleure organisation des données et produits SIG, nous proposons ci-dessous une convention de nommage que vous pourriez adopter.

Cet exemple de nommage inclut cinq niveaux de détails ou d’inforpations :

image info

  1. iso3 : code conventionnel pour identifier un pays. S’il y a plusieurs pays affichés sur la carte, mettez simplement le code iso du pays principal de la carte. Vous pouvez trouver la liste des codes sur https://www.iban.com/country-codes
  2. type de carte : une valeur codée pour désigner le type de la carte
  3. Localisation : le nom du lieu qui s’affiche sur la carte. Ça peut être le nom administratif d’une frontière, d’une ville, d’un quartier, d’une zone de santé, d’un parc national, d’une région du monde, etc.
  4. Description : un complément d’information sur la carte si le genre et la localisation ne suffisent pas. Elle est surtout utilisée pour les cartes épidémiologiques afin de spécifier le type de maladie ou la semaine épidémiologique (ebola_ew21, cholera_ew25, etc.) ou pour les cartes logistiques (guide routier, vols, etc.).
  5. Dimension d’impression : la dimension d’impression de la carte. Contient la taille et l’orientation (L pour landscape / paysage et P pour Portrait) : A4P, A1L, A3L, etc.
  6. Date : Jour de production de la carte, datée comme suit AAMMJJ : par exemple 150325 pour le 23 mars 2015.

Exemple :

  • BM : Basemap / Carte de base (carte topographique)
  • ELE : Elevation map / Carte de dénivelé
  • LOG : Logistique (accès routiers, obstacles sur la route, etc.)
  • EPI : Épidémiologie (cas d’infection par zone sanitaire, par village, etc.)
  • HLT : Health / Santé (infrastructures sanitaires, divisions administratives sanitaires, etc.)
  • POP : Population (recensement, déplacement de population, etc.)
  • SEC : Sécurité (cartographie des incidents, routes d’évacuation, etc.)

La nomenclature des donnnées

image info

  1. iso3 : est le code pour le pays. Si plus d’un pays est affiché sur la carte, mettez simplement l’iso3 du pays principal.
  2. Localisation : le nom du lieu qui s’affiche sur la carte. Ça peut être le nom administratif d’une frontière, d’une ville, d’un quartier, d’une zone de santé, d’un parc national, d’une région du monde, etc.
  3. Code : code de caractéristique (cf. tableau ci-dessous)
  4. Sous-code : sous-code de caractéristique (cf.tableau ci-dessous)
  5. type : géométrie du fichier :
    • a pour areas / zones (polygones)
    • l pour lines / tracés (et polylignes)
    • p pour points : repères ponctuels
  6. source : désigne la source des données. Si vous utilisez des abréviations, vous devez créer un document avec une correspondance vers les noms complets dans le dossier « doc » (cf. Sources des données).

Quelques exemples de nommage

Ce tableau recense les différents codes pouvant être utilisés pour nommer les données utilisées.

Code (nom du dossier) Code Sous-code Description
Frontières polbnd
  • int
  • admx
  • Frontières internationales
  • Frontières des divisions admin (admin1, adm2, adm3)
Dénivelé contour N/A Lignes de contour
Environnement landmark N/A Parc / Parc National
Santé
  • hltbnd
  • hltfac
lvx
  • Frontière des divisions sanitaires (lvl1, lvl2, lvl3)
  • Infrastructures sanitaires
Localisation
  • ppl
  • markers
N/A
  • Emplacements peuplés (villes, villages …)
  • Bureaux de l’ONG
Structure hlt N/A Hôtels et maisons d’hôtes
Transport
  • airdrm
  • obstacle
  • rds
  • rlw
  • stn
N/A
  • Aéroports
  • Obstacles (ponts, point de contrôle …)
  • Route
  • Chemins de fer
  • Gare (ferroviaire, routière …)
Eaux
  • lakeres
  • watcrs
  • watr
N/A
  • Lacs et réservoirs
  • Cours d’eau (rivières, ruisseaux …)
  • Sources d’eau (puits, puits de forage, sources …)