4.4 La gestion de données


De par les formats utilisés et la quantité de données que nous sommes amenés à utiliser en SIG, mettre en place de bonnes pratiques en gestion de données s’avère indispensable pour pérenniser son travail. Que vous stockiez vos données en local sur votre ordinateur ou sur un espace partagé en ligne, avoir une bonne organisation des données SIG permet de s’y retrouver plus facilement et de gagner en efficacité.
Les deux aspects de base en gestion de données que nous allons couvrir dans ce document sont :
- L’organisation structurée des dossiers et fichiers
- La nomenclature (Naming Convention)
TABLE DES MATIÈRES
- Stockage des données
- Organisation des données
- La nomenclature
- La nomenclature des cartes
- La nomenclature des donnnées
- Quelques exemples de nommage
Stockage des données
Concernant le stockage de données, plusieurs possibilités s’offrent à vous, selon vos besoins et capacités :
- Stockage local sur son ordinateur
- Stockage d’un dossier sur une plateforme en ligne type Cloud
- Stockage et centralisation sur un serveur organisationnel (capable de gérer des données géographiques).
Si vous optez pour un stockage en ligne, ou si vous partagez vos dossiers avec des collègues, prenez bien garde à passer par des canaux/infrastructures sécurisées, dans le cas où vous hébergez de la donnée personnelle ou sensible.
Une donnée personnelle correspond à toute information relative à une personne physique susceptible d’être identifiée (nom, adresse, matricule…). Une donnée personnelle est dite sensible si elle regroupe des informations liées à l’origine raciale ou ethnique, les opinions politiques, etc.
Organisation des données
L’organisation structurée des dossiers et fichiers est une première étape vers une structuration efficiente des données. Il est conseillé de classer les données en dossiers et sous-dossiers. Cette organisation s’applique pour les deux premiers types de stockages identifiés précédemment.
Nous vous proposons ci-dessous un exemple d’organisation des dossiers par pays.
Exemple d’organisation de données
Il faut néanmoins noter qu’il n’y a pas une meilleure façon d’organiser les dossiers et fichiers, n’hésitez donc pas à les adapter à vos besoins.
Comme on peut le voir sur la figure, il existe un dossier principal qui indique le nom du pays, et ensuite des sous-dossiers par thématiques (Données, Cartes, Projets). Chaque dossier est nommé par le type de fichier qu’il comporte Ainsi, il est très facile pour un autre utilisateur·trice de se retrouver dans nos dossiers.
Il est également possible d’adopter une classification par dossiers et sous dossiers thématiques. Par exemple, le principal dossier indique le nom d’un projet, et ensuite des sous dossiers qui regroupent des thèmes différents (données, cartes, etc.).
Ne pas respecter une organisation structurée de ses fichiers, c’est risquer de perdre des données au fil du temps, et de rompre le lien entre les données et les fichiers projets des différents logiciels SIG (QGIS, Arcgis Pro, etc.).
La nomenclature
La nomenclature des fichiers est aussi importante que l’organisation des fichiers. Il est important de suivre une règle pour le nommage de fichiers. Ces règles permettent d’identifier plus facilement des documents recherchés. Ainsi, cela facilite la tâche lors des échanges et transferts de fichiers.
L’exemple ci-dessous montre la comparaison entre un fichier mal nommé et un fichier avec un nommage conventionnel.
Exemple de nommage de fichiers
Sur cet exemple, on remarque que les noms des fichiers dans l’encadré rouge ne permettent pas de comprendre leur contenu. La nomenclature mise en place dans l’encadré vert permet tout de suite de savoir à quoi ils font référence (lieux, type, format, date, etc.) sans les ouvrir.
La nomenclature des cartes
Pour une meilleure organisation des données et produits SIG, nous proposons ci-dessous une convention de nommage que vous pourriez adopter.
Cet exemple de nommage inclut cinq niveaux de détails ou d’inforpations :
- iso3 : code conventionnel pour identifier un pays. S’il y a plusieurs pays affichés sur la carte, mettez simplement le code iso du pays principal de la carte. Vous pouvez trouver la liste des codes sur https://www.iban.com/country-codes
- type de carte : une valeur codée pour désigner le type de la carte
- Localisation : le nom du lieu qui s’affiche sur la carte. Ça peut être le nom administratif d’une frontière, d’une ville, d’un quartier, d’une zone de santé, d’un parc national, d’une région du monde, etc.
- Description : un complément d’information sur la carte si le genre et la localisation ne suffisent pas. Elle est surtout utilisée pour les cartes épidémiologiques afin de spécifier le type de maladie ou la semaine épidémiologique (ebola_ew21, cholera_ew25, etc.) ou pour les cartes logistiques (guide routier, vols, etc.).
- Dimension d’impression : la dimension d’impression de la carte. Contient la taille et l’orientation (L pour landscape / paysage et P pour Portrait) : A4P, A1L, A3L, etc.
- Date : Jour de production de la carte, datée comme suit AAMMJJ : par exemple 150325 pour le 23 mars 2015.
Exemple :
- BM : Basemap / Carte de base (carte topographique)
- ELE : Elevation map / Carte de dénivelé
- LOG : Logistique (accès routiers, obstacles sur la route, etc.)
- EPI : Épidémiologie (cas d’infection par zone sanitaire, par village, etc.)
- HLT : Health / Santé (infrastructures sanitaires, divisions administratives sanitaires, etc.)
- POP : Population (recensement, déplacement de population, etc.)
- SEC : Sécurité (cartographie des incidents, routes d’évacuation, etc.)
La nomenclature des donnnées
- iso3 : est le code pour le pays. Si plus d’un pays est affiché sur la carte, mettez simplement l’iso3 du pays principal.
- Localisation : le nom du lieu qui s’affiche sur la carte. Ça peut être le nom administratif d’une frontière, d’une ville, d’un quartier, d’une zone de santé, d’un parc national, d’une région du monde, etc.
- Code : code de caractéristique (cf. tableau ci-dessous)
- Sous-code : sous-code de caractéristique (cf.tableau ci-dessous)
-
type : géométrie du fichier :
- a pour areas / zones (polygones)
- l pour lines / tracés (et polylignes)
- p pour points : repères ponctuels
- source : désigne la source des données. Si vous utilisez des abréviations, vous devez créer un document avec une correspondance vers les noms complets dans le dossier « doc » (cf. Sources des données).
Quelques exemples de nommage
Ce tableau recense les différents codes pouvant être utilisés pour nommer les données utilisées.
Code (nom du dossier) | Code | Sous-code | Description |
---|---|---|---|
Frontières | polbnd |
|
|
Dénivelé | contour | N/A | Lignes de contour |
Environnement | landmark | N/A | Parc / Parc National |
Santé |
|
lvx |
|
Localisation |
|
N/A |
|
Structure | hlt | N/A | Hôtels et maisons d’hôtes |
Transport |
|
N/A |
|
Eaux |
|
N/A |
|