how to ?
Qu'est-ce qu'une métadonnée ?

Qu'est-ce qu'une métadonnée ?

Vous trouverez ici plus d’information sur les métadonnées où comment répondre aux questions quoi ? comment ? par qui ? où ? et quand ? au sujet d'un jeu de données.

La métadonnée où « Donnée de/à propos de donnée », se dit d'une donnée (information) servant à définir ou décrire une autre donnée (information) quel que soit son support (papier ou électronique). Une manière assez simple de définir une métadonnée, elle doit répondre aux questions suivantes concernant la donnée concernée :

  • Quoi ? Que représente cette donnée et comment est-elle décrite (est-ce des chaines de caractère, des nombres, dans ce cas, quelles bornes, etc.).
  • Qui ? Qui a produit cette donnée, mais aussi qui en est le propriétaire ou qui peut-on contacter pour en savoir plus.
  • Quand ? De quand date cette donnée et à quelle période correspond-elle. Egalement, quand a-t-elle été mise à jour ? Cette notion rejoint la notion d'état (finalisée ou non finalisée, dépréciée, etc.).
  • Où ? Où cette donnée a-t-elle été produite.
  • Comment ? Comment la donnée a-t-elle été produite (quel protocole a été employé, quel matériel ? quels traitements a-t-elle subie avant sa diffusion, etc.).

Dans le cadre du SISélune, les métadonnées étant créée sous forme de fiche (une fiche pour un jeu de données, c'est-à-dire une donnée), chaque fiche doit pouvoir apporter des réponses à toutes ces questions.

En quoi ces métadonnées sont-elles si importantes ?

L'objectif des métadonnées est en particulier de rendre possible et de faciliter la consultation et l'échange des données et ainsi permettre de pérenniser l'utilisation des données.
Lorsque que l'on travaille avec de la donnée (qu'elle soit géographique ou non), il est vivement conseillé de systématiquement :

  • Associer des métadonnées à cette donnée créée pour décrire cette donnée et faciliter sa réutilisation.
  • Consulter les métadonnées des données existantes avant de les utiliser.

Il existe des normes établies pour renseigner les métadonnées des données géographiques, par exemple la norme ISO 1915.
En organisant les données conformément à ces normes, il devient plus facile de les gérer avec efficacité, d'en assurer la qualité et de les partager. La plupart des logiciels SIG s'appuient sur des normes existantes pour assurer cette gestion des métadonnées et il est possible d'introduire les métadonnées dans les propriétés des fichiers selon une norme. 
S'appuyer sur ces normes permet également de déclencher automatiquement des mécanismes de moissonnages (par le biais du géocatalogue hébergeant les fiches de métadonnées). Il s'agit alors de dissémination automatique des fiches de métadonnées entre catalogues interconnectés. A titre d'exemple, le géocatalogue de métadonnées de la région Bretagne GéoBretagne moissonne les fiches du géocatalogue GéoSAS de telle façon qu'un utilisateur du 1er catalogue retrouvera les fiches de métadonnées et donc les données du 2nd).

Les métadonnées par l'exemple 

Prenons l'exemple du jeu de données : "Analyses chimiques de l'eau (2014-2027) - Observatoire Sélune" avec la fiche de métadonnées associée : https://geosas.fr/geonetwork/srv/fre/catalog.search#/metadata/35dfec55-ce37-46d3-9a75-e33330170ed1

En quoi cette fiche de métadonnées répond-elle bien aux besoins d'information concernant ces analyses chimiques de l'eau ?

Quoi ? qu'est-ce que cette donnée ?

Comme le décrit le résumé de la fiche de métadonnée, il s'agit d'analyses chimiques réalisées sur des prélèvements manuels ou automatiques portant sur les éléments de la phase dissoute (phosphore dissous, anions majeurs, silice dissoute, ammonium) et de la phase particulaire (matières en suspension, teneur en carbone et en azote de celles-ci, Phosphore total). La fiche précise également qu'il s'agit d'une donnée décrite en français.

Les mot-clés associés, dans la fiche de métadonnées, donnent un complément d'information sur la caractérisation de cette donnée : "Hydrologie", "Installations de suivi environnemental", "Analyse de l'eau", etc.
La plupart des mots-clés utilisés ne sont pas saisi par le créateur de la fiche de métadonnées mais choisi dans des thésaurus (listes thématiques) et permettent donc l'analyse de la fiche de métadonnées au regard de ces mots-clés. Par exemple, le géocatalogue hébergeant les fiches de métadonnées du programme scientifique Sélune hébergent également d'autres fiches de métadonnées, ainsi une recherche dans ce catalogue de toutes les fiches associées à "Installations de suivi environnemental" permet de trouver d'autres jeux de données caractérisés par le même mot-clé. C'est d'autant plus important sur les catalogues régionaux ou nationaux où les fiches de métadonnées du programme scientifiques sont remontées et donc identifiables au même titre que d'autres fiches produites dans d'autres circonstances (d'autres programmes scientifiques, des observatoires de surveillance, etc.).

Une autre information importante pour apporter des éléments de réponse à cette question est la généalogie. Cette information va apporter des précisions sur la donnée et sur sa production. Dans le cas des analyses chimiques de l'eau, la généalogie rappelle qu'il s'agit de données issues de prélèvements d'eau sur le terrain, automatiques ou non (et précise également les circonstances de prélèvements), ainsi que le matériel utilisé.

Qui ? qui sont les intervenants (producteur, propriétaires, contacts) de cette donnée ?

La fiche de métadonnées distillent plusieurs informations :

  • 2 points de contact : l'UMR SAS et l'AESN
  • le fournisseur : GeoSAS (dans ce cas, producteur et fournisseur)

Quand ? quand cette donnée a-t-elle été acquise, créée, diffusée, quelle période concerne-t-elle ?

La fiche de métadonnée indique que ce jeu de données est finalisé. Le titre indique déjà la période temporelle couverte (2014-2027) mais cette information se retrouve également dans le détail avec la période couverte (Mon Oct 27 2014 00:00:00 GMT+0100   Fri Dec 31 2027 00:00:00 GMT+0100).

La date de publication de la fiche de métadonnées est également disponible (14/04/2021). 

Où ? quelle zone géographique est concernée par cette donnée ?

La zone géographique est, quant-à-elle, décrite via 2 éléments :

  • Une étendue spatiale. Très pratique, cette visualisation cartographique du jeu de données s'appuie sur l'étendue des coordonnées GPS des objets géographiques identifiés. Elle est donc calculée automatiquement à partir des données et permet de voir d'un coup d'oeil, la zone qu'elles concernent.
  • Le système de coordonnées et l'échelle qui sont des informations indispensables pour pouvoir utiliser la représentation spatiale enregistrée au niveau du jeu de données.

Comment ? Comment cette donnée a-t-elle été acquise ? subit-elle des traitements ou des modifications spécifiques ?

Cette notion de "Comment" est quant-à-elle généralement présentée de différentes façons. 
Cela peut être de faon assez succinte par le biais du résumé et de certains mot-clés (comme dans ce cas de figure "Installations de suivi environnemental" donnant une information sur l'utilisation d'un matériel pour le suivi de cette donnée.
Mais c'est surtout la généalogie qui va revenir plus en détail sur 

  • La méthode d'acquisition de la donnée (dans ce cas, hybride, parfois manuelle, parfois automatique).
  • Le type de matériel utilisé dans le cas d'acquisition automatique.
  • Le protocole déployé pour le rapatriement et la conservation des échantillons avant analyse.