Qu'appelle-t-on métadonnées d'un document numérique ?

La numérisation consiste à créer, à partir d’un document original au format papier, une copie numérique qui sera accessible et exploitable en ligne. Premier pas vers la transformation digitale, la numérisation de documents permet d’optimiser la gestion documentaire, en facilitant leur recherche et leur accès aux différents utilisateurs, tout en renforçant leur sécurité.

Numériser des documents est un processus complet qui nécessite la mise en œuvre de moyens matériels, logiciels et humains. Revue de détails…

Voir l’animation « La numérisation, premier pas vers votre transformation digitale »

Phase 1 : préparation des documents

Une fois dans le centre de numérisation, vos documents sont triés, puis les trombones, agrafes… sont otés afin de permettre le traitement des documents par les scanners.

Phase 2 : numérisation des documents

Si vous faites appel à un prestataire spécialisé dans la numérisation, celui-ci prendra en charge vos documents pour les transporter vers son centre de numérisation. Si vous avez besoin d’accéder aux documents dans le cadre votre activité, il est possible de cadencer les enlèvements et de numériser par lots, afin que les copies numériques soient disponibles au plus vite en ligne. La numérisation sur site peut être envisagée, c’est-à-dire dans vos locaux, lorsque vos documents présentent un très haut niveau de confidentialité ou de sécurité.

Les documents sont scannés et traités avec des outils de capture :

  • LAD : Lecture Automatique des Documents
  • RAD : Reconnaissance Automatique des Documents
  • OCR : Reconnaissance Optique des Caractères

qui permettent d’extraire automatiquement des informations et/ou du contenu des documents. Ces informations sont utilisées comme métadonnées descriptives et facilitent la recherche d’un document dans une GED par exemple.

Une intervention humaine de vidéocodage est nécessaire afin de corriger manuellement les éventuelles erreurs. Enfin, un contrôle qualité sur un échantillon représentatif permet de valider définitivement le lot numérisé et d’autoriser la mise en ligne des images numériques.

A noter qu’il existe plusieurs types de scanners (scanners à plat…) adaptés au support des documents à numériser : documents et dossiers tous formats, plans, livres, magazines… et autres supports reliés.

Pour vos documents très sensibles ou engageants, il peut être utile de recourir à la numérisation fiable, qui permet de produire des copies fidèles de vos documents originaux papier, puis de les archiver dans un SAE afin de préserver leur vocation probatoire. Ce processus spécifique permet, dans certaines conditions, de détruire les originaux papier.

Lire le livre blanc « Numérisation fidèle et destruction des originaux »

Phase 3 : restitution des copies numériques et archivage des documents

Les dossiers sont reconstitués à l’identique puis archivés, soit en interne dans l’entreprise, soit auprès d’un tiers archiveur. En fonction de l’usage et des outils disponibles, les documents numériques peuvent être intégrés dans un SI métier (SIRH, ERP, CRM…) ou une GED, hébergés ou archivés dans un système d’archivage électronique à vocation probatoire.

Téléchargez notre documentation numérisation

Un projet ? Demandez votre devis

Objectif

Comprendre que des métadonnées sont associées à la prise de vue.

Points clés

  • Il existe une multitude de formats d’images.
  • Un fichier numérique comprend un en-tête et le contenu.
  • De nombreuses informations sont enregistrées dans les métadonnées.

Pour bien comprendre

  • Le format JPEG est un format adapté à la perception visuelle humaine
  • Les métadonnées sont stockées dans l’en-tête

1. Généralités

Les photographies numériques sont des fichiers informatiques à part entière, c’est-à-dire une succession de 0 et de 1.

Ce fichier peut être décomposé en deux parties :

  • l’en-tête (quelques octets), qui varie en fonction des formats d’images utilisés. On peut par exemple y retrouver le format du fichier, le type de compression utilisée, etc. ;
  • le contenu (souvent volumineux), qui correspond au codage des pixels de l’image étudiée.

Quappelle-t-on métadonnées dun document numérique ?

Découpage d’un fichier numérique

Le poids d’une image non compressée (en octet) correspond au nombre total de pixels que l’on multiplie par la profondeur de couleur (bpp) et que l’on divise par 8 (il y a 8 bits dans 1 octet).

Exemple
Le poids d’une image en couleur (profondeur de bits = 24) dont la définition est de 800 × 600 est :
(800 × 600 × 24) ÷ 8 = 1 440 000 octets = 1 406 ko = 1,37 Mo

Pour obtenir le poids précis du fichier de cette image, il faut lui ajouter les quelques octets relatifs à l’en-tête. On considère souvent que le poids de l’en-tête est négligeable devant le poids d’une image et donc que le poids du fichier est égal à celui de l’image.

2. Format de fichiers usuels

Il existe une multitude de formats d’images. L’indication sur le format est donnée par l’extension du fichier.

Exemple
Si une photographie numérique est enregistrée dans un fichier nommé « maphoto.bmp », l’extension de ce fichier est « .bmp ». Le format est donc le BMP (Bitmap). L’intitulé est « maphoto ».

Les deux principaux formats de fichiers en photographie numérique sont le format RAW et le format JPEG.

a. Format RAW

Un fichier en format RAW correspond à l’image brute enregistrée (non compressée) par un appareil photographique haut de gamme. La qualité est maximale, il faut cependant un logiciel spécialisé pour ouvrir ce type d’image car elle doit être interprétée numériquement. Le format RAW s’adresse particulièrement aux professionnels de la retouche d’image.

b. Format JPEG

Le format JPEG (ou JPG) est le format le plus répandu. L’image est simplifiée (compressée avec un algorithme proche de la perception visuelle humaine).

Le format JPEG est un format idéal pour mettre ses photographies sur internet ou pour les envoyer par e-mail.

c. Autres formats

Il existe d’autres formats plutôt adaptés au web, comme les fichiers PNG (qui permettent la gestion de la transparence) ou encore les fichiers GIF (qui permettent d’avoir des petites animations), mais aussi des formats adaptés à l’impression comme le TIFF, lequel est toutefois très volumineux.

3. Métadonnées EXIF

a. Métadonnées

Lorsqu’un cliché numérique est effectué, des informations supplémentaires sont enregistrées. On trouve en effet des informations sur l’image elle-même (définition, résolution, etc.) mais aussi des informations sur la prise de vue (date et heure, lieu, etc.).

L’ensemble de ces données supplémentaires (image et prise de vue) sont appelées métadonnées et sont stockées numériquement dans l’en-tête du fichier.

b. Métadonnées EXIF

Certaines d’entre elles sont enregistrées dans une zone particulière et constituent les métadonnées EXIF (Exchangeable Image File Format).

Les métadonnées EXIF sont des données relatives à la prise de vue qui sont enregistrées dans l’en-tête de l’image numérique.

Parmi ces métadonnées EXIF, on peut notamment retrouver des informations comme :

  • le fabricant et le modèle de l’appareil ;
  • la date et heure de la prise de vue ;
  • les réglages de l’appareil (ouverture du diaphragme, temps de pose, flash déclenché ou non, etc.) ;
  • coordonnées GPS (selon les modèles).

Remarque
Il faut préciser que les métadonnées EXIF (essentiellement liées à la prise de vue) ne représentent qu’une partie des métadonnées. Il en existe d’autres, comme par exemple les métadonnées IPTC (relatives à l’auteur, au sujet, etc.).

c. Lire les métadonnées EXIF

Ces métadonnées EXIF peuvent être « lues » par la plupart des logiciels spécialisés en image.

On peut également accéder à ces métadonnées EXIF via le script Python.

Exemple
Sur l’illustration ci-dessous, on identifie le modèle et la marque de l’appareil photographique utilisé, ainsi que la date et l’heure de la prise de vue.

Quappelle-t-on métadonnées dun document numérique ?

Exemple de métadonnées EXIF

4. Données sensibles ?

On voit aisément l’intérêt des métadonnées pour garder le souvenir des conditions de prise de vue d’une photographie. La date permet par exemple de trier ou de classer ses photographies, les informations techniques sur les conditions de prise de vue sont également très utiles pour les professionnels et amateurs avertis.

Selon une affirmation bien connue de Gilles Babinet (expert numérique à la commission européenne), les « données sont le pétrole du XXIe siècle ».

Exemple
La géolocation était la deuxième donnée la plus récupérée sur les smartphone selon une étude de la CNIL (Commission Nationale de l’Informatique et des Libertés) en 2013.
Les coordonnées GPS du lieu de la prise de vue représentent ainsi une donnée « intéressante », puisque cela signifie que l’on peut indiquer où l’on se trouve en partageant le cliché sur internet.

Même si la plupart des réseaux sociaux suppriment ces métadonnées « sensibles » en vue de la publication des photographies, il est assez difficile de dire ce qu’elles deviennent.

Il est donc primordial de s’interroger sur ces données personnelles et de ne les partager qu’en cas de besoin.

Remarque
Il existe bien évidemment des outils performants pour maitriser tout cela. On peut citer l’outil « Metanull » qui permet de supprimer facilement les métadonnées en créant une copie du fichier original sans ces fameuses métadonnées.

Vous avez déjà mis une note à ce cours.

Découvrez les autres cours offerts par Maxicours !

Découvrez Maxicours

Comment as-tu trouvé ce cours ?

Évalue ce cours !

Qu'est

Une métadonnée est un ensemble structuré d'informations décrivant une ressource quelconque. Les métadonnées ne décrivent pas nécessairement des documents électroniques.

Qu'est

Les métadonnées décrivent souvent le processus qui a conduit à la création de l'information. Par exemple, pensez aux coordonnées géographiques avec lesquelles les photographies numériques sont étiquetées. Le contexte, une fois perdu, peut ne pas pouvoir être reconstruit et est donc sauvegardé.

Comment trouver les métadonnées d'un document ?

Afficher les métadonnées : clic droit / propriétés permettent déjà d'afficher les métadonnées de tous vos documents. Il suffit de faire un clic droit sur le fichier et d'aller dans les propriétés. Exemple sur Windows.

Quel est le rôle des métadonnées ?

Le rôle principal des métadonnées consiste à étendre le champ des actions disponibles sur un contenu digital en fournissant un contexte et un ensemble d'informations connexes.