Comment classer ses photos ?
EXIF, IPTC, XMP et autres métadonnées : de la théorie à la pratique.
Publié le 30/12/2004 - Mis à jour le 03/12/2007 par Jean-Paul Figer
- Les métadonnées pour les photos.
- -EXIF
- -IPTC
- -EXIF ou IPTC ?
- -La convergence vers XMP
- Le classement des photos.
- -1. Le nommage des photos.
- -2. La description des photos.
- -3. Les outils de recherche.
- -4. La fabrication des albums de photos ou de catalogues.
- Où mettre les métadonnées ?
L'excellent logiciel Pixvue que je recommandais depuis plusieurs années a brusquement disparu de l'Internet*. En même temps, est sorti un logiciel gratuit de Microsoft : Pro Photo Tools. Il a une très grande ressemblance avec une partie des fonctions de Pixvue. Ceux qui ont conservé une copie du logiciel Pixvue peuvent continuer à s'en servir. Les autres peuvent installer Pro Photo Tools.
* un lecteur me signale qu'on peut encore le trouver ici .
Cet article est la suite de l'article Photos et images numériques dont la lecture préalable est recommandée.
La photo numérisée de bout en bout envahit votre ordinateur. Comment archiver, classer et retrouver facilement des milliers de photos dans votre ordinateur ? Il existe de nombreux programmes qui proposent des solutions toutes différentes. Laquelle choisir ? Comment être sûr de pouvoir réutiliser demain ce qui a été fait aujourd'hui ? Le classement des images est encore un sujet de Recherche. Il peut sembler hors de portée pour un amateur. Ce n'est heureusement plus le cas. Dès maintenant, vous pouvez obtenir de très bons résultats avec une panoplie de logiciels gratuits à condition de bien découper les tâches et de vous organiser en conséquence. Il y a 4 tâches principales :
- Le stockage et le nommage des photos,
- La description des photos,
- Les outils pour la recherche,
- La constitution des albums sur le PC ou pour une publication sur CD, DVD ou sur le Web
Avant de passer à la pratique, je vais dévoiler le plus simplement possible un des secrets les mieux gardés de l'Informatique : l'utilisation des métadonnées en particulier dans les photos numériques. Ensuite, j'expliquerai comment en tirer partie pour archiver, classer, retrouver et présenter vos photos sur votre ordinateur ou sur le Web.
Les métadonnées pour les photos.
En informatique, une métadonnée est une donnée qui décrit une donnée ou une ressource (document, image, fichier .mp3, page html, etc.). Quand vous faites clic droit sur un fichier puis propriétés dans Windows, le système vous présente les métadonnées de cette ressource, c'est à dire un ensemble d'informations sur ce fichier : type de document, taille, date de modification, sécurité, partage, etc.. Ce sont les métadonnées du système d'exploitation. Chaque type de document peut aussi contenir des métadonnées. Ce sont par exemple les balises ID3 des fichiers .mp3. Dans un document Word, faites Fichier, propriétés pour découvrir une foule d'informations sur ce document comme le nom présumé de l'auteur, les statistiques de frappe, le nom de la secrétaire, des mots-clés, des commentaires, la plupart non renseignées d'ailleurs. Ces métadonnées sont enregistrées et transmises avec le document. Il est toujours amusant d'ailleurs quand on reçoit un document d'une entreprise qui se dit soucieuse de sécurité, de constater à quel point ces métadonnées sont des sources d'informations indiscrètes : document repris d'un fournisseur ou d'un concurrent, version précédente du document. L'utilisation de ces métadonnées reste aléatoire, car elles dépendent du système d'exploitation ou du produit et rien ne garantit qu'elles sont ou seront conservées lors des copies successives. Je déconseille d'ailleurs d'utiliser les métadonnées proposées par Microsoft dans Windows pour les photos car elles ne sont ni compatibles entre les différentes versions de Windows (?!), ni conformes aux standards!
A quoi servent ces métadonnées ? Essentiellement à identifier et retrouver la ressource. Depuis plus de deux mille ans, les bibliothécaires utilisaient des fiches ou des catalogues pour décrire et classer les documents de leurs bibliothèques. Ces fiches, plus faciles à manipuler que les documents eux-mêmes, ont donné naissance au concept de métadonnées. Ces fiches étaient produites par des humains pour des humains avec des manières très différentes. Pour rendre ces données utilisables facilement par les ordinateurs, il faut les standardiser. Il n'est donc pas étonnant que cette communauté ait été à l'origine d'une initiative visant à standardiser l'utilisation des métadonnées quel que soit le domaine d'utilisation. C'est le Dublin Core Metadata Initiative ou DCMI. Les plus curieux auront peut-être remarqué qu'à la fin de chaque article de ce site, en cliquant sur "métadonnées associées à cette page", on obtient un fichier RDF en XML qui décrit le document HTML conformément aux 15 éléments de base du DCMI. Internet et le Web ont rendu ces métadonnées de plus en plus indispensables pour pouvoir effectuer des recherches plus intelligentes que sur de simples mot-clés. Si je tape mon nom "figer" dans Google, j'obtiens aussi toutes les occurrences du verbe "figer". Avec des métadonnées, si je recherche un auteur, je n'obtiendrai que toutes les occurrences de "figer" comme auteur. Quand les ressources sont des images, une recherche textuelle ne produit pas de résultat et les métadonnées s'imposent.
L'avantage du DCMI est de décrire de manière très formelle n'importe quelle ressource en précisant la valeur de ses propriétés. Cependant comme ses travaux sont récents, chaque communauté a défini ses propres métadonnées sans référence au DCMI. Le monde de l'image et de la photo a été particulièrement productif et il faut vivre aujourd'hui avec plusieurs types de métadonnées : EXIF, IPTC, XMP. C'est ces métadonnées que je vais décrire maintenant en indiquant au passage comment s'en servir. Toutes ces métadonnées sont intégrées dans le document JPEG en plus de l'image. Elles sont donc en permanence disponible avec l'image et sont donc indépendantes d'un système ou d'un produit. Voir ici les différentes manières de stocker les métadonnées.
Pour faire des travaux pratiques à la lecture de cet article, je vous suggère d'utiliser un logiciel gratuit comme IrfanView sous Windows ou XnView sous Windows ou Linux, déjà signalés dans mon article sur Photos et images numériques.
Vous pouvez aussi utiliser le meilleur logiciel gratuit que j'ai trouvé pour les métadonnées PixVue mais dont l'utilisation, entièrement intégrée dans l'explorateur de Windows, est un peu déroutante au début si on ne lit pas la notice d'utilisation.
-EXIF
EXIF est l'abréviation de "EXchangeable Image File". Ce format définit les informations techniques concernant les paramètres de prise de vue et les réglages de l'appareil photo au moment de la capture numérique. Le format EXIF a été développé en 1995 par le JEIDA (Japan Electronic Industry Development Association). La dernière version 2.1 date de Juin 1998 et est disponible sur le site Exif.org. Ces informations sont contenues dans le fichier image lui-même. Dans IrfanView, il suffit de cliquer sur le bouton "EXIF info" dans les propriétés de l'image pour les obtenir. Dans PixVue, il suffit de faire dans l'explorateur de fichiers, clic droit, propriétés. Voir ci-après à gauche un exemple extrait d'IrfanView et à droite un exemple produit par PixVue.
File: - D:\Photos\2004-07-04\2004-07-04-abbaye_des_vaux_de_c 003.jpg Make - Canon Model - Canon PowerShot A80 Orientation - Top left XResolution - 180 YResolution - 180 ResolutionUnit - Inch DateTime - 2004:07:03 19:16:42 YCbCrPositioning - Centered ExifOffset - 196 ExposureTime - 1/100 seconds FNumber - 4.90 ExifVersion - 0220 DateTimeOriginal - 2004:07:03 19:16:42 DateTimeDigitized - 2004:07:03 19:16:42 ComponentsConfiguration - YCbCr CompressedBitsPerPixel - 3 (bits/pixel) ShutterSpeedValue - 1/101 seconds ApertureValue - F 4.91 ExposureBiasValue - 0.00 MaxApertureValue - F 4.91 MeteringMode - Multi-segment Flash - Not fired, auto mode FocalLength - 23.41 mm UserComment - FlashPixVersion - 0100 ColorSpace - sRGB ExifImageWidth - 2272 ExifImageHeight - 1704 InteroperabilityOffset - 1844 FocalPlaneXResolution - 8114.29 FocalPlaneYResolution - 8114.29 FocalPlaneResolutionUnit - Inch SensingMethod - One-chip color area sensor FileSource - DSC - Digital still camera CustomRendered - Normal process ExposureMode - Auto WhiteBalance - Auto DigitalZoomRatio - 1.00 x SceneCaptureType - Standard Maker Note (Vendor): - Macro mode - Normal Self timer - Off Quality - Fine Flash mode - Auto + red-eye reduction Sequence mode - Single or Timer Focus mode - Single Image size - Large Easy shooting mode - Full Auto Digital zoom - None Contrast - Normal Saturation - Normal Sharpness - Normal ISO Value - Auto Metering mode - Evaluative Focus type - Auto AF point selected - Exposure mode - Easy shooting Focal length - 250 - 749 mm (32 mm) Flash activity - Not fired Flash details - Focus mode 2 - Single White Balance - Auto Sequence number - 0 Flash bias - 0.00 EV Subject Distance - 408 mm Image Type - IMG:PowerShot A80 JPEG Firmware Version - Firmware Version 1.00 Image Number - 1020219 Owner Name -
Ces données sont produites à la prise de vue et sont de type interne c'est à dire qu'elles sont intégrées dans l'image. Elles sont transportées avec l'image. En principe, elle ne doivent pas être modifiées. Cependant les logiciels gratuits Photo Studio ou Exifer vous permettent de les modifier si nécessaire, en particulier changer la date, ajouter la position GPS, le copyright ou autre. Ils permettent aussi de voir les commentaires JPEG et la vignette que mon appareil photo insère dans l'image.
-IPTC
L'IPTC -International Press and Telecommunications Council- est une organisation internationale créée en 1965 pour développer et promouvoir des standards d'échange de données à destination de la presse. En association avec la NAA -Newspaper Association of America-, l'IPTC a défini un modèle global de données appelé "IPTC-NAA Information Interchange Model" connu sous le nom IIM. Un sous-ensemble de ce modèle a servi de base à la société Adobe pour définir dans son logiciel Photoshop les informations associées à une image. C'est ce sous-ensemble qui est communément appelé métadonnées ou champs IPTC. Ces métadonnées sont de type interne, c'est-à-dire q'elles sont stockées à l'intérieur des fichiers images JPEG. Elles voyagent donc avec l'image. Pour ajouter ces métadonnées, il suffit de cliquer sur File info... dans Photoshop, dans la page de propriétés de l'image sur "IPTC info" dans IrfanView ou clic droit sur le fichier, annotations, éditer dans PixVue.
Voici un tableau de correspondance entre Adobe Photoshop et IrfanView pour le nommage des champs IPTC.
-EXIF ou IPTC ?
On constate qu'il existe de nombreux champs en double entre les métadonnées EXIF et IPTC ce qui est inévitable puisque les deux normes ont été produites séparément. Une bonne pratique consiste à ne pas toucher aux données EXIF produites automatiquement à la prise de vue. Il faut renseigner "à la main" les métadonnées IPTC qui concernent le contenu de l'image (créateur, description, copyright,...). Tous les logiciels cités permettent de faire des traitements par lots pour ajouter le même champ à un ensemble d'images. Je vous conseille cependant de faire une sauvegarde préalable de vos photos car ces opérations modifient le contenu du fichier .jpg d'origine. Toutefois, la partie image des fichiers .jpg n'est pas altérée par ces modifications.
Le nombre de champs IPTC est très élevé. Ne remplissez que ceux qui vous seront utiles pour des classements, légendes ou recherches.
-La convergence vers XMP
XMP a été crée par Adobe en 2001. Il utilise un format XML et s'appuie sur RDF et sur les éléments du Dublin Core. Il définit aussi une manière, XMP Packet, d'encapsuler les données dans les applications. Il n'est donc plus limité au format JPEG mais est aussi défini pour TIFF, GIF, HTML, PDF, XML/SVG. Il est de plus extensible. Une vraie merveille disponible dans les dernières versions des produits Adobe. Ce format n'est pas encore très répandu mais ce ne saurait tarder puisqu'en juin 2004, l'IPTC et Adobe ont annoncé qu'ils travaillaient ensemble pour intégrer IPTC et XMP. Il existe un logiciel gratuit très intéressant PixVue qui s'intègre dans l'explorateur de fichiers Windows et qui permet de voir et mettre à jour les métadonnées XMP, IPTC et EXIF. Il permet aussi d'extraire ou d'exploiter ces métadonnées. Comme il met à jour simultanément les champs XMP et IPTC, vous n'avez pas de souci de transposition. PixVue est le logiciel que je recommande pour ce travail bien que l'interface utilisateur, entièrement intégrée dans l'explorateur Windows, ne soit pas très grand public.
Le classement des photos.
Il n'y a pas de méthode toute faite, et chacun doit définir sa manière de faire. Néanmoins, la disponibilité pour pas cher de disques de grande capacité et d'outils de recherche performants permet de simplifier le travail en "laissant faire" l'ordinateur. La stratégie générale consiste à ne pas classer et à tout mettre en vrac dans un dossier. Pour des raisons pratiques, on peut faire des sous-répertoires par date. Ensuite, si on a le temps, on ajoute des métadonnées IPTC/XMP qui décrivent les photos pour pouvoir faire des recherches ou pour produire automatiquement des albums avec des descriptions qui accompagnent les photos. Un outil comme Picasa permet d'examiner ces dossiers de manière entièrement automatique. Je conseille son usage pour cette visualisation intuitive. La version 1 de ce logiciel n'exploitait pas les métadonnées IPTC et EXIF, ce qui était quand même un comble quand on venait d'être racheté par Google. Cette lacune flagrante est en partie comblée dans la version 2 sortie en janvier 2005 puisque les mot-clés et les descriptions sont enfin stockées sous forme de métadonnées dans les photos ! Pour constituer des albums et des diaporamas sur votre PC, vous pouvez utiliser Picasa car la simplicité d'utilisation est exceptionnelle. Picasa propose aussi le logiciel Hello qui permet de télécharger automatiquement les photos sur un blog de Blogger.com. Si c'est pour faire un album sur le Web, JAlbum qui exploite les métadonnées IPTC est la meilleure solution ou PixVue qui permet de tout faire mais avec un peu plus de travail. Un lecteur me signale une traduction en français de Pixvue . En fait tous ces logiciels constituent des albums de vignettes qui pointeront sur les photos en définition originale ou qui les recopieront dans d'autres dossiers. La taille des vignettes est de quelques Ko ce qui permet des affichages simultanés de photos très rapidement. Autre avantage, la même photo peut se retrouver dans plusieurs albums à la fois. On peut aussi détruire et refaire des albums sans toucher aux images d'origines. Ceci permet de préparer des documents à publier sur le web ou sur CD et DVD dans différents formats. On peut publier les métadonnées dans les albums ou dans des pages web spéciales. Avec un outil de recherche sur le PC comme Google Desktop, on retrouve alors instantanément dans son ordinateur toutes les photos qui concernent un sujet, une catégorie ou un nom. Enfin, la puissance de l'ordinateur est à votre service! Voici donc comment procéder, sachant que toutes ces étapes, sauf la recopie des photos dans un dossier de votre PC, sont optionnelles ou réalisables quand on a le temps.
-1. Le nommage des photos.
Dans ce domaine, il faut rester très simple. En 2004 pour 100 euros, un disque de 200Go fournit un espace suffisant pour stocker 200 000 photos en format JPEG. Je conseille donc tout simplement de stocker les photos tel quel sur le disque dans un ensemble de répertoires et de sous-répertoires. On peut ainsi faire facilement une sauvegarde sur un DVD lisible sur les lecteurs DVD de salon modernes. Le nom de fichier est une métadonnée associée à la photo lisible par les programmes et les humains. Une bonne stratégie consiste à s'en servir comme outil de gestion simple d'une collection de photos. J'utilise comme identifiant majeur la date en format ISO 8601 utilisé aussi en XML. Le format est AAAA-MM-JJ par exemple 2004-12-31 . Le principal avantage de ce format est d'être classé correctement par un tri alphabétique. Ensuite, j'ajoute le lieu et un numéro d'ordre, ce qui donne un nom complet du genre 2004-12-31_Paris_123.jpg . J'utilise uniquement les caractères suivants a à z A à Z 0 à 9 $-_.+! pour ne pas avoir de problèmes lorsque ces noms sont présentés dans des pages Web ou dans des noms de dossiers. En particulier, je n'utilise ni caractères accentués ni espace( _ à la place). Les photos peuvent au choix être placées en vrac dans un répertoire ou classées dans des sous-répertoires dont le nom est constitué par les premiers caractères des noms de fichiers qu'il contient. Ce travail est très facile à réaliser car tous les outils que j'ai cités permettent relativement simplement de faire des renommages automatiques et globaux de fichiers à partir des métadonnées. Dans PixVue, vous pouvez définir le type de renommage une fois pour toutes et l'appliquer à un ensemble de fichiers sur un clic. Je suggère quand même de faire des tests sur des copies de dossiers car une erreur "globale" est vite faite.
-2. La description des photos.
Il faut maintenant ajouter à chaque photo une description pour pouvoir faire des recherches ou obtenir automatiquement des légendes dans la publication des photos. Il faut bien sûr intégrer ces métadonnées dans les fichiers JPEG pour les transporter avec les images. Les métadonnées EXIF restent inchangées. Il faut ajouter les métadonnées IPTC et/ou XMP. Vous pouvez le faire à l'aide de nombreux logiciels comme Picasa2, IrfanView ou PixVue. Je préfère Pixvue, le plus efficace bien que l'utilisation nécessite de lire la documentation
-3. Les outils de recherche.
Les outils de recherche se classent en 2 catégories :
- Les outils qui construisent un catalogue de toutes les images disponibles et qui permettent de naviguer rapidement à l'intérieur du PC comme ZoomBrowser ou Picasa. La recherche est alors purement visuelle. C'est parfait pour quelques centaines de photos et pour quelqu'un qui se souvient vaguement du contenu. L'utilisation est immédiate.
- Les systèmes qui utilisent ou indexent les métadonnées. Ces systèmes permettent des recherches beaucoup plus rapides et beaucoup plus faciles quel que soit le nombre de photos. Ils permettent de constituer des bibliothèques en provenance de sources différentes et de rechercher sans une connaissance au préalable du contenu. J'utilise soit Pixvue qui est intégré dans le système de recherche Windows soit Google Desktop à condition d'ajouter le plugin de recherche des données IPTC.
-4. La fabrication des albums de photos ou de catalogues.
J'utilise Picasa uniquement pour examiner l'ensemble du contenu du PC. Je fabrique systématiquement des albums ou des catalogues au format WEB(HTML) avec JAlbum. Ceux-ci peuvent donc être utilisés en local ou publiés tel quel sur le web ce qui est très pratique. Avec JAlbum, on dispose de 3 niveaux de définition ajustables : Le niveau vignette (100 à 200 pixels de côté, moins de 10 Ko), le niveau affichage web (600x450 pixels, environ 100Ko) et la définition d'origine que l'on peut télécharger (environ 1 Mo). On peut aussi faire une copie de ces albums sur CD ou DVD pour les lire sur un téléviseur avec un lecteur DVD de salon.
Où mettre les métadonnées ?
Les métadonnées sont souvent stockées à l'extérieur des documents comme les fiches qui décrivent les livres d'une bibliothèque ou les propriétés qui décrivent les caractéristiques d'un fichier. Cette pratique permet de constituer des "bases de données" que l'on interroge sans référence aux documents eux-mêmes. Cependant, quand le document est sous forme numérique et qu'il est envoyé d'un système vers un autre, vous perdez les métadonnées associées sauf si vous les transmettez à part. Il est donc plus judicieux d'inclure ces métadonnées dans le document lui-même en les identifiant à l'aide de balises. C'est ce qui est fait, par exemple, pour les balises ID3 des fichiers musicaux MP3 ou pour les balises "" des pages HTML.
Cette manière de faire est donc bien meilleure si plusieurs conditions sont respectées :
- le contenu des balises est indépendant d'un système ou d'un langage particulier. C'est tout l'intérêt d'utiliser des données en XML.
- les différents logiciels de manipulation des documents "préservent" ces balises. Je vous suggère de vérifier que c'est bien le cas pour les logiciels de manipulation de photos que vous utilisez.
- les programmes de recherche savent extraire automatiquement les métadonnées de vos documents lors du stockage dans un système particulier.
A titre d'exemple, j'ai inclus des métadonnées dans l'image qui illustre cet article. Faites clic droit, enregistrer l'image sous... pour récupérer cette image sur votre PC et vous pourrez lire les métadonnées à l'aide des logiciels que j'ai indiqués.
Ajoutez vos commentaires ci-après ou les envoyer à Jean-Paul Figer
Ce(tte) œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution - Pas d'Utilisation Commerciale - Pas de Modification 4.0 International.