vide

RSS, Weblogs et Blogs
Comment créer votre chaine d'information

Publié le 04/10/2003 - Mis à jour le 15/02/2004 par

Définitions
XML : Voir l'article sur ce site.
Weblog : site web personnel ou non-commercial à mi-chemin entre un journal-en-ligne et une liste de liens commentés.
Chaîne ou canal RSS : fichier XML contenant une liste de liens pointant vers des informations contenues dans un site web.

Plus d'un million de Weblogs recensés par Technorati le 27 septembre 2003, 7000 nouveaux par jour soit un de plus toutes les 12 secondes. Pourquoi cette croissance exponentielle et comment y participer ?

Le format RSS ("Rich Site Summary" ou "Real Simple Syndication" selon les sources) décrit d'une manière synthétique le contenu d'un site web : événements, articles ou informations. Cette description est un fichier XML au format RSS qui est mis à jour avec le site et qui contient une liste de liens et leurs descriptions. Pour voir un exemple, cliquer sur l'icone "rss 2.0" à la fin de cette page. En lisant ce fichier, d'autres sites peuvent automatiquement utiliser les dernières informations publiées sans intervention manuelle. Cette mise en commun des contenus (syndication) est très puissante. Elle est utilisée de plusieurs manières différentes :

  1. Une première application évidente pour les journaux d'informations. N'importe quel site peut synchroniser son contenu avec les dernières nouvelles publiées sur d'autres sites. Il suffit de lire ce fichier et d'en exploiter le contenu. Par exemple, les dernières nouvelles de la technologie sont mises à jour en permanence sur la première page de mon site (en haut à droite). Il est bien évident que seul un système entièrement automatique rend cet affichage possible.
  2. Une autre application est d'utiliser un logiciel ("aggrégateur") de sites choisis parmi vos centres d'intérêt. Vous avez ainsi en permanence des liens à jour vers l'information qui vous intéresse et vous êtes prévenus dès que l'information change. Voir l'image en tête de cet article.
  3. Un troisième type d'application est d'être soi-même un émetteur d'informations (Weblogs) qui peuvent être syndiquées par d'autres à coût quasi-nul. Ce type d'usage se développe avec un taux de croissance de 25% par mois.

Dans cet article, nous examinerons successivement la technologie RSS puis les différentes manières d'en tirer partie.

Le format RSS

RSS est un format XML de données qui décrit des listes de liens associés à leurs descriptions qui vont aider le lecteur à décider de suivre ces liens ou pas. Chaque site web maintient une liste de ces liens sous la forme d'un canal RSS ("RSS feed"), c'est à dire un fichier XML qui permet aux autres ordinateurs de consulter ces informations. La plupart des grands sites fournissent ces canaux RSS comme cet exemple sur Yahoo. Mon canal RSS est ici.

Le format RSS a peu évolué depuis sa création en 1999 et c'est sa simplicité qui en a fait son succès. La moitié des sites utilisent encore la version initiale 0.91. Une version plus complexe 1.0 a été un échec. Si vous débutez, le mieux est d'utiliser directement le RSS 2.0, compatible avec la version 0.91 et dont la plupart des nouvelles options sont facultatives (Voir ici les spécifications officielles du RSS 2.0). Si vous créez des fichiers RSS, il existe un validateur en ligne bien utile http://feedvalidator.org.

Exemple de fichier RSS

exemple de RSS

Comment créer sa chaîne d'information personnelle ?

Pour exploiter ces fichiers RSS, il faut un lecteur qui permette de composer votre chaîne d'information à partir des milliers de sources qui existent. 2 solutions sont possibles : utiliser un service sur Internet au travers d'un simple navigateur ou installer un lecteur RSS sur un PC (qui doit être connecté en permanence à Internet).

-Service sur Internet

Pour débuter, je vous conseille l'incontournable NewsisFree. La version gratuite vous permet de construire vos pages d'informations personnelles à partir de plus de 6000 sources d'informations ou de n'importe quel fichier RSS. Vous pouvez même partager ces pages avec d'autres comme dans cet exemple que j'ai crée. Un autre site intéressant à signaler est Syndic8 ou BlogLines dont l'interface utilisateur est particulièrement réussie.

-lecteur RSS sur PC

Il existe de nombreux lecteurs RSS dont la plupart sont gratuits. Voici ceux que j'ai sélectionnés :

  • SharpReader. C'est celui que j'utilise. Il permet de choisir pour chaque chaîne la fréquence de rafraichissement. Des bulles de notification préviennent de l'arrivée de nouveaux messages. Il permet l'import et l'export de sa liste de liens en format OPML.
  • FeedReader. Il a les mêmes fonctionnalités que SharpReader mais il n'évolue plus beaucoup et a tendance à se bloquer de temps en temps.
  • Awazu. Je n'ai testé que la version personnelle gratuite. On peut importer ses liens en format OPML mais pas les exporter! Le produit fournit de très nombreuses options.

Pour trouver des sources, il y a plusieurs méthodes :

Weblogs ou comment devenir émetteur d'informations ?

Un Weblog, c'est un site web personnel ou non-commercial à mi-chemin entre un journal-en-ligne et une liste de liens commentés. les Weblogs sont souvent appelés Blogs et leurs auteurs des Bloggers. En général, ces auteurs sont prolixes et les entrées sont journalières ou presque. Les sujets peuvent être très généraux, tout ce qui intéresse le Blogger, ou très centrés sur un domaine précis.

Cette prolifération a donné naissance à de nombreux produits qui permettent, sur son PC ou sur le Web, de créer un Weblog en quelques minutes ou de consulter une liste de Weblogs. Les plus connus sont Blogger, Drupal, Radio Userland, AmphetaDesk, NewsIsFree,...

Dans la liste des Weblogs les plus utilisés on peut constater que la plupart des grands médias comme le New York Times, CNN, CNET, USA Today n'hésitent pas à publier leurs informations par ces canaux.

Les "vrais" journalistes se sont aussi emparés du sujet et il existe par exemple sur MSNBC une revue de ces Blogs.

Mon rythme de publication est loin d'être journalier. J'ai cependant fabriqué mon canal d'information http://www.figer.com/rss/figerchannel.xml qui peut être consulté et "syndiqué" par tous les robots du Web.

Un excellent exemple de cette collecte automatique est fournie par Google qui réalise un journal de News avec une version française mise à jour en permanence à partir de plus de 4000 sources sans intervention humaine !

Le futur remplaçant des courriels pour les listes de distribution ?

Quand on regarde un lecteur RSS ou un lecteur de courriels POP3 ou IMAP4, on est frappé par l'analogie. Un lecteur RSS présente de nombreux avantages sur une liste de distribution ou un groupe de news : on ne dévoile pas son adresse de courriel, on gère son abonnement directement. Donc adieu virus et spam ! Avec les progrès des lecteurs RSS (Newsgator est déjà intégré dans Outlook!) , l'archivage automatique et la multiplication des sites qui utilisent cette technologie, cette manière de faire qui utilise les standards les plus modernes HTTP et XML, devrait en toute logique s'imposer bientôt sur l'Internet.

De RSS 2.0 à ATOM 1.0 - mise à jour octobre 2005

Les Blogs ont popularisé les liens RSS qui permettent de syndiquer très facilement l'information. Ce site est équipé d'un canal d'information RSS 2.0 depuis très longtemps. Le standard RSS avec ses nombreuses versions (0.92, 1.0 , 2.0) incompatibles a été développé par quelques individus. Il a connu un très grand succès mais sa définition technique n'était ni très précise, ni alignée avec les standards de l'Internet. Un groupe de travail s'est donc penché sur le sujet et a publié ATOM 1.0 devenu depuis août 2005 un "proposed standard" de l'IETF, dernière étape avant la RFC. Bien que l'utilisation d'Atom soit encore faible, j'ai ajouté un canal Atom feed ATOM à mon site. Il contient les mêmes liens que le RSS 2.0 feedcanal RSS. J'ai ajouté une feuille de style à ces fichiers XML pour les rendre lisibles dans un navigateur. Pour voir le XML, faire "afficher source" dans votre navigateur. Gmail publie vos derniers messages reçus sur le canal ATOM suivant http://mail.google.com/mail/feed/atom.

OPML

OPML est un format XML de données pour les "Outliners". Un Outliner (je n'ai pas trouvé de bonne traduction en français) est un éditeur de texte qui permet de structurer l'information et de faire apparaitre cette information avec le niveau de détail souhaité. C'est très pratique pour gérer des listes de liens, des catalogues ou pour structurer des idées. Le format OPML permet d'échanger ces informations structurées entre des applications et des systèmes différents. J'ai réalisé un Outliner simple dans un navigateur que vous pouvez tester ici.

Ajoutez vos commentaires ci-après ou les envoyer à Jean-Paul Figer
Mots clés


Licence Creative Commons
Ce(tte) œuvre est mise à disposition selon les termes de la Licence Creative Commons Attribution - Pas d'Utilisation Commerciale - Pas de Modification 4.0 International.