Cet été, j'ai découvert le modèle de données RDF et ce fut une révélation. Je meurs donc d'envie de vous faire partager mes nouvelles connaissances à ce sujet, en essayant d'expliquer ceci de façon simple (ainsi, j'ai délibérément simplifié les exemples de codes pour plus de lisibilité).

Tout d'abord, rappelons ce qu'est le XML. C'est une syntaxe, un langage permettant de créer d'autres langages. On peut aujourd'hui faire tout et n'importe quoi avec des langages utilisant la syntaxe XML : du dessin (SVG), de la messagerie instantanée (Jabber)... et bien sûr des textes structurés (XHTML).

C'est sur le XML que se basent le XHTML et le RDF/XML. Si le premier est omniprésent, le second peine à s'imposer. Pourtant, ils ne sont pas en compétition l'un contre l'autre, il se complètent.

À ma droite, le XHTML

Le XHTML structure les documents textes, il définit leurs titres, leurs paragraphes, leurs emphases, leurs différents composants. Il est facilement compréhensible par l'homme et optimisé pour l'affichage dans un navigateur.
En voici un exemple :



  Fun House des Stooges

Fun House des Stooges

En 1970, les Stooges publient leur album Fun House chez Elektra.

  1. Down On The Street
  2. Loose
  3. T.V. Eye
  4. Dirt
  5. 1970
  6. Funhouse
  7. L.A. Blues

Le problème principal avec ce format c'est qu'il structure l'information mais ne la définit pas. Seuls des êtres humains avertis de ce qu'est un album de musique peuvent la comprendre. Sinon, comment deviner ce qu'est Elektra ? Que les Stooges sont ici un groupe de musique et non des comiques de télévision ? Ce que représente la liste de termes après la description ?

À ma gauche, le RDF/XML

Au contraire, le RDF/XML permet de donner du sens à l'information, afin qu'elle soit compréhensible par des machines et donc qu'on puisse automatiser son traitement.
Voici exactement les mêmes informations, mais ce coup-ci dans le format RDF/XML :

Fun HouseStooges1970
  • Down On The Street
  • Loose
  • T.V. Eye
  • Dirt
  • 1970
  • Funhouse
  • L.A. Blues
  • Ainsi, des moteurs peuvent répondre aux question suivantes : combien de chansons contient Fun House ? En quelle année est paru le disque ? Est-ce vraiment un album ? etc. Alors qu'en se contentant de la version XHTML, ils ne pouvaient fonctionner que par mots clefs, comme Google aujourd'hui.

    Le problème est que publier ceci tel quel ou même avec une feuille de style ne donnera pas un document facilement lisible par les humains. Le RDF ne peut donc pas remplacer le XHTML.

    Au centre.... XHTML 2

    Aujourd'hui, les webmestre soucieux de donner du sens à la publication de leurs données doivent créer deux fichier séparés : le XHTML pour les humains, le RDF/XML pour les machines. Cette opération n'est pas si fastidieuse qu'elle en a l'air car les deux fichiers peuvent être générés simultanément depuis une même base de donnée, mais tout de même c'est une charge supplémentaire.

    La solution à ce problème arrive bientôt. avec le futur XHTML2.0 et son implémentation de l'attribut property, à mon avis l'apport le plus marquant de cette nouvelle version :

    
    
      Fun House des Stooges

    Fun House des Stooges

    En 1970, les Stooges publient leur album Fun House chez Elektra.

    1. Down On The Street
    2. Loose
    3. T.V. Eye
    4. Dirt
    5. 1970
    6. Funhouse
    7. L.A. Blues

    Ainsi, dans un seul document nous offrons une information complète : structurée pour la compréhension de l'homme, adaptée au traitement des machines.

    Vous pouvez donc deviner que je fais partie de ceux qui attendent XHTML2.0 avec impatience.