SEMANTIC Web, RICH SNIPPET, GOOGLE ouvre
la voie du WEB 3.0
Cher au W3C, le web sémantique est la suite logique du WEB tel que nous le connaissons ; rendre le contenu de la toile intelligible par les agents techniques ! En mai dernier GOOGLE a annoncé que son moteur de recherche supportait RDFa et MICROFORMAT. On pourrait croire à une anecdote de GEEK, mais c’est bel et bien le feu vert à une petite révolution que GOOGLE vient de donner.
Qu’est ce que le WEB sémantique ?
De manière générale la sémantique c’est l’analyse du « signifié » de quelque chose. En l’occurrence, dans notre contexte : le WEB ! Ou plus précisément : les pages HTML. Pourtant, vous me direz que HTML ou X-HTML embarque une part de sémantique avec les jeux de balise ! Ces balises permettent de décrire la structure du document que représente la page HTML et permet aux agents techniques de différencier les titres, des paragraphes, des listes à puces. Cette structuration permet à des agents comme GOOGLE de comprendre quels sont les blocs de texte important. Ces informations, fort utiles, sont toutefois génériques et ne permettent pas de savoir, par exemple, si une liste traitre de produits ou de personnes. Le Web sémantique c’est donc l’idée de permettre une meilleure compréhension des contenus dans le but d’une utilisation automatisé par les agents techniques.
Le Web Sémantique n’est pas une idée nouvelle en soi, cela fait plusieurs années que le W3C l’encourage, notamment avec RDF (Ressource Description Framework) et OWL (Ontologie Web Language) Deux langage XML qui permettent respectivement de décrire des formats de données complexes et de classifier ces mêmes données.
Une autre initiative à vue le jour : MICROFORMAT, supporté par YAHOO et PALM. MICROFORMAT se veut une version simplifiée de description des contenus.
Jusqu’à présent les avis était partagé sur la mise en œuvre de ces technologies sur le Web. Chacun pouvait y aller de son « vocabulaire » et les détracteurs affirmaient qu’il ne serait pas possible d’utiliser ce type d’information sur des systèmes ouverts. Le fait que GOOGLE adopte cette technologie et créer son propre vocabulaire change la donne. Avec son écrasante domination, GOOGLE peu de fait devenir le standard qui manquait pour amorcer une adoption en masse de cette technologie.
De manière concrète, qu’est-ce que cela apporte-t-il ?
Dans l’immédiat les RICH SNIPPETS sur les listes de résultat de GOOGLE. Très vite, une amélioration des moteurs de traduction ou encore des MASHUP de haut-vol, sans commune mesure avec ce qui peut se faire aujourd’hui.
Les RICH SNIPPETS sont en eux, l’évolution des listes de résultat que propose aujourd’hui les moteurs de recherche. Un affichage riche ou seront affichés directement les images de produits, lieux ou personnes. Une véritable révolution sur la manière d’afficher les résultats. Jusqu’à présent, le géant de MOUNTAIN VIEW s’appuyait sur le contenu des balises TITLE et DESCRIPTION afin de structurer ses listes de résultat. On s’aperçoit très vite, que, dès que ces balises ne sont pas présentes le titre ou la description affichée sont de coup bien plus difficile à comprendre.
Autour de cette technologie, GOOGLE a commencé à réinventer la manière d’afficher les résultats.
Est-ce compliqué à mettre en œuvre ?
Fin de compte, que ce soit RDFa ou micro-format les deux approches sont accessibles à n’importe quelle équipe d’intégration.
En simplifiant : RDFa est destiné aux pages ayant un DOCTYPE compatible XML (XHTML et variante pour mobile), micro-format pour les autres (à partir de HTML4, ne supportant pas les NAME SPACE)
Une URI de référence :
Il faut bien comprendre qu’en soi, déclarer des éléments RDF ou micro format n’est pas compliqué. La difficulté jusqu’alors était de s’y retrouver dans tous ces vocabulaires ou de développer son propre vocabulaire. Ce qu’apporte GOOGLE, c’est justement un vocabulaire standard et simple :

Article très intéressant, si on rajoute à cela ARIA et HTML 5, une page Web va devenir une agrégation d’éléments sémantiques.
Salut Eric !
Très content d’avoir de tes nouvelles, et félicitations pour cet article… (depuis la dernière fois qu’on a bossé ensemble, je suis devenu consultant en référencement naturel) Je prépare le même article vu qu’en effet, les rich snippets et le web sémantique sont une piste très intéressante en termes de SEO.
Comme le dit la personne qui a commenté avant moi, le HTML apporte aussi pas mal de nouveautés en sémantique qui seront assez simple à mettre en place (après bien sûr, le temps d’incubation avant que les navigateurs ne s’alignent…)
A bientôt! :)
En espérant que ça marche un jour…
Je trouve les concepts du web sémantique très intéressants mais je reste perplexe quant à leur mise en place massive. Ce sont des technos faciles à implémenter, le bénéfice peut être très intéressant pour les outils de recherche et les internautes.
Alors pourquoi ça ne décolle toujours pas ?
En espérant que ça marche un jour…
Je trouve les concepts du web sémantique très intéressants mais je reste perplexe quant à leur mise en place massive. Ce sont des technos faciles à implémenter, le bénéfice peut être très intéressant pour les outils de recherche et les internautes.
Alors pourquoi ça ne décolle toujours pas ?
Article très intéressant, si on rajoute à cela ARIA et HTML 5, une page Web va devenir une agrégation d’éléments sémantiques.
Article très intéressant, si on rajoute à cela ARIA et HTML 5, une page Web va devenir une agrégation d’éléments sémantiques.
Le web sémantique représente une révolution dans les moyens de présenter des informations à des publics. Mais sait-on que son émergence va affecter aussi la manière de les mettre en ligne.