21 mai

Google Knowledge graph – Web Sémantique

google knowledge graph

Google fait le buzz avec son Knowledge graph. Les faits ne sont pas nouveaux mais la communication autour des améliorations continues du moteur préféré des terriens Google l’est ! Jamais je ne me suis fait poser autant de questions en une semaine : c’est quoi ce knowledge graph, comment il affecte mon marketing, c’est quoi qui change dans ma stratégie?!…

La bonne nouvelle c’est que tout ce que nous avons fait jusque-là n’a pas changé : les mots clés, les balises métas, le contenu roi, le link building… La mauvaise nouvelle est qu’il faudra en faire davantage notamment en taguant les contenus avec du Mark up standard genre Schema que je privilégie mais il y’en a encore qui continuent à utiliser RDFa ou les microformats, et c’est aussi bien tant que les moteurs les supportent. Alors knowledge graph, kezako ?!

Vers le Web .0 avec Google Knowledge Graph

Je pense le mieux est de considérer les changements opérés par Google dans le temps :

web 3.0 = web des datas

Si le web 1.0 est le web des institutions avec un dialogue en sens unique, le Web 2.0 aura donné la possibilité aux masses de s’exprimer et peupler le web de leurs commentaires, post, réponses, CVs, statuts… Un effet bénéfique de cette démocratisation a été la profusion des contenus à peu près à propos de tout et par tous : c’est ce que nous avons appelé l’intelligence collective.

Le web 3.0 (web sémantique) c’est le web des données (web of data) ou l’intelligence artificielle. Imaginez au lieu d’une page web un ensemble d’entités web (personnes, organisations, places…) reliées entre elles par des relations que le moteur a construit au fur et à mesure qu’il organisait tous ces contenus dans le cloud. Imaginez une grosse base de données où chaque entrée est une entité décrite par des propriétés universellement reconnues par les moteurs Google, Yahoo et Bing. Les syntaxes utilisées sont le RDFa, Microformats et le tout récent Schema adopté en Juin 2011.

The Semantic Web is a web of data, in some ways like a global database.

(Tim Berners-Lee – Septembre 1998).

L’histoire a commencé en 1994 quand Tim Berner Lee (l’inventeur du web) a introduit la notion de métadonnées utilisables par les machines, et puis en 1998 où il a dressé le plan haut niveau  de déploiement de l’architecture du web sémantique. En 1999 déjà, le W3C (World Wide Web Consortium) publiait une spécification alors appelée RDF (Resource Description Framework) utilisant le XML (Extensible Markup Language) qui permettait de spécifier la sémantique des données sous une forme standardisée et de manière interopérable. En 2000, nous avons vu apparaître l’ontologie nommée FOAF (Friend of a Friend) qui sera utilisée plus tard par des réseaux sociaux comme Identi.ca (site canadien de référence) et aussi le service FriendFeed. En 2004, le W3C approuvait OWL  (Web Ontology Langage) considéré comme une extension du RDF et RDF Shema (RDFs). Il était destiné à la description de classes et de types de propriétés en apportant une meilleure intégration et une inférence plus facile des ontologies. En 2005, les choses se concrétisent avec la syntaxe Microformats qui est plus facile d’utilisation et voit son application concrète dans l’utilisation web des hCard, hCalendar, hReview… et des attributs adoptés par les moteurs comme Rel-License, Rel-Noffolow, Rel-Tag… Les versions 3 de Firefox 7 et 8 d’Internet Explorer 8 supportaient alors de manière native les microformats à partir de 2007.

étapes du web sémantique

Depuis 2008, le HTML5 vise à enrichir le HTML en ajoutant des tags destinés à décrire la sémantique des documents mais aussi les applications en ligne.  En mai 2009, Google annonçait qu’il supportait désormais la nouvelle syntaxe RDFa, en plus des microformats, tout comme l’avait fait Yahoo! via search monkey en 2008. En 2010, nous avons vu naître les microdata comme faisant part entière du HTML5 : les moteurs et les navigateurs peuvent donc extraire des informations d’une page web pour améliorer l’expérience utilisateur. En Juin 2011, les trois moteurs que sont Google, Bing et Yahoo! décident de lancer Schema (Schema.org) pour un balisage commun des données  sémantiques.  Le vocabulaire Schema est basé sur la syntaxe des microdata du HTML5, d’où l’intérêt de combiner les deux.

Depuis le début de l’année, Mashable avait rapporté que Google voulait passer d’une base index montée sur les mots clés vers quelque chose de plus complexe prenant en compte les entités web (web entities) : le Knowledge Graph. Moi-même j’avais publié un billet sur mon site de référencement intitulé « futur du référencement naturel Google » qui expliquait l’important shift dans la recherche notamment avec la construction du graphe de connaissance de Google et les entités web, leurs attributs et relations.

Il faut voir dans cette importante mise à jour (plus que ça en fait) l’ajout d’une nouvelle source d’informations pour les moteurs de recherche qu’ils pourront utiliser dans leur classement des résultats en fonction de leur pertinence : en plus des liens jadis à la base de l’algorithme PageRank de Google, en plus des signaux sociaux très importants dont je parlais encore récemment sur le blog Mediative, les entités web ainsi construites et qui forment le knowledge graph de Google vont donc renforcer ou au contraire contredire la compréhension du contenu tel que présenté par les webmasters. Imaginons cela comme une source d’autorité supérieure qui donnera du fil à retordre aux référenceurs du monde entier pour comprendre comment influer les moteurs comme Google. Nous connaissons à l’heure actuelle trois manières d’aller dans ce sens :

  1. Les bases de données publiques : Wikipedia, Freebase, Imdb…
  2. Les contenus marqués avec des tags sémantiques : Microformats, RDFa, microdata…
  3. Les pages de profil et pages entreprises sur les réseaux sociaux : Facebook, Linkedin, Google plus…

Maintenant, comment tout ça va influencer le marketing 3.0 et quelles sont les améliorations apportées dans la communication en ligne, je vous invite à découvrir ma présentation faite au HEC en 2011 : Stratégie et Web 3.0.

Et puis, ici même, je rapportais que l’introduction de Google Plus Search Your World était un préambule au Web sémantique et au marketing personnalisé. En tout cas il est loin de servir comme modèle pour un réseau social comme rapporté dans l’étude de Simply Measured de mai 2012 : Google+ Brand Page Adoption and Engagement

Google plus pages engagement et adoption

Avec la connaissance des personnes, organisations, places… les moteurs de recherche font un grand pas dans la direction du web de demain : le web sémantique.

Update 11 Juin 2012 : Je viens de publier un article sur RSM Référencement :

Le Score des lecteurs
[Total : 0    Moyenne : 0/5]
Google Knowledge graph – Web Sémantique was last modified: septembre 23rd, 2014 by Mohammed ALAMI