Web sémantique_Bee4_Agence_SEOCes dernières années, le Web sémantique a été fortement commenté, documenté et des résultats probants commencent à émerger. Ce Web intelligent utilisant des données structurées interprétables par l’homme, mais aussi par la machine, peut être mis en place dès aujourd’hui dans le cadre d’une stratégie SEO performante.

« Améliorer le trafic d’un site en groupant les contenus en sujets plutôt qu’en mots-clés afin d’éviter toute ambiguïté de synonymes. »

Sous l’impulsion du visionnaire Ray Kurzweil, arrivé en 2012 chez Google, les différentes mises à jour de l’algorithme n’ont eu de cesse d’être alimentées par l’intelligence artificielle. Google et son outil RankBrain se base de plus en plus souvent sur le contexte d’une recherche plutôt que les mots clés. Ainsi, l’utilisation du NLP (Natural Language Processing) permet d’apporter directement une réponse à l’internaute avant les résultats (c’est le cas pour des distances, des définitions/traductions, des recettes ou des paroles de chansons par exemple) et d’adapter la réponse en fonction du contexte (heure, lieu, etc).
Web Semantic Knowledge Graph

En plus de connaître la distance en kilomètres, on obtient des informations annexes qui découlent de la recherche (la durée, l’itinéraire, etc).

Via le Knowledge Graph, Google utilise donc davantage des entités que des mots clés pour créer des connexions contextuelles et sans ambiguïtés.

Structurer les contenus d’un site : Metadata et Schema.org

Comme dans la classification de documents ou d’ouvrages, les données du web doivent suivre un certains nombres de règles universelles dont le standard est incarné par Schema.org. Il permet d’aider les moteurs à comprendre le contenu d’une page par des données structurées.

Les données structurées offrent une clé de lecture optimisée pour les moteurs de recherches et peuvent être intégrées via 3 formats différents : JSON-LD, Microdata, RDFa. JSON-LD étant le format le mieux adapté à Google car :

  • Il n’affecte pas les performances de la page, car elle peut être chargée de manière asynchrone
  • Il est injecté dans la page sans impact sur la structure HTML existante et les balises
  • Il est facilement réutilisable par les développeurs web car il suit la syntaxe JSON
  • Il exploite les données liées

Entities Web Semantic

L’importance des données liées dans le Web sémantique

Chaque entité part d’une base simple appelée « triple », subject-predicate-object, c’est en reproduisant ce schéma en le liant à des millions d’autres que le web sémantique se forme. Toutefois, l’information manque de contexte, on ne sait pas si la personne est un écrivain ou un cuisinier, il faut donc des données liées (linked data) pour aider le moteur.

Si Schema.org utilise un vocabulaire aidant les moteurs à comprendre le contenu d’un site, les données liées créent des connexions interprétables par ceux-ci en liant des entités présentes sur des sites web différents. Le plug-in WordLift est un bon moyen de lier ces entités mais comment être absolument sûr de l’absence d’ambiguïté et que Jack Kerouac soit bien identifié comme écrivain par les moteurs ?

De manière implicite : le moteur étudie le site et peut en déduire un contexte.

De manière explicite :

  • en lisant un attribut de donnée liée @id (un identifiant unique d’entité qu’il a peut-être déjà rencontré)
  • En lisant n’importe quel sameAs link (un lien qui indique que l’entité est équivalente à une autre présente sur une encyclopédie ouverte telle que Wikipedia ou directement via le Knowledge Graph).

Seulement 10 000 à 50 000 domaines utilisent cette propriété à ce jour, c’est pourquoi l’intégrer dans une stratégie SEO peut vraiment faire la différence.
Cependant, le sameAs seul n’est pas suffisant et se doit d’être intégré dans le schéma de données ouvertes à cinq étoiles. Introduit par Berners-Lee, le concept sert à relier chaque élément de données avec d’autres et ce par la propriété owl: sameAs.

Il existe quatre principes simples à suivre lors de la publication de données sur le Web

  • Utiliser les URI pour le nommage (c’est l’identifiant unique que nous avons introduit ci-dessus)
  • Utilisez les URI HTTP pour que les utilisateurs puissent rechercher ces noms (cela signifie que l’ID de chaque entité doit être accessible via l’URI HTTP)
  • Lorsque quelqu’un cherche un URI, fournissez des informations utiles, en utilisant les standards
  • Inclure des liens vers d’autres URI, afin qu’ils puissent découvrir plus de choses (ajouter la propriété owl: sameAs)

Pour simplifier, un jeu de données ouvert à 5 étoiles est simplement un moyen de publier des métadonnées (en utilisant un standard de données liées) rendues lisibles et accessibles par les machines.

C’est pourquoi, en connectant un morceau de texte, écrit par un humain avec un jeu de données ouvert créé par une machine, notre contenu devient entièrement accessible et facile à utiliser. Reliés entre eux, ces ensembles de données forme un Cloud Linked Open Data.

Linked Open Data Cloud

Source: LodLive

 

Lorsque ces données structurées sont publiées dans un knowledge graph utilisant des standards Web sémantiques, votre site « rejoint » le Linked Open Cloud. Faire partie du Web sémantique signifie rendre les données accessibles aux machines et leur permettre de les calculer pour fournir une meilleure réponse et améliorer la qualité du trafic qu’elles vous apporteront.

Source : https://torquemag.io/2017/11/everything-know-semantic-seo/

————————————————————————

Vous voulez en savoir plus sur notre expertise d’agence SEO ?

Vous souhaitez un devis SEO ?

Bee4, agence SEO Paris & agence SEO Lyon.

Stay in touch !

Jordan