Qu’est-ce que le schema markup exactement ?
Le schema markup est un code ajouté à une page web pour décrire son contenu dans un vocabulaire normalisé — schema.org — afin que les moteurs de recherche et les modèles d’IA comprennent explicitement ce que la page expose : un produit, un article, une recette, une entreprise locale, un événement, un avis. Le format recommandé par Google est JSON-LD, une notation JavaScript encapsulée dans une balise <script type="application/ld+json">.
L’idée fondamentale tient en une phrase : un crawler classique sait lire le HTML visible, mais il doit deviner ce que ce contenu signifie. Le schema markup arrête le devinement. Vous dites explicitement « ce paragraphe est un prix, cette ligne est l’auteur, ce bloc est une note d’avis ». À partir de là, Google peut afficher un résultat enrichi (étoiles, prix, fil d’Ariane), et un LLM peut citer l’entité avec confiance.
Le vocabulaire schema.org est maintenu collectivement par Google, Microsoft, Yandex et Yahoo! depuis 2011. Il propose aujourd’hui plusieurs centaines de types et plusieurs milliers de propriétés, mais en pratique, une dizaine de schemas couvrent 95 % des besoins d’un site professionnel.
Pour le SEO traditionnel, le schema déclenche l’éligibilité aux résultats enrichis de Google : étoiles produits, prix, FAQ déroulantes, fil d’Ariane visuel, recettes en carrousel. Pour le GEO, il joue un rôle différent et plus profond : les modèles génératifs s’appuient sur les schemas pour identifier les entités et leur attribuer une mention dans la réponse synthétisée.
Pourquoi le schema est devenu critique avec l’IA.
Entre 2015 et 2022, le schema markup était un sujet d’optimisation marginal. Les SEO l’ajoutaient pour gratter quelques étoiles d’avis dans la SERP, parfois pour un fil d’Ariane plus propre, et c’était à peu près tout. Les agences sérieuses le faisaient. Les autres l’oubliaient sans grande conséquence.
L’arrivée de ChatGPT search en novembre 2024, puis la généralisation des AI Overviews de Google en 2025, ont changé l’équation. Les modèles génératifs ne se contentent plus de paraphraser un paragraphe trouvé dans un index. Ils essaient d’identifier une entité derrière le contenu — une marque, un auteur, une organisation — pour pouvoir la citer ou la recommander. Et l’identification d’entité passe massivement par les données structurées.
Concrètement, quand Perplexity génère une réponse à « quels sont les meilleurs consultants SEO en France », son moteur de récupération va lire des pages, mais il va surtout chercher à raccrocher chaque page à une organisation identifiable, avec un Knowledge Graph cohérent. Un site sans schema Organization, sans sameAs vers Wikidata, sans Person auteur, est un site que le LLM peut difficilement citer comme entité.
En 2026, un schema Person + Organization avec sameAs Wikidata propre vaut plus, pour la citabilité IA, que dix backlinks éditoriaux acquis péniblement. Ce n’est pas une opinion. C’est une observation terrain répétée sur des comptes B2B et e-commerce.— Yonel Sasson · pratique GEO depuis 2022
Le schema markup est donc passé d’un détail cosmétique SEO à un levier structurel d’autorité d’entité. Il n’est plus négociable pour une marque qui prétend exister dans les réponses IA. France Num, opérateur officiel de la transformation numérique des TPE/PME, le confirme dans son guide GEO de février 2026 : la structuration d’entité via schema.org est l’un des trois piliers de la citabilité par les moteurs génératifs.
Schema markup, données structurées et JSON-LD : les différences.
Trois termes qui désignent des choses légèrement différentes, et que la majorité des contenus francophones confondent. La précision compte, surtout pour des briefs techniques avec un développeur ou une agence.
Données structurées est le terme générique. C’est l’expression utilisée par la documentation officielle de Google pour parler de tout format normalisé qui décrit le contenu d’une page. Trois formats sont reconnus par Google : JSON-LD, Microdata et RDFa. Le terme inclut donc le format, le vocabulaire et l’usage.
Schema.org est le vocabulaire. C’est la liste des types (Article, Product, Person, Event, Recipe, FAQPage, etc.) et des propriétés (name, url, author, datePublished, etc.) qu’on peut utiliser pour décrire un contenu. Schema.org n’impose pas de format de sérialisation, mais c’est le vocabulaire que Google et tous les autres moteurs reconnaissent.
JSON-LD est le format de sérialisation. C’est la manière concrète d’écrire le schema dans la page. Google recommande explicitement JSON-LD depuis 2017, parce qu’il est découplé du HTML visible, simple à maintenir, et compatible avec l’injection dynamique côté client.
Schema markup est le terme courant chez les SEO et les développeurs. Il renvoie à la pratique d’ajouter du schema.org dans une page, généralement via JSON-LD. Le terme est légèrement informel mais largement compris.
Pour un brief opérationnel : on parle de JSON-LD quand on parle de format technique, de schema.org quand on parle de vocabulaire, et de données structurées ou schema markup quand on parle de l’ensemble.
Les 15 schemas les plus utiles en 2026.
Sur les 26 types de résultats enrichis officiellement supportés par Google, une quinzaine concentre l’essentiel des besoins. Cette liste couvre les sites éditoriaux, e-commerce, B2B services, locaux et événements. Tous existent dans le vocabulaire schema.org et tous sont reconnus par Google et les principaux LLM.
| Type | Usage | Impact SEO | Impact GEO |
|---|---|---|---|
| Article | Article de presse, guide éditorial, page de fond | Fort | Fort |
| BlogPosting | Article de blog (sous-classe d’Article) | Fort | Fort |
| Product | Fiche produit e-commerce, prix, disponibilité, avis | Fort | Moyen |
| Organization | Entité marque, sameAs Wikidata, logo, adresse | Moyen | Critique |
| Person | Auteur d’un article, fondateur, expert nommé | Moyen | Critique |
| LocalBusiness | Établissement physique, horaires, géolocalisation | Fort | Moyen |
| BreadcrumbList | Fil d’Ariane visuel dans la SERP, structure du site | Fort | Moyen |
| FAQPage | Questions-réponses, prérequis aux AI Overviews | Réduit | Fort |
| HowTo | Méthode pas à pas, tutoriel, recette technique | Réduit | Fort |
| Recipe | Recettes de cuisine, carrousel Google | Fort | Moyen |
| Event | Événement, conférence, concert, formation datée | Fort | Moyen |
| Review | Avis individuel sur produit, service ou lieu | Fort | Moyen |
| AggregateRating | Note moyenne agrégée, étoiles dans la SERP | Fort | Moyen |
| VideoObject | Vidéo embarquée, vignette enrichie SERP | Fort | Faible |
| Service | Page service B2B, presta, offre commerciale | Faible | Moyen |
À noter sur l’évolution récente. Google a réduit l’éligibilité des rich results FAQPage et HowTo en août 2023, en restreignant leur affichage aux sites institutionnels et gouvernementaux pour FAQPage et aux pages purement procédurales pour HowTo. Le schema reste utile à implémenter — pour les LLM et la lecture machine — mais il ne déclenche plus systématiquement de résultat enrichi visible. C’est un point que la moitié des guides francophones n’a pas encore mis à jour.
Mon arbitrage personnel. Si je devais choisir trois schemas à implémenter en priorité absolue sur un site qui démarre, je prendrais Organization avec sameAs Wikidata, Person pour l’auteur principal, et BreadcrumbList sur toutes les pages internes. Ces trois-là travaillent simultanément le SEO classique et le GEO, pour un coût d’implémentation marginal. Le reste se construit ensuite par cas d’usage.
Person + Organization + sameAs Wikidata : le combo GEO.
C’est la partie que la plupart des guides survolent. Pourtant, c’est aujourd’hui le levier qui produit le plus de résultats GEO mesurables sur les comptes que nous accompagnons depuis 2022.
L’idée est simple. Un LLM ne « voit » pas une page web comme un humain. Il essaie de raccrocher le contenu lu à une entité connue de son graphe de connaissances. Cette entité, idéalement, existe dans un référentiel public et vérifiable : Wikidata, Wikipedia, Knowledge Graph Google, base ROR pour la recherche, registre national pour les entreprises.
Quand votre schema Organization déclare "sameAs": ["Qxxxxxx"], vous donnez explicitement au LLM le pointeur vers votre fiche d’entité publique. Idem pour Person avec un sameAs vers Wikidata, LinkedIn, et éventuellement ORCID pour les profils académiques. Le modèle peut alors associer le contenu à une entité précise, et la citer avec confiance.
Le code minimal pour notre agence ressemble à ce qui suit. C’est exactement ce qu’utilise la page que vous lisez actuellement, à quelques propriétés près.
// Schema Person + Organization avec sameAs Wikidata // Mise en abyme : c'est le schema utilisé par cette page. { "@context": "https://schema.org", "@graph": [ { "@type": "Person", "@id": "https://getknown.fr/#yonel", "name": "Yonel Sasson", "jobTitle": "Fondateur de Getknown", "knowsAbout": ["SEO", "GEO", "Schema Markup"], "worksFor": { "@id": "https://getknown.fr/#org" }, "sameAs": [ "Qxxxxxx", "https://www.linkedin.com/in/yonelsasson/" ] }, { "@type": "Organization", "@id": "https://getknown.fr/#org", "name": "Getknown", "legalName": "GETKNOWN SARL", "founder": { "@id": "https://getknown.fr/#yonel" }, "foundingDate": "2022-06-01", "sameAs": [ "Qxxxxxx", "https://www.linkedin.com/company/getknown-fr/" ] } ] }
Trois détails comptent dans cet exemple. D’abord, les @id stables et réutilisables d’une page à l’autre : #yonel et #org sont définis une fois pour toutes au niveau du domaine, et chaque page peut les référencer sans les redéfinir. Ensuite, la relation croisée worksFor et founder qui ferme le triangle d’entité Person → Organization. Enfin, les sameAs vers Wikidata qui donnent au LLM un pointeur vérifiable et stable.
Pour aller au bout, créez une fiche Wikidata pour votre organisation et pour vos auteurs principaux. C’est gratuit, c’est ouvert, et c’est la base de référence que tous les LLM utilisent en priorité. Si votre marque n’a pas encore de fiche Wikidata, c’est l’un des chantiers GEO les plus structurants — à créer dans les règles (notabilité réelle, sources tierces indépendantes), jamais en forçant une entité non notable.
Comment implémenter le schema markup en 8 étapes.
Méthode opérationnelle, applicable à n’importe quel CMS (WordPress, Shopify, PrestaShop, Webflow) ou site sur-mesure. L’ordre des étapes compte. Sauter la 3 fait perdre les bénéfices GEO de la 5.
Identifier les types de contenu éligibles
Auditer les pages du site et lister celles qui correspondent à un type schema.org reconnu par Google : fiches produits, articles, FAQ, recettes, événements, business local. Une page « à propos » devient une Organization. Une page auteur devient une Person. Une page produit devient un Product.
Sortir un tableau Excel avec une colonne URL, une colonne type schema cible, une colonne priorité (haute, moyenne, basse).
Choisir le format JSON-LD
Préférer JSON-LD aux formats Microdata et RDFa. C’est le format officiellement recommandé par Google pour son découplage du HTML visible et sa simplicité de maintenance. JSON-LD se place dans une balise <script type="application/ld+json"> dans le head ou en fin de body.
Construire le @graph principal du site
Définir une fois pour toutes les entités centrales : Organization (votre marque), Person (vos auteurs principaux), avec leurs sameAs Wikidata, LinkedIn, et un @id stable. Cet objet est inclus sur chaque page comme socle d’identité partagé.
C’est l’étape qui distingue un site qui « a du schema » d’un site qui « est une entité reconnue ». Ne pas la sauter.
Ajouter le schema spécifique à chaque page
Selon le type de page : Article ou BlogPosting pour le contenu éditorial, Product pour les fiches e-commerce, Service pour les pages métier B2B, Event pour les événements, FAQPage pour les questions-réponses, HowTo pour les méthodes pas à pas. Chaque schema spécifique référence le @graph principal via author et publisher.
Synchroniser HTML visible et JSON-LD
Toute donnée déclarée dans le JSON-LD doit être vérifiable dans le HTML visible de la page. Pas de prix dans le schema qui n’apparaît pas à l’écran. Pas de note d’avis dans AggregateRating si les avis ne sont pas affichés. Google et les LLM pénalisent activement le drift entre schema et contenu.
Test rapide : un humain qui lit votre page doit pouvoir cocher un par un tous les attributs déclarés dans le schema.
Inclure BreadcrumbList sur toutes les pages internes
Le BreadcrumbList est un schema universel qui structure la navigation, améliore la lisibilité de la SERP avec un fil d’Ariane visuel, et profite à toutes les pages d’un même site. Le coût d’implémentation est minime, le retour est rapide. À mettre en place dès le premier sprint schema.
Tester avec Rich Results Test puis Schema Validator
Valider chaque type de page avec l’outil Google Rich Results Test pour vérifier l’éligibilité aux résultats enrichis Google, puis avec validator.schema.org pour la conformité générale au vocabulaire schema.org. Les deux outils ne disent pas la même chose. Les deux sont nécessaires.
Surveiller dans Google Search Console
Activer les rapports « Améliorations » de la Search Console pour détecter les erreurs de schema sur l’index réel, et corriger en continu. Une erreur schema bloque l’éligibilité aux résultats enrichis pour la page concernée et signale au crawler une qualité technique dégradée.
Tester son schema : les trois outils qui comptent.
Trois outils gratuits, complémentaires, à utiliser dans cet ordre. Aucun n’est suffisant seul. Aucun ne remplace les deux autres.
Google Rich Results Test
Vérifie l’éligibilité aux résultats enrichis Google. C’est le test qui dit si votre schema déclenchera, ou non, un affichage enrichi dans la SERP. Si Google n’éligibilise pas, aucun rich result ne sortira, même avec un schema parfait au sens schema.org.
search.google.com/test/rich-resultsSchema Markup Validator
Valide la conformité au vocabulaire schema.org. Plus permissif que le Rich Results Test, il accepte tous les types schema.org, y compris ceux que Google n’éligibilise pas pour ses rich results. Outil de référence pour le contrôle qualité général.
validator.schema.orgSearch Console · Améliorations
Le seul outil qui montre les erreurs schema sur l’index réel de votre site, à grande échelle. Les deux outils précédents testent une URL à la fois. La Search Console agrège les erreurs sur le périmètre crawlé, ce qui est indispensable pour les sites supérieurs à 100 pages.
search.google.com/search-consoleLes erreurs schema markup les plus fréquentes.
Six erreurs reviennent dans 80 % des audits que nous menons sur des sites existants, du e-commerce 500 pages au site B2B 50 pages. Aucune n’est compliquée à corriger. Toutes coûtent en visibilité.
Drift entre HTML visible et JSON-LD
Prix dans le schema qui ne correspond pas au prix affiché. Note moyenne déclarée 4.8 alors que la page affiche 4.2. Google détecte le drift et désactive l’affichage enrichi. Les LLM perdent confiance dans la source.
Schemas dupliqués sur la même page
Plusieurs scripts JSON-LD avec un Article répété, ou un Product et un Service pour la même offre. Choisir un type, un seul, et regrouper le reste dans un @graph unique. Pas de doublons.
Person sans qualification
Un Person déclaré uniquement avec un name, sans jobTitle, sans knowsAbout, sans sameAs. Inutile pour le GEO. Le LLM ne peut pas attribuer une expertise à cette entité. Toujours qualifier la personne nommée.
Organization sans sameAs
Schema Organization présent mais sans aucun sameAs vers Wikidata, LinkedIn, ou base de référence. Le LLM ne peut pas vérifier l’entité. C’est l’erreur la plus courante et la plus pénalisante en 2026.
FAQPage avec questions inventées
Une FAQ ajoutée pour le schema mais sans contenu réel correspondant dans la page visible. Google a réduit l’éligibilité FAQPage en 2023 précisément à cause de cette dérive. Une FAQ doit être visible et utile à l’humain d’abord.
BreadcrumbList incohérent avec l’URL
Breadcrumb qui annonce trois niveaux alors que l’URL en montre cinq, ou positions non séquentielles. La validation passe mais Google ignore le rich result. Les positions doivent être 1, 2, 3 sans saut, et chaque item doit pointer vers une URL absolue valide.
Sources externes citées dans ce guide
- Google Search Central — Présentation du balisage de données structurées (documentation officielle). Référence canonique sur les formats acceptés (JSON-LD, Microdata, RDFa) et la recommandation explicite JSON-LD.
- Google Search Central — Galerie des résultats enrichis (Search Gallery). Liste exhaustive des 26 types de rich results actuellement supportés par Google.
- Schema.org — About. Documentation officielle du vocabulaire schema.org, maintenu par Google, Microsoft, Yandex et Yahoo!.
- Schema.org — Getting Started. Guide d’introduction officiel au vocabulaire schema.org.
- Google Rich Results Test. Outil officiel Google pour tester l’éligibilité aux résultats enrichis.
- Schema Markup Validator. Outil officiel schema.org pour valider la conformité au vocabulaire.
- France Num — Guide GEO de février 2026 (référence institutionnelle). Confirmation officielle du rôle des schemas dans la citabilité par les moteurs génératifs.
- Wikidata — Getknown (Qxxxxxx). Fiche d’entité publique de l’organisation, créée mai 2026, utilisée comme sameAs dans le schema Organization de cette page.