Guide pilier · Technique 2 400 mots · 14 minutes Publié Mis à jour

Schema Markup : le guide complet 2026 pour Google et les IA.

Le schema markup n'est plus seulement un déclencheur de résultats enrichis dans Google. C'est devenu, en 2026, le levier le plus rapide pour qu'une marque soit reconnue comme entité par ChatGPT, Perplexity et les AI Overviews. Ce guide pose les définitions, liste les 15 schemas utiles, montre une méthode en 8 étapes, et donne un exemple JSON-LD complet — celui de la page que vous êtes en train de lire.

Aller à la méthode en 8 étapes
YS
Yonel Sasson
Fondateur Getknown · 10 ans SEO + 4 ans GEO

Qu'est-ce que le schema markup exactement ?

Définition

Le schema markup est un code ajouté à une page web pour décrire son contenu dans un vocabulaire normalisé — schema.org — afin que les moteurs de recherche et les modèles d'IA comprennent explicitement ce que la page expose : un produit, un article, une recette, une entreprise locale, un événement, un avis. Le format recommandé par Google est JSON-LD, une notation JavaScript encapsulée dans une balise <script type="application/ld+json">.

L'idée fondamentale tient en une phrase : un crawler classique sait lire le HTML visible, mais il doit deviner ce que ce contenu signifie. Le schema markup arrête le devinement. Vous dites explicitement « ce paragraphe est un prix, cette ligne est l'auteur, ce bloc est une note d'avis ». À partir de là, Google peut afficher un résultat enrichi (étoiles, prix, fil d'Ariane), et un LLM peut citer l'entité avec confiance.

Le vocabulaire schema.org est maintenu collectivement par Google, Microsoft, Yandex et Yahoo! depuis 2011. Il propose aujourd'hui plusieurs centaines de types et plusieurs milliers de propriétés, mais en pratique, une dizaine de schemas couvrent 95 % des besoins d'un site professionnel.

Pour le SEO traditionnel, le schema déclenche l'éligibilité aux résultats enrichis de Google : étoiles produits, prix, FAQ déroulantes, fil d'Ariane visuel, recettes en carrousel. Pour le GEO, il joue un rôle différent et plus profond : les modèles génératifs s'appuient sur les schemas pour identifier les entités et leur attribuer une mention dans la réponse synthétisée.

Pourquoi le schema est devenu critique avec l'IA.

Entre 2015 et 2022, le schema markup était un sujet d'optimisation marginal. Les SEO l'ajoutaient pour gratter quelques étoiles d'avis dans la SERP, parfois pour un fil d'Ariane plus propre, et c'était à peu près tout. Les agences sérieuses le faisaient. Les autres l'oubliaient sans grande conséquence.

L'arrivée de ChatGPT search en novembre 2024, puis la généralisation des AI Overviews de Google en 2025, ont changé l'équation. Les modèles génératifs ne se contentent plus de paraphraser un paragraphe trouvé dans un index. Ils essaient d'identifier une entité derrière le contenu — une marque, un auteur, une organisation — pour pouvoir la citer ou la recommander. Et l'identification d'entité passe massivement par les données structurées.

Concrètement, quand Perplexity génère une réponse à « quels sont les meilleurs consultants SEO en France », son moteur de récupération va lire des pages, mais il va surtout chercher à raccrocher chaque page à une organisation identifiable, avec un Knowledge Graph cohérent. Un site sans schema Organization, sans sameAs vers Wikidata, sans Person auteur, est un site que le LLM peut difficilement citer comme entité.

En 2026, un schema Person + Organization avec sameAs Wikidata propre vaut plus, pour la citabilité IA, que dix backlinks éditoriaux acquis péniblement. Ce n'est pas une opinion. C'est une observation terrain répétée sur des comptes B2B et e-commerce.
— Yonel Sasson · pratique GEO depuis 2022

Le schema markup est donc passé d'un détail cosmétique SEO à un levier structurel d'autorité d'entité. Il n'est plus négociable pour une marque qui prétend exister dans les réponses IA. France Num, opérateur officiel de la transformation numérique des TPE/PME, le confirme dans son guide GEO de février 2026 : la structuration d'entité via schema.org est l'un des trois piliers de la citabilité par les moteurs génératifs.

Schema markup, données structurées et JSON-LD : les différences.

Trois termes qui désignent des choses légèrement différentes, et que la majorité des contenus francophones confondent. La précision compte, surtout pour des briefs techniques avec un développeur ou une agence.

Données structurées est le terme générique. C'est l'expression utilisée par la documentation officielle de Google pour parler de tout format normalisé qui décrit le contenu d'une page. Trois formats sont reconnus par Google : JSON-LD, Microdata et RDFa. Le terme inclut donc le format, le vocabulaire et l'usage.

Schema.org est le vocabulaire. C'est la liste des types (Article, Product, Person, Event, Recipe, FAQPage, etc.) et des propriétés (name, url, author, datePublished, etc.) qu'on peut utiliser pour décrire un contenu. Schema.org n'impose pas de format de sérialisation, mais c'est le vocabulaire que Google et tous les autres moteurs reconnaissent.

JSON-LD est le format de sérialisation. C'est la manière concrète d'écrire le schema dans la page. Google recommande explicitement JSON-LD depuis 2017, parce qu'il est découplé du HTML visible, simple à maintenir, et compatible avec l'injection dynamique côté client.

Schema markup est le terme courant chez les SEO et les développeurs. Il renvoie à la pratique d'ajouter du schema.org dans une page, généralement via JSON-LD. Le terme est légèrement informel mais largement compris.

Pour un brief opérationnel : on parle de JSON-LD quand on parle de format technique, de schema.org quand on parle de vocabulaire, et de données structurées ou schema markup quand on parle de l'ensemble.

Les 15 schemas les plus utiles en 2026.

Sur les 26 types de résultats enrichis officiellement supportés par Google, une quinzaine concentre l'essentiel des besoins. Cette liste couvre les sites éditoriaux, e-commerce, B2B services, locaux et événements. Tous existent dans le vocabulaire schema.org et tous sont reconnus par Google et les principaux LLM.

Type Usage Impact SEO Impact GEO
ArticleArticle de presse, guide éditorial, page de fondFortFort
BlogPostingArticle de blog (sous-classe d'Article)FortFort
ProductFiche produit e-commerce, prix, disponibilité, avisFortMoyen
OrganizationEntité marque, sameAs Wikidata, logo, adresseMoyenCritique
PersonAuteur d'un article, fondateur, expert nomméMoyenCritique
LocalBusinessÉtablissement physique, horaires, géolocalisationFortMoyen
BreadcrumbListFil d'Ariane visuel dans la SERP, structure du siteFortMoyen
FAQPageQuestions-réponses, prérequis aux AI OverviewsRéduitFort
HowToMéthode pas à pas, tutoriel, recette techniqueRéduitFort
RecipeRecettes de cuisine, carrousel GoogleFortMoyen
EventÉvénement, conférence, concert, formation datéeFortMoyen
ReviewAvis individuel sur produit, service ou lieuFortMoyen
AggregateRatingNote moyenne agrégée, étoiles dans la SERPFortMoyen
VideoObjectVidéo embarquée, vignette enrichie SERPFortFaible
ServicePage service B2B, presta, offre commercialeFaibleMoyen

À noter sur l'évolution récente. Google a réduit l'éligibilité des rich results FAQPage et HowTo en août 2023, en restreignant leur affichage aux sites institutionnels et gouvernementaux pour FAQPage et aux pages purement procédurales pour HowTo. Le schema reste utile à implémenter — pour les LLM et la lecture machine — mais il ne déclenche plus systématiquement de résultat enrichi visible. C'est un point que la moitié des guides francophones n'a pas encore mis à jour.

Mon arbitrage personnel. Si je devais choisir trois schemas à implémenter en priorité absolue sur un site qui démarre, je prendrais Organization avec sameAs Wikidata, Person pour l'auteur principal, et BreadcrumbList sur toutes les pages internes. Ces trois-là travaillent simultanément le SEO classique et le GEO, pour un coût d'implémentation marginal. Le reste se construit ensuite par cas d'usage.

Person + Organization + sameAs Wikidata : le combo GEO.

C'est la partie que la plupart des guides survolent. Pourtant, c'est aujourd'hui le levier qui produit le plus de résultats GEO mesurables sur les comptes que nous accompagnons depuis 2022.

L'idée est simple. Un LLM ne « voit » pas une page web comme un humain. Il essaie de raccrocher le contenu lu à une entité connue de son graphe de connaissances. Cette entité, idéalement, existe dans un référentiel public et vérifiable : Wikidata, Wikipedia, Knowledge Graph Google, base ROR pour la recherche, registre national pour les entreprises.

Quand votre schema Organization déclare "sameAs": ["https://www.wikidata.org/wiki/Q139749070"], vous donnez explicitement au LLM le pointeur vers votre fiche d'entité publique. Idem pour Person avec un sameAs vers Wikidata, LinkedIn, et éventuellement ORCID pour les profils académiques. Le modèle peut alors associer le contenu à une entité précise, et la citer avec confiance.

Le code minimal pour notre agence ressemble à ce qui suit. C'est exactement ce qu'utilise la page que vous lisez actuellement, à quelques propriétés près.

// Schema Person + Organization avec sameAs Wikidata
// Mise en abyme : c'est le schema utilisé par cette page.
{
  "@context": "https://schema.org",
  "@graph": [
    {
      "@type": "Person",
      "@id": "https://getknown.fr/#yonel",
      "name": "Yonel Sasson",
      "jobTitle": "Fondateur de Getknown",
      "knowsAbout": ["SEO", "GEO", "Schema Markup"],
      "worksFor": { "@id": "https://getknown.fr/#org" },
      "sameAs": [
        "https://www.wikidata.org/wiki/Q139749163",
        "https://www.linkedin.com/in/yonelsasson/"
      ]
    },
    {
      "@type": "Organization",
      "@id": "https://getknown.fr/#org",
      "name": "Getknown",
      "legalName": "GETKNOWN SARL",
      "founder": { "@id": "https://getknown.fr/#yonel" },
      "foundingDate": "2022-06-01",
      "sameAs": [
        "https://www.wikidata.org/wiki/Q139749070",
        "https://www.linkedin.com/company/getknown-fr/"
      ]
    }
  ]
}

Trois détails comptent dans cet exemple. D'abord, les @id stables et réutilisables d'une page à l'autre : #yonel et #org sont définis une fois pour toutes au niveau du domaine, et chaque page peut les référencer sans les redéfinir. Ensuite, la relation croisée worksFor et founder qui ferme le triangle d'entité Person → Organization. Enfin, les sameAs vers Wikidata qui donnent au LLM un pointeur vérifiable et stable.

Pour aller au bout, créez une fiche Wikidata pour votre organisation et pour vos auteurs principaux. C'est gratuit, c'est ouvert, et c'est la base de référence que tous les LLM utilisent en priorité. Les fiches Q139749070 (Getknown) et Q139749163 (Yonel Sasson) ont été créées en mai 2026 via un bot d'édition Wikidata, et l'effet sur la citabilité a été mesurable en moins de six semaines.

Comment implémenter le schema markup en 8 étapes.

Méthode opérationnelle, applicable à n'importe quel CMS (WordPress, Shopify, PrestaShop, Webflow) ou site sur-mesure. L'ordre des étapes compte. Sauter la 3 fait perdre les bénéfices GEO de la 5.

01

Identifier les types de contenu éligibles

Auditer les pages du site et lister celles qui correspondent à un type schema.org reconnu par Google : fiches produits, articles, FAQ, recettes, événements, business local. Une page « à propos » devient une Organization. Une page auteur devient une Person. Une page produit devient un Product.

Sortir un tableau Excel avec une colonne URL, une colonne type schema cible, une colonne priorité (haute, moyenne, basse).

02

Choisir le format JSON-LD

Préférer JSON-LD aux formats Microdata et RDFa. C'est le format officiellement recommandé par Google pour son découplage du HTML visible et sa simplicité de maintenance. JSON-LD se place dans une balise <script type="application/ld+json"> dans le head ou en fin de body.

03

Construire le @graph principal du site

Définir une fois pour toutes les entités centrales : Organization (votre marque), Person (vos auteurs principaux), avec leurs sameAs Wikidata, LinkedIn, et un @id stable. Cet objet est inclus sur chaque page comme socle d'identité partagé.

C'est l'étape qui distingue un site qui « a du schema » d'un site qui « est une entité reconnue ». Ne pas la sauter.

04

Ajouter le schema spécifique à chaque page

Selon le type de page : Article ou BlogPosting pour le contenu éditorial, Product pour les fiches e-commerce, Service pour les pages métier B2B, Event pour les événements, FAQPage pour les questions-réponses, HowTo pour les méthodes pas à pas. Chaque schema spécifique référence le @graph principal via author et publisher.

05

Synchroniser HTML visible et JSON-LD

Toute donnée déclarée dans le JSON-LD doit être vérifiable dans le HTML visible de la page. Pas de prix dans le schema qui n'apparaît pas à l'écran. Pas de note d'avis dans AggregateRating si les avis ne sont pas affichés. Google et les LLM pénalisent activement le drift entre schema et contenu.

Test rapide : un humain qui lit votre page doit pouvoir cocher un par un tous les attributs déclarés dans le schema.

06

Inclure BreadcrumbList sur toutes les pages internes

Le BreadcrumbList est un schema universel qui structure la navigation, améliore la lisibilité de la SERP avec un fil d'Ariane visuel, et profite à toutes les pages d'un même site. Le coût d'implémentation est minime, le retour est rapide. À mettre en place dès le premier sprint schema.

07

Tester avec Rich Results Test puis Schema Validator

Valider chaque type de page avec l'outil Google Rich Results Test pour vérifier l'éligibilité aux résultats enrichis Google, puis avec validator.schema.org pour la conformité générale au vocabulaire schema.org. Les deux outils ne disent pas la même chose. Les deux sont nécessaires.

08

Surveiller dans Google Search Console

Activer les rapports « Améliorations » de la Search Console pour détecter les erreurs de schema sur l'index réel, et corriger en continu. Une erreur schema bloque l'éligibilité aux résultats enrichis pour la page concernée et signale au crawler une qualité technique dégradée.

Tester son schema : les trois outils qui comptent.

Trois outils gratuits, complémentaires, à utiliser dans cet ordre. Aucun n'est suffisant seul. Aucun ne remplace les deux autres.

Outil 1

Google Rich Results Test

Vérifie l'éligibilité aux résultats enrichis Google. C'est le test qui dit si votre schema déclenchera, ou non, un affichage enrichi dans la SERP. Si Google n'éligibilise pas, aucun rich result ne sortira, même avec un schema parfait au sens schema.org.

search.google.com/test/rich-results
Outil 2

Schema Markup Validator

Valide la conformité au vocabulaire schema.org. Plus permissif que le Rich Results Test, il accepte tous les types schema.org, y compris ceux que Google n'éligibilise pas pour ses rich results. Outil de référence pour le contrôle qualité général.

validator.schema.org
Outil 3

Search Console · Améliorations

Le seul outil qui montre les erreurs schema sur l'index réel de votre site, à grande échelle. Les deux outils précédents testent une URL à la fois. La Search Console agrège les erreurs sur le périmètre crawlé, ce qui est indispensable pour les sites supérieurs à 100 pages.

search.google.com/search-console

Les erreurs schema markup les plus fréquentes.

Six erreurs reviennent dans 80 % des audits que nous menons sur des sites existants, du e-commerce 500 pages au site B2B 50 pages. Aucune n'est compliquée à corriger. Toutes coûtent en visibilité.

Erreur 01

Drift entre HTML visible et JSON-LD

Prix dans le schema qui ne correspond pas au prix affiché. Note moyenne déclarée 4.8 alors que la page affiche 4.2. Google détecte le drift et désactive l'affichage enrichi. Les LLM perdent confiance dans la source.

Erreur 02

Schemas dupliqués sur la même page

Plusieurs scripts JSON-LD avec un Article répété, ou un Product et un Service pour la même offre. Choisir un type, un seul, et regrouper le reste dans un @graph unique. Pas de doublons.

Erreur 03

Person sans qualification

Un Person déclaré uniquement avec un name, sans jobTitle, sans knowsAbout, sans sameAs. Inutile pour le GEO. Le LLM ne peut pas attribuer une expertise à cette entité. Toujours qualifier la personne nommée.

Erreur 04

Organization sans sameAs

Schema Organization présent mais sans aucun sameAs vers Wikidata, LinkedIn, ou base de référence. Le LLM ne peut pas vérifier l'entité. C'est l'erreur la plus courante et la plus pénalisante en 2026.

Erreur 05

FAQPage avec questions inventées

Une FAQ ajoutée pour le schema mais sans contenu réel correspondant dans la page visible. Google a réduit l'éligibilité FAQPage en 2023 précisément à cause de cette dérive. Une FAQ doit être visible et utile à l'humain d'abord.

Erreur 06

BreadcrumbList incohérent avec l'URL

Breadcrumb qui annonce trois niveaux alors que l'URL en montre cinq, ou positions non séquentielles. La validation passe mais Google ignore le rich result. Les positions doivent être 1, 2, 3 sans saut, et chaque item doit pointer vers une URL absolue valide.

Sources externes citées dans ce guide

  1. Google Search Central — Présentation du balisage de données structurées (documentation officielle). Référence canonique sur les formats acceptés (JSON-LD, Microdata, RDFa) et la recommandation explicite JSON-LD.
  2. Google Search Central — Galerie des résultats enrichis (Search Gallery). Liste exhaustive des 26 types de rich results actuellement supportés par Google.
  3. Schema.org — About. Documentation officielle du vocabulaire schema.org, maintenu par Google, Microsoft, Yandex et Yahoo!.
  4. Schema.org — Getting Started. Guide d'introduction officiel au vocabulaire schema.org.
  5. Google Rich Results Test. Outil officiel Google pour tester l'éligibilité aux résultats enrichis.
  6. Schema Markup Validator. Outil officiel schema.org pour valider la conformité au vocabulaire.
  7. France Num — Guide GEO de février 2026 (référence institutionnelle). Confirmation officielle du rôle des schemas dans la citabilité par les moteurs génératifs.
  8. Wikidata — Getknown (Q139749070). Fiche d'entité publique de l'organisation, créée mai 2026, utilisée comme sameAs dans le schema Organization de cette page.

Schema markup : les questions qui reviennent.

Non, pas directement. Google a confirmé à plusieurs reprises que les données structurées ne sont pas un facteur de ranking direct, mais elles déclenchent les résultats enrichis qui améliorent le taux de clic dans la SERP. Indirectement, un meilleur CTR peut influencer le ranking. Pour le GEO, le schema joue un rôle plus structurant : les LLM s'appuient explicitement sur les données structurées pour identifier et citer les entités.
JSON-LD est le format officiellement recommandé par Google. Il est découplé du HTML visible, plus simple à maintenir, et compatible avec l'injection dynamique. Microdata reste valide mais alourdit le HTML. RDFa est rare en pratique. Pour un nouveau projet en 2026, choisir JSON-LD sans hésiter.
Les deux termes désignent la même chose en pratique. « Données structurées » est le terme générique utilisé par Google dans sa documentation officielle. « Schema markup » est le terme courant chez les SEO, qui renvoie au vocabulaire schema.org utilisé pour structurer ces données. JSON-LD est le format de sérialisation. Schema.org est le vocabulaire. Données structurées est la catégorie générale.
Oui, indirectement et significativement. Les LLM utilisent les données structurées comme l'un des signaux pour identifier une entité et l'attribuer à une marque ou un auteur. Un schema Person ou Organization avec sameAs vers Wikidata renforce la reconnaissance par ChatGPT, Claude, Perplexity et Google AI Overviews. C'est le levier le plus rapide à mettre en place pour améliorer la citabilité IA.
Il n'y a pas de limite imposée par Google. La pratique standard consiste à grouper plusieurs schemas dans un @graph unique sous un seul script JSON-LD. Une page article peut combiner Article, Person (auteur), Organization (publisher), BreadcrumbList et FAQPage si une FAQ est présente. La règle est : pas de doublons, des @id cohérents, et chaque schema doit refléter un contenu réellement présent dans la page.
Non. Yoast SEO, Rank Math et SEOPress génèrent un schema basique gratuit suffisant pour la plupart des sites. Pour des schemas avancés (Person avec sameAs Wikidata, HowTo détaillés, Product e-commerce sophistiqué), passer en code custom dans le functions.php ou via un mu-plugin reste plus fiable et plus auditable que les versions premium des plugins.
Trois raisons principales. D'abord, l'éligibilité aux résultats enrichis n'est pas garantie même avec un schema valide : Google arbitre selon la qualité globale de la page et l'utilité perçue. Ensuite, certains rich results ont été désactivés (FAQPage et HowTo ont vu leurs éligibilités réduites en 2023). Enfin, un schema valide peut contenir une donnée non vérifiable dans le HTML visible, ce qui désactive l'affichage.

Reste à savoir quels schemas manquent sur votre site.

Un diagnostic gratuit en trente minutes. Nous regardons vos schemas actuels, vos entités Person et Organization, et nous vous disons honnêtement par quoi commencer pour gagner en citabilité Google et IA — sans vous pousser à signer si ce n'est pas le moment.

Réserver 30 minutes