Guide expert · Entité GEO 1 850 mots · 12 minutes Publié Mis à jour

Wikidata et entités sémantiques : le levier sous-estimé du SEO et du GEO.

Wikidata est devenue, en silence, l'une des couches d'identité les plus consultées du web par Google et les LLM. Ce guide pose la définition, clarifie la relation avec Wikipedia et le Knowledge Graph Google, donne une méthode en 8 étapes pour créer une fiche éligible, et démontre la mise en pratique de l'entité sémantique avec les Q-items Q139749070 (Getknown) et Q139749163 (Yonel Sasson) — les fiches utilisées en sameAs dans le schema de cette page même.

Aller à la méthode HowTo en 8 étapes
YS
Yonel Sasson
Fondateur Getknown · pratique d'édition Wikidata depuis 2024

Qu'est-ce que Wikidata exactement ?

Définition

Wikidata est une base de données structurée libre, collaborative et multilingue, opérée par la Wikimedia Foundation depuis 2012. Elle stocke des éléments — appelés Q-items — reliés par des propriétés P-properties et des valeurs. Cette base alimente Wikipedia, Wikimedia Commons, le Knowledge Graph Google et la quasi-totalité des LLM contemporains.

Concrètement, là où Wikipedia raconte « Yonel Sasson est un consultant SEO français » dans une phrase, le graphe l'écrit comme un triplet : Q139749163 (l'identifiant unique), avec une propriété P31 (instance of) pointant vers Q5 (être humain), une propriété P106 (occupation) pointant vers Q1438937 (consultant SEO), et une propriété P108 (employer) pointant vers Q139749070 (Getknown). C'est une entité sémantique au sens strict : aucune ambiguïté possible, aucune homonymie, aucune approximation linguistique.

L'unité de base est le triplet : sujet — propriété — valeur. C'est exactement le format que les modèles de langage et les graphes de connaissances exploitent le plus efficacement. Là où un crawler classique doit deviner le sens d'un texte, un consommateur du graphe reçoit déjà une donnée typée, sourcée et désambiguïsée.

La base compte aujourd'hui plus de cent millions d'éléments et plus de douze mille propriétés différentes. Cette densité explique pourquoi les LLM s'appuient massivement dessus dès qu'il s'agit de répondre à une question factuelle sur une entité sémantique — personne, organisation, lieu, œuvre — plutôt que sur un concept ouvert.

Wikidata, Wikipedia et Knowledge Graph Google : quelles relations ?

La confusion entre ces trois objets est massive, y compris dans des briefs SEO produits par des agences sérieuses. Pourtant, ce sont trois choses différentes, qui se nourrissent mutuellement mais n'obéissent pas aux mêmes règles.

Wikipedia est une encyclopédie textuelle. Chaque article est un texte écrit par des contributeurs, organisé en sections, illustré, sourcé. La granularité est l'article. La règle d'admission est la notoriété encyclopédique, qui exclut la majorité des entreprises et des professionnels.

Wikidata est une base de données structurée. Chaque élément est un graphe de propriétés-valeurs, sans rédactionnel. La granularité est l'entité sémantique. La règle d'admission est l'éligibilité aux trois critères de notabilité, plus large que celle de Wikipedia : un sitelink vers un autre projet Wikimedia, une entité clairement identifiable décrite par des sources publiques, ou un besoin structurel pour rendre d'autres déclarations utiles.

Knowledge Graph Google est une base de données privée, propriétaire, qui consomme cette base ouverte, Wikipedia, Google My Business, et de nombreuses autres sources. Elle alimente les Knowledge Panels affichés à droite de la SERP, les AI Overviews, et la désambiguïsation d'entité dans le moteur. Aucun accès direct, aucun statut consultable publiquement, mais une part substantielle de son contenu provient du graphe Wikimedia depuis l'arrêt de Freebase en 2014.

Critère Wikidata Wikipedia Knowledge Graph Google
FormatDonnées structurées (Q-items + P-properties)Textes encyclopédiquesBase privée propriétaire
OpérateurWikimedia FoundationWikimedia FoundationGoogle LLC
Lancement201220012012
AccessibilitéOuvert, libre, machine-readableOuvert, libre, lisible humainementPrivé, partiellement exposé via SERP
Critère d'admission3 critères de notabilité (souples)Notoriété encyclopédique stricteDécision algorithmique opaque
MultilingueNativement, une fois pour toutesArticle par langue à rédigerMultilingue selon Google
Consommé parWikipedia, Google KG, LLM, agrégateursLecteurs humains, Google, LLMSERP Google, AI Overviews
ModifiableOui, par tout compteOui, par tout compteNon directement

Le bon mental model est le suivant. La base Wikimedia est la couche structurée. Wikipedia est la couche narrative. Knowledge Graph Google est la couche d'affichage propriétaire qui consomme les deux. Un travail SEO/GEO sérieux sur l'entité sémantique commence par la couche structurée, parce que c'est la seule des trois où l'on peut intervenir directement et de manière vérifiable.

Pourquoi Wikidata est devenu critique pour le SEO et le GEO.

Pendant la décennie 2012-2022, le projet Wikidata était un outil pour bibliothécaires et data-scientists. Les SEO le connaissaient de loin, l'évoquaient dans des conférences sur le « semantic SEO », mais l'intégraient peu en mission. Aucun client n'a jamais signé un brief SEO sur la base d'une fiche d'entité.

L'arrivée de ChatGPT search en novembre 2024, la généralisation des AI Overviews de Google en 2025, et la montée de Perplexity comme moteur de réponse ont changé la nature du problème. Les modèles génératifs ne se contentent plus d'afficher des liens. Ils citent des entités sémantiques. Et pour citer une entité, ils doivent la reconnaître avec confiance.

En 2026, créer une fiche d'entité propre pour une marque B2B coûte une demi-journée d'édition et produit plus de citabilité IA que six mois de netlinking. Ce n'est pas une opinion marketing. C'est ce qu'on observe sur les comptes que nous accompagnons depuis 2022.
— Yonel Sasson · pratique GEO

Trois raisons structurelles expliquent ce basculement. D'abord, la base est publique, gratuite et machine-readable, donc consommable sans friction par les pipelines d'entraînement et de retrieval des LLM. Ensuite, son format en triplets correspond exactement à ce que les graphes de connaissances internes des modèles savent indexer. Enfin, la barrière à l'entrée est plus basse que pour Wikipedia, ce qui permet à des entités professionnelles de niche d'exister là où elles n'auraient jamais eu d'article encyclopédique.

Le résultat opérationnel : pour une marque qui ne peut pas avoir Wikipedia mais qui veut être citée par les LLM, c'est aujourd'hui le seul levier d'identité publique vraiment actionnable. Pas le seul levier GEO — il y a aussi le schema.org, le llms.txt, la structure des contenus — mais le plus dense en signaux d'entité par unité d'effort.

Comment Google et les LLM utilisent Wikidata.

Le détail technique compte ici, parce qu'il conditionne la manière de construire une fiche utile plutôt qu'une fiche cosmétique.

Google a documenté l'usage de cette base par son Knowledge Graph dans la documentation officielle de la Knowledge Graph Search API. Le graphe propriétaire s'appuie dessus pour les Knowledge Panels, la désambiguïsation d'entité dans le moteur (savoir si « Apple » désigne le fruit, l'entreprise ou les Beatles), et les AI Overviews. Concrètement, lorsqu'une fiche est suffisamment dense, sourcée, et connectée à un sitelink Wikipedia, elle a une probabilité non nulle de déclencher un Knowledge Panel pour la marque.

Les LLM consomment ce graphe ouvert par deux canaux. D'abord à l'entraînement : tous les modèles publics majeurs (GPT, Claude, Gemini, Llama, Mistral) ont ingéré des dumps complets dans leur corpus. Ensuite au retrieval : les moteurs de réponse comme Perplexity, ChatGPT search ou Google AI Overviews font des appels en temps réel pour vérifier des faits, et c'est l'une des sources les plus dense en données vérifiables et structurées disponibles librement.

Le format SPARQL permet d'interroger le graphe directement et explique pourquoi les LLM le trouvent si pratique. Une requête comme la suivante renvoie en quelques millisecondes la liste de toutes les organisations dont Yonel Sasson est fondateur, ou tous les fondateurs d'agence créée après 2020 en Île-de-France.

# Toutes les organisations dont Yonel Sasson est fondateur
# Endpoint : https://query.wikidata.org/
SELECT ?org ?orgLabel ?foundingDate WHERE {
  ?org wdt:P112 wd:Q139749163 .
  OPTIONAL { ?org wdt:P571 ?foundingDate . }
  SERVICE wikibase:label {
    bd:serviceParam wikibase:language "fr,en" .
  }
}

Ce niveau d'interrogation explique pourquoi un LLM préfère citer une entité sémantique bien construite plutôt qu'une page web textuelle équivalente. Le coût cognitif de l'extraction d'information est dix fois plus faible. La probabilité d'erreur factuelle est plus basse. Et l'entité est déjà désambiguïsée par son Q-id.

Conséquence pratique. Si vous voulez qu'un LLM cite votre marque par son nom dans une réponse à une question commerciale, votre Q-item est l'un des trois ou quatre signaux qu'il consultera en priorité, avec votre site officiel et vos profils LinkedIn. Sans cette fiche, vous reposez entièrement sur le crawl HTML, qui est plus coûteux et moins fiable pour identifier une entité.

Créer une fiche Wikidata en 8 étapes.

Méthode opérationnelle, applicable à une organisation ou à une personne. L'ordre des étapes compte. Sauter la 1 fait perdre la fiche en suppression communautaire. Sauter la 7 la fait dégrader par les patrouilleurs.

01

Vérifier l'éligibilité aux trois critères de notabilité

La base accepte un élément si l'un de ces trois critères est rempli : (1) il existe un sitelink vers une page Wikipedia, Wikimedia Commons ou autre wiki Wikimedia ; (2) l'entité est clairement identifiable et décrite par des sources publiques sérieuses ; (3) l'élément remplit un besoin structurel pour rendre d'autres déclarations plus utiles.

Pour une PME française sans article Wikipedia, le critère (2) est le plus pertinent : démontrer une couverture presse, un registre légal vérifiable, ou une présence sur des bases de référence reconnues.

02

Créer un compte et déclarer son conflit d'intérêts

Inscription gratuite sur wikidata.org. Si vous éditez la fiche de votre propre organisation ou de votre propre marque employeuse, déclarer le conflit d'intérêts sur votre page utilisateur. La communauté exige cette transparence et sanctionne les éditions occultes par blocage du compte.

La page utilisateur peut être très courte : « Je suis fondateur de [marque], j'édite la fiche Q[xxx] en déclarant ce conflit d'intérêts. » Cette transparence vous protège plus qu'elle ne vous expose.

03

Vérifier l'absence de doublon

Avant toute création, rechercher dans la base si un élément existe déjà pour l'entité visée. Tester plusieurs variantes de nommage, en français et en anglais. Un doublon sera fusionné ou supprimé, et son créateur risque un avertissement communautaire.

04

Créer l'élément, le label, la description et les alias

Cliquer sur « Créer un nouvel élément ». Renseigner le label en français et en anglais (le nom canonique), une description courte de 15 à 25 caractères qui désambiguïse (par exemple « agence SEO française »), et les alias (acronymes, raisons sociales, anciens noms commerciaux).

Ne jamais inclure le label dans la description. C'est l'erreur la plus fréquente des nouvelles fiches.

05

Ajouter les propriétés structurantes (P31, P17, P571)

Pour une organisation, déclarer P31 (instance of) avec la valeur appropriée — Q4830453 pour une entreprise, Q15265344 pour une agence —, P17 (country) avec le pays de domiciliation, et P571 (date de création).

Pour une personne, déclarer P31=Q5 (humain), P21 (sexe ou genre), P106 (occupation), P108 (employer) si pertinent. Ces propriétés sont le socle minimal qu'un LLM lit pour catégoriser l'entité.

06

Connecter l'écosystème via sameAs et identifiants externes

Ajouter les propriétés d'identifiants externes : P856 (site officiel), P4264 (LinkedIn), P1320 (OpenCorporates), P10832 (X/Twitter). Pour une entreprise française, P3215 (numéro SIREN). Chaque identifiant agit comme un sameAs implicite et renforce la triangulation d'identité.

07

Sourcer chaque déclaration avec une référence externe vérifiable

Cliquer sur « Ajouter une référence » pour chaque déclaration. Utiliser des sources publiques stables : site officiel, registre officiel (l'Annuaire des Entreprises de l'État pour les SIREN français), couverture presse, base institutionnelle. Les déclarations sans source sont supprimées par les patrouilleurs communautaires.

08

Déclarer le sameAs sur son propre site

Ajouter dans le schema Organization de votre site web la propriété sameAs pointant vers l'URL de votre Q-item. Cette boucle ferme le triangle d'identité site → fiche publique → site et permet aux LLM et au Knowledge Graph Google de raccrocher votre site à votre entité sémantique publique sans ambiguïté.

sameAs et triangulation d'identité : Wikidata + LinkedIn + site officiel.

Le concept de triangulation d'identité est ce qui sépare une fiche cosmétique d'une fiche qui produit du résultat GEO. L'idée est de fermer toutes les boucles entre les trois ancrages publics d'une marque, pour qu'un LLM ou un crawler puisse vérifier l'entité sémantique par n'importe quel point d'entrée.

Concrètement, trois objets doivent se citer mutuellement :

  • Le site officiel déclare dans son schema Organization un sameAs vers le Q-item (URL Wikidata) et un sameAs vers LinkedIn (URL de la company page).
  • La fiche publique déclare via P856 l'URL du site officiel et via P4264 l'identifiant LinkedIn de l'organisation.
  • LinkedIn déclare l'URL du site officiel dans le champ « Site web » de la company page.

Le code minimal côté schema HTML, qui est exactement celui utilisé dans cette page que vous lisez, ressemble à ce qui suit. Notez les sameAs vers Q139749070 et Q139749163.

// Schema Organization + Person avec sameAs Wikidata
// Triangulation d'identité fermée à trois points.
{
  "@context": "https://schema.org",
  "@type": "Organization",
  "name": "Getknown",
  "founder": { "@id": "#yonel" },
  "sameAs": [
    "https://www.wikidata.org/wiki/Q139749070",
    "https://www.linkedin.com/company/getknown-fr/"
  ]
}

Sans cette triangulation, le LLM doit faire de l'entity disambiguation à partir de signaux faibles : le nom de domaine, la cohérence du contenu, des co-mentions externes. C'est possible mais coûteux et faillible. Avec la triangulation, l'entité sémantique est verrouillée et toute citation devient vérifiable en une requête.

L'erreur classique est de déclarer un sameAs côté site sans avoir déclaré le site officiel côté fiche publique. La boucle reste ouverte, et le signal perd la moitié de sa force. Toujours fermer la boucle dans les deux sens.

Cas concret : nos propres entités Getknown et Yonel Sasson.

Le meilleur moyen de démontrer la méthode est de l'appliquer sur soi-même. Les deux fiches d'entité ci-dessous ont été créées en mai 2026 via un bot d'édition déclaré, après avoir vérifié les trois critères de notabilité et avoir déclaré le conflit d'intérêts sur la page utilisateur. Ce sont les Q-items utilisés en sameAs dans le schema de la page que vous lisez actuellement.

Organisation
Q139749070

Getknown

Agence SEO/GEO française, fondée en juin 2022, domiciliée à Levallois-Perret (Hauts-de-Seine).

  • P31 (instance of) → agence SEO
  • P17 (country) → France
  • P571 (foundation date) → 2022-06-01
  • P112 (founder) → Yonel Sasson
  • P3215 (SIREN) → 914325790
  • P856 (official website) → getknown.fr
wikidata.org/wiki/Q139749070
Personne
Q139749163

Yonel Sasson

Consultant SEO depuis 2014, spécialiste GEO depuis 2022, fondateur de Getknown.

  • P31 (instance of) → être humain (Q5)
  • P106 (occupation) → consultant SEO
  • P108 (employer) → Getknown (Q139749070)
  • P4264 (LinkedIn) → yonelsasson
  • P101 (field of work) → SEO, GEO
wikidata.org/wiki/Q139749163

Le triangle d'identité est fermé à trois points. La fiche Q139749163 (Yonel Sasson) déclare P108=Q139749070 (employer Getknown). La fiche Q139749070 (Getknown) déclare P112=Q139749163 (founder Yonel Sasson). Et le schema HTML de chaque page de getknown.fr déclare un sameAs vers les deux Q-items. Le LLM peut donc raccrocher n'importe quel contenu de notre site à l'entité sémantique correspondante, sans ambiguïté possible.

Effet observé en pratique : sur les requêtes ChatGPT, Perplexity et Claude où la question contient « consultant SEO Paris » ou « agence GEO France », la mention nominative de la marque a augmenté nettement dans les six semaines suivant la mise en place du triangle. Le contenu éditorial du site n'avait pas changé pendant cette période. Seule la couche d'identité l'avait été.

L'investissement en temps a été d'environ trois heures pour les deux fiches, plus deux heures de patrouille communautaire pour répondre aux questions des modérateurs. Cinq heures au total pour fermer un triangle d'identité publique. C'est probablement le meilleur ratio effort/impact disponible aujourd'hui sur le levier GEO.

Les erreurs Wikidata les plus fréquentes.

Six erreurs reviennent dans la majorité des fiches d'organisation B2B créées sans expérience préalable. Aucune n'est compliquée à corriger. Toutes coûtent en visibilité et en autorité d'entité sémantique.

Erreur 01

Édition occulte sans déclaration de conflit d'intérêts

Créer la fiche de sa propre organisation depuis un compte sans avoir déclaré le lien sur la page utilisateur. Sanctionné par blocage du compte et marquage de la fiche pour suppression. La transparence préalable est gratuite et protectrice.

Erreur 02

Déclarations sans source vérifiable

Renseigner P571 (date de création), P159 (siège), P3215 (SIREN) sans cliquer sur « Ajouter une référence ». Les patrouilleurs retirent ces déclarations dans les semaines qui suivent. La fiche se vide silencieusement.

Erreur 03

Fiche orpheline sans aucune connexion entrante

Aucune autre fiche ne pointe vers le Q-item créé. Pas de fondateur lié, pas de filiale, pas de membre nommé. Le graphe est isolé. Google ne le voit pas. À la création, toujours connecter au moins une fiche existante (fondateur, partenaire, écosystème).

Erreur 04

P31 incorrect ou trop générique

Déclarer P31 (instance of) avec une valeur trop large comme « entreprise » au lieu d'« agence SEO » ou « ESN ». Le LLM ne peut pas typer correctement l'entité. Choisir la sous-classe la plus précise existante dans Wikidata.

Erreur 05

sameAs déclaré côté site mais pas côté fiche publique

Le site déclare un sameAs vers le Q-item, mais la fiche ne déclare pas P856 vers le site. La boucle est ouverte. Le signal de triangulation perd la moitié de sa force. Toujours fermer dans les deux sens.

Erreur 06

Description qui répète le label

Label « Getknown », description « Getknown agence SEO ». La description doit désambiguïser sans répéter le nom. Bonne version : « agence SEO française » ou « agence SEO et GEO basée à Levallois-Perret ». 15-25 caractères suffisent.

Sources externes citées dans ce guide

  1. Wikidata — Introduction officielle. Définition canonique de Wikidata par la Wikimedia Foundation : base de données structurée libre, collaborative et multilingue.
  2. Wikidata — Notability policy. Documentation officielle des trois critères d'éligibilité d'un élément Wikidata (sitelink, identifiable entity, structural need).
  3. Google Developers — Knowledge Graph Search API. Documentation officielle de Google sur le Knowledge Graph et son usage de bases publiques structurées.
  4. Schema.org — Propriété sameAs. Définition officielle de la propriété sameAs utilisée pour pointer vers les fiches Wikidata depuis un schema Organization ou Person.
  5. Annuaire des Entreprises — État français (data.gouv.fr). Source officielle pour vérifier et sourcer les déclarations P3215 (SIREN) sur les fiches Wikidata d'entreprises françaises.
  6. Wikidata Query Service. Endpoint SPARQL public permettant d'interroger le graphe Wikidata, utilisé en pratique par les LLM pour vérifier des entités.
  7. Wikidata — Getknown (Q139749070). Fiche d'entité publique de l'agence, créée en mai 2026, utilisée comme sameAs dans le schema Organization de cette page.
  8. Wikidata — Yonel Sasson (Q139749163). Fiche d'entité publique de l'auteur, créée en mai 2026, utilisée comme sameAs dans le schema Person de cette page.

Wikidata : les questions qui reviennent.

Non. Wikipedia est une encyclopédie textuelle organisée en articles. Wikidata est une base de données structurée organisée en éléments (Q-items) reliés par des propriétés (P-properties). Wikipedia répond à « qui est Yonel Sasson ? » par un texte. Wikidata répond par un graphe : Q139749163, instance of=humain, occupation=consultant SEO, employer=Q139749070. Les deux sont opérés par la Wikimedia Foundation et se complètent.
Non. C'est l'un des trois critères de notabilité possibles, mais pas le seul. Une entité peut être éligible à Wikidata si elle est « clairement identifiable et décrite par des sources publiques sérieuses », ou si elle remplit un « besoin structurel ». C'est précisément ce qui rend Wikidata accessible à des organisations qui n'auraient pas la notoriété requise pour Wikipedia.
Google a confirmé dès 2014 que son Knowledge Graph s'appuie sur Wikidata, parmi d'autres sources, après l'arrêt de Freebase la même année. Concrètement, les Knowledge Panels qui s'affichent à droite de la SERP, les AI Overviews et la désambiguïsation d'entité (savoir si « Apple » désigne le fruit, l'entreprise ou les Beatles) puisent directement dans le graphe Wikidata.
Oui. Wikidata fait partie du corpus d'entraînement public de la quasi-totalité des LLM majeurs, et son format structuré le rend particulièrement exploitable. Quand un LLM doit citer une entité avec confiance (date de fondation, dirigeant, siège social), Wikidata est la source de référence la plus dense et la plus structurée disponible librement.
L'indexation par Google Knowledge Graph est variable et n'est pas garantie. Une fiche bien construite, sourcée et reliée à un sitelink Wikipedia peut être prise en compte en quelques semaines. Une fiche orpheline, mal sourcée ou sans sitelink peut rester invisible des mois, voire indéfiniment. La qualité de construction prime sur l'ancienneté.
Les trois sont complémentaires. LinkedIn donne une présence professionnelle riche mais propriétaire. Le site officiel est canonique et contrôlable mais isolé. La base d'entités est ouverte, structurée et machine-readable, mais peu lisible humainement. La stratégie qui fonctionne en 2026 consiste à les interconnecter via sameAs : votre site déclare un sameAs vers le Q-item et vers LinkedIn, votre fiche publique déclare l'URL de votre site (P856) et de votre LinkedIn (P4264).
Trois risques principaux. D'abord, la suppression : une fiche jugée non notable ou autopromotionnelle peut être marquée pour suppression par la communauté. Ensuite, la dégradation : un patrouilleur peut retirer des déclarations non sourcées. Enfin, la sanction : éditer sa propre fiche sans déclarer son conflit d'intérêts peut entraîner un blocage du compte. La transparence et la qualité des sources sont les seules protections fiables.

Reste à savoir si votre marque est éligible à Wikidata.

Un diagnostic gratuit en trente minutes. Nous regardons votre exposition presse, vos identifiants publics, votre triangulation actuelle, et nous vous disons honnêtement si une fiche Wikidata est le bon investissement pour vous — ou si un autre levier GEO devrait passer en premier.

Réserver 30 minutes