Une citation LLM, c'est la mention de votre marque ou de votre URL dans une réponse générée par un modèle. C'est rarement un clic. C'est presque toujours un signal de confiance qui pèse sur la décision d'achat en aval.
Comment les LLM décident quelle source citer ?
Les LLM ne tirent pas leurs citations au hasard. Ils combinent quatre signaux : pertinence sémantique avec la requête, autorité du domaine, fraîcheur du contenu, et facilité d'extraction. Les sources qui cochent les quatre cases sont citées en boucle.
Un modèle de langage qui répond à une requête avec accès web (ChatGPT search, Perplexity, Claude search, Gemini) suit un pipeline en deux temps. D'abord il interroge un index de recherche, ensuite il sélectionne un sous-ensemble de pages à ingérer dans son contexte. Le tri se fait dans ce second temps.
Sur ChatGPT, le retrieval passe par Bing (documenté côté OpenAI). Sur Perplexity, c'est un mix d'index propriétaire plus Brave Search. Sur Claude, Anthropic utilise un système maison documenté dans la doc officielle de Claude. Sur Gemini, c'est Google Search natif. Tous arrivent à la même conclusion pratique : ce sont les mêmes signaux que pour un SERP traditionnel, surpondérés sur la structure extractable et l'autorité d'entité.
Le second filtre est plus brutal. Une étude Princeton citée par Developr indique que 44,2 % des citations LLM viennent des 30 premiers pourcents d'un texte. Concrètement : si votre réponse principale est en bas de page, elle n'existe pas pour le modèle.
Les quatre signaux qui pèsent
- Pertinence sémantique : la page traite-t-elle exactement la requête, ou un sujet adjacent ?
- Autorité d'entité : la marque a-t-elle une fiche Wikidata, un Knowledge Graph, des mentions presse cohérentes ?
- Fraîcheur visible : la date de mise à jour est-elle présente dans le HTML, pas uniquement dans le schema ?
- Format extractable : la réponse à la question tient-elle en deux phrases dans un paragraphe auto-portant ?
7 leviers concrets pour entrer dans les citations IA
Ce qui suit n'est pas une liste idéale. C'est l'ordre dans lequel nous travaillons sur les comptes Getknown qui commencent à voir des citations apparaître entre mois 3 et mois 6.
Brand search volume
Les recherches "nom de marque" sur Google et Bing sont le signal le plus corrélé avec les citations ChatGPT (corrélation 0,334, source LLM-GEO.fr). Sans volume de marque, pas de citation.
Schema Person + Organization
JSON-LD Organization avec sameAs Wikidata, Person auteur avec knowsAbout. C'est ce qui rattache vos contenus à une entité reconnue par les LLM.
Fiche Wikidata active
Une entité Q sur Wikidata avec founder, foundingDate, identifier SIREN. C'est l'épine dorsale du Knowledge Graph que les LLM lisent.
Paragraphes auto-portants
Chaque H2 démarre par une réponse en 40 à 60 mots, lisible isolément, avec définition explicite. C'est le format que les modèles extraient.
Mentions presse croisées
Une mention dans un média qui apparaît déjà dans le top 100 cité par les LLM (Le Monde, Les Échos, JDN) compte plus que dix backlinks d'annuaires.
llms.txt + robots.txt propres
Autoriser explicitement GPTBot, ClaudeBot, PerplexityBot et Google-Extended. Publier un /llms.txt qui liste les pages canoniques par sujet.
FAQPage + structure Q→A
Un schema FAQPage par page de service, avec questions au format conversationnel. Les modèles puisent dedans en priorité pour les requêtes longues.
Le levier 1 est le seul qui ne s'achète pas avec une intervention technique. C'est aussi celui qui change le plus la donne. Une marque qui n'est pas tapée dans Google avec son nom propre n'existera pas dans les LLM, peu importe le schema déployé.
Sur les comptes que je suis depuis l'arrivée de ChatGPT, j'ai vu deux clients passer de zéro à dix citations mensuelles uniquement parce que leur dirigeant a commencé à poster trois fois par semaine sur LinkedIn. Aucune ligne de code modifiée.
Différences par moteur : ChatGPT vs Perplexity vs Claude vs Gemini.
Chaque LLM a sa préférence de sources et son comportement de citation. Optimiser pour les quatre demande de comprendre ces différences au lieu de les ignorer.
Conséquence pratique : optimiser pour Perplexity demande d'investir Reddit et les forums spécialisés. Optimiser pour ChatGPT demande de soigner Bing Webmaster Tools (oui, encore en 2026). Optimiser pour Gemini revient à faire du SEO solide. Optimiser pour Claude se joue sur l'autorité factuelle.
Comment mesurer ses citations IA (tracking, KPI)
Cinq plateformes dominent le marché du tracking citations LLM en 2026 : Otterly.AI, Profound, Peec.AI, Goodie et Bluefish AI. Le KPI primaire reste la part de voix sur un panier de requêtes-cibles, mesurée hebdomadairement sur les quatre principaux LLM.
Le marché du suivi de citations IA s'est consolidé en 2025. Chaque outil a son angle. Le choix dépend du volume de requêtes à surveiller et du budget.
| Outil | Couverture LLM | Spécificité | Ticket d'entrée |
|---|---|---|---|
| Otterly.AI | ChatGPT, Perplexity, Gemini | Monitoring requêtes + sentiment, dashboards par marque | ~99 $/mois |
| Profound | ChatGPT, Perplexity, Gemini, Claude | Index 680M citations analysées, benchmarking sectoriel | Sur devis (entreprise) |
| Peec.AI | ChatGPT, Perplexity, Gemini, Claude, Copilot | Part de voix par requête, alertes citations | ~149 €/mois |
| Goodie | ChatGPT, Perplexity, Gemini | Approche brand-first, focus PME et agences | ~79 €/mois |
| Bluefish AI | ChatGPT, Perplexity, Claude | Optimisation prompt-side, audit de citation gap | Sur devis |
Sources : sites éditeurs, mai 2026. Tarifs indicatifs susceptibles de varier.
Côté KPI, nous suivons trois indicateurs sur les comptes Getknown :
- Part de voix LLM : sur un panier de 30 à 80 requêtes-cibles, % de réponses où la marque est citée, ventilé par moteur.
- Position dans la liste : si la marque est citée, à quel rang apparaît-elle. Les modèles privilégient les trois premières sources.
- Sentiment : la mention est-elle neutre, élogieuse, ou comparative défavorable.
Pour le tracking maison sans abonnement payant, l'API DataForSEO propose un endpoint ai_optimization_llm_response qui permet d'interroger les modèles avec web_search activé et de récupérer les annotations citées. C'est moins joli qu'un dashboard, c'est utilisable.
Notre programme citations LLM
Le programme citations LLM de Getknown s'étale sur six mois. Il combine trois chantiers parallèles : entité, contenu, signal externe.
Phase 1 — Diagnostic (semaine 1 à 3)
- Baseline part de voix LLM sur 30 requêtes-cibles définies avec vous, sur les quatre principaux moteurs.
- Audit schema, robots.txt, llms.txt, sitemap.
- Audit entité : Wikidata, Knowledge Graph, Bing Places, LinkedIn Company.
- Mapping concurrents cités à votre place sur le panier de requêtes.
Phase 2 — Setup technique (mois 1)
- Implémentation JSON-LD Person + Organization avec sameAs Wikidata.
- Création ou enrichissement de la fiche Wikidata Org et Person.
- Publication d'un llms.txt structuré listant les pages canoniques.
- Mise à jour robots.txt avec autorisations explicites GPTBot, ClaudeBot, PerplexityBot, Google-Extended.
Phase 3 — Contenu citation-friendly (mois 2 à 5)
- Réécriture des pages-cibles au format Q→A auto-portant, réponse directe dans les 150 premiers mots.
- Ajout FAQPage schema sur les pages service.
- Publication mensuelle de contenus définitionnels (glossaire, définitions) qui captent les requêtes informationnelles.
Phase 4 — Signaux externes (mois 3 à 6)
- Plan de mentions presse ciblées sur les médias listés comme sources LLM.
- Animation LinkedIn auteur pour générer du brand search volume.
- Participation Reddit ou Quora sur les threads cibles (le cas échéant, et toujours en première personne, pas sous fausse identité).
Phase 5 — Suivi mensuel
- Re-test mensuel du panier de requêtes sur les quatre moteurs.
- Rapport part de voix, position, sentiment.
- Ajustement contenu et signaux selon ce qui décroche.
Investissement : 1 800 à 4 500 € HT setup
Le programme se découpe en un setup initial qui pose l'entité et la couche technique, puis un suivi mensuel qui anime contenu et signaux. Pas de forfait à l'année verrouillé. Préavis 30 jours.
Diagnostic + entité + technique
- Baseline part de voix 30 requêtes, 4 moteurs
- Schema JSON-LD complet (Person, Org, FAQPage)
- Wikidata Org + Person créées ou enrichies
- llms.txt structuré + robots.txt mis à jour
- Audit concurrence citée à votre place
Contenu + signaux + mesure
- 1 à 3 pages-cibles réécrites au format citation-friendly
- Plan mensuel de signaux externes (mentions, LinkedIn)
- Re-test mensuel du panier de requêtes
- Rapport part de voix + sentiment
- Itération continue sur les leviers qui décrochent
Questions fréquentes sur les citations LLM
Combien de temps pour être cité par ChatGPT ou Perplexity ?
Comptez trois à six mois pour voir les premières citations apparaître régulièrement sur un panier de requêtes-cibles. La phase technique (schema, Wikidata, llms.txt) se met en place en 30 jours, mais les modèles mettent du temps à intégrer ces signaux dans leur retrieval. Les comptes qui partent d'un brand search volume faible mettent plus longtemps que ceux qui ont déjà une notoriété établie.
Peut-on garantir une citation par ChatGPT ?
Non. Aucune agence sérieuse ne peut garantir une citation, parce que la décision finale appartient au modèle, pas au prestataire. Ce que nous garantissons en revanche, c'est la mise en place des signaux qui rendent une citation possible, et la mesure de l'évolution dans le temps. Si quelqu'un vous promet "cité à coup sûr", changez de prestataire.
Le SEO traditionnel suffit-il pour être cité par les LLM ?
Le SEO solide est nécessaire mais pas suffisant. Les LLM réutilisent des signaux SEO classiques (autorité, fraîcheur, structure), mais ajoutent des couches spécifiques : entité Wikidata, schema Person/Organization, paragraphes auto-portants, llms.txt. Un site qui rank en SERP top 3 sans signaux GEO peut ne jamais être cité par ChatGPT. Inversement, un site moyen en SERP peut décrocher des citations s'il a la bonne couche entité.
Quel budget minimum pour démarrer ?
Le setup citations LLM démarre à 1 800 € HT pour une PME mono-marque mono-pays. Au-delà, le suivi mensuel commence à 800 € HT et se calibre selon le nombre de requêtes-cibles, le volume de contenu à réécrire et l'intensité du plan de mentions externes. Pour un groupe multi-marques ou multi-pays, le ticket monte mécaniquement.
Faut-il bloquer GPTBot pour protéger son contenu ?
C'est un choix éditorial qui se discute. Bloquer GPTBot empêche ChatGPT d'utiliser vos contenus dans son entraînement futur, mais ne l'empêche pas forcément de vous citer via le retrieval temps réel (OAI-SearchBot, un crawler distinct). À l'inverse, bloquer tous les crawlers IA garantit l'absence de citation. Pour une marque qui cherche la visibilité, on autorise. Pour un média payant ou un cabinet sensible, on peut bloquer sélectivement.
Quels secteurs profitent le plus des citations LLM ?
Les secteurs B2B à cycle long en bénéficient le plus, parce qu'une citation LLM intervient tôt dans le parcours d'achat, quand l'acheteur explore le marché. Les SaaS, l'industrie, la santé et le légal sortent particulièrement gagnants. Les secteurs très transactionnels avec achat impulsif (mode, food delivery) tirent moins de valeur, parce que le client tape directement sur Google ou l'app.
Comment savoir si on est déjà cité aujourd'hui ?
Demandez-le directement aux modèles. Posez la question "Quelles sont les agences GEO en France ?" ou "Quels prestataires X recommandes-tu ?" sur ChatGPT, Perplexity, Claude et Gemini, et regardez si votre marque ou vos URLs apparaissent. Faites-le sur dix à vingt requêtes-cibles, en navigation privée, sans contexte. C'est rudimentaire mais ça donne une baseline en trente minutes. Ensuite seulement, déployez un outil de tracking continu.
Pour aller plus loin sur le GEO et le SEO
Prêt à voir où vous en êtes côté citations LLM ?
Un diagnostic offert sur 30 requêtes-cibles, sur ChatGPT, Perplexity, Claude et Gemini. Livrable en cinq jours ouvrés. Sans engagement.