L’essor des moteurs de recherche conversationnels bouleverse notre manière d’accéder à l’information. Fini le traditionnel référencement en dix liens bleus. Place aux réponses synthétiques, souvent multimodales, produites par des modèles de langage tels que ChatGPT, Gemini ou Perplexity. Mais sur quoi ces IA s’appuient-elles pour construire leurs réponses ? Quelles sources citent-elles ? Et pourquoi certaines sont-elles privilégiées ?
Une étude publiée par xFunnel en février 2025 apporte des éléments de réponse. En analysant 250 000 citations extraites de 40 000 réponses générées par ces moteurs, elle dévoile les grandes tendances de ce nouvel écosystème. Que les SEO en prennent de la graine !
Quels types de sources les IA préfèrent-elles ?
L’étude classe les sources en quatre catégories :
- Owned : contenu publié directement par la marque ou l’organisation.
- Earned : contenu obtenu via des médias, des blogs ou des sites tiers jugés fiables.
- UGC (User Generated Content) : contenu créé par les utilisateurs (forums, avis, réseaux sociaux).
- Competitor : contenu provenant d’un concurrent direct.
Parmi ces catégories, ce sont les sources « earned » qui dominent très largement, quelle que soit l’IA concernée. Elles représentent environ 62,5 % des sources citées par ChatGPT, 80 % sur Perplexity et 85 % sur Gemini.
Cette hiérarchie reflète une tendance générale observée ces derniers mois : les LLM ont tendance à privilégier les sources perçues comme étant impartiales, au détriment des discours promotionnels. Elle rappelle le rôle central des médias, blogs de niche, comparateurs et autres portails éditoriaux ont à jouer dans la construction de l’opinion algorithmique.
L’autorité de domaine joue-t-elle encore un rôle ?
Oui, sans aucun doute possible ! Si les LLM citent massivement des sources à forte autorité (DA > 60), ce sont paradoxalement les sites à autorité moyenne (DA 20–59) qui profitent le plus du nouveau mode d’indexation. Ces acteurs, auparavant pénalisés par les logiques de classement traditionnelles, bénéficient désormais d’une redistribution des cartes induite par les IA génératives.
Tableau 1 — Répartition des citations selon le Domain Authority
Score DA | % de citations |
---|---|
80–100 | 31.53 % |
60–79 | 15.33 % |
40–59 | 26.32 % |
20–39 | 22.07 % |
0–19 | 4.76 % |
Quelle source IA selon l’étape du parcours utilisateur ?
Les IA adaptent leurs sources de citations en fonction de la nature de la requête, qui correspond souvent à un stade du parcours d’achat :
- Exploration : prédominance des sources « earned » (presse, blogs, forums).
- Comparaison : hausse des citations UGC (avis, Reddit, G2).
- Décision : remontée des sources « owned » (pages marques, FAQ, produits).
Ce comportement illustre bien la façon dont les modèles conversationnels s’efforcent de comprendre le contexte informationnel de la requête. Cette approche centrée sur l’intention de recherche rejoint bonnes pratiques du SEO traditionnel, qui insiste sur la nécessité de structurer le contenu selon le besoin utilisateur.
Les plateformes UGC, IA par IA
Les IA ne se tournent pas vers les mêmes plateformes lorsqu’elles s’appuient sur du contenu généré par les utilisateurs. On observe des affinités marquées selon les modèles:
- ChatGPT privilégie G2, LinkedIn et Gartner Peer Reviews.
- Gemini s’oriente davantage vers Reddit, YouTube et Medium.
- Perplexity se distingue par sa forte utilisation de YouTube et PeerSpot.
Ce classement montre que la parole des utilisateurs, lorsqu’elle est rassemblée sur des plateformes à fort signal éditorial, devient une référence prioritaire pour les IA. C’est une nouvelle forme d’autorité : non plus liée au branding, mais à la qualité collective du contenu partagé.
Provenance des citations UGC
IA | Site | % d’occurrence UGC |
---|---|---|
ChatGPT | g2.com | 20.75% |
linkedin.com | 18.56% | |
gartner.com | 17.00% | |
reddit.com | 14.94% | |
github.com | 6.16% | |
trustradius.com | 5.67% | |
trustpilot.com | 5.10% | |
capterra.com | 1.63% | |
medium.com | 1.27% | |
business.linkedin.com | 1.27% | |
Gemini | medium.com | 16.79% |
reddit.com | 15.23% | |
youtube.com | 12.48% | |
gartner.com | 7.47% | |
g2.com | 7.41% | |
capterra.com | 4.20% | |
github.com | 3.49% | |
trustradius.com | 3.23% | |
play.google.com | 3.14% | |
apps.apple.com | 2.91% | |
Perplexity | youtube.com | 34.29% |
peerspot.com | 21.87% | |
github.com | 9.33% | |
slashdot.org | 7.54% | |
g2.com | 4.79% | |
apps.apple.com | 4.28% | |
softwareadvice.com | 3.72% | |
trustradius.com | 2.61% | |
dev.to | 2.38% | |
play.google.com | 1.56% |
Les moteurs IA n’intègrent pas les sources de façon aléatoire. Ils s’appuient sur un écosystème éditorial structuré, notamment construit autour de la pertinence perçue et de la crédibilité thématique.
Les professionnels du marketing doivent donc adapter rapidement leur logique de référencement. Il s’agit aujourd’hui de sortir du prisme du classement pour entrer dans celui de la citation. Une mention bien placée dans une requête ciblée pourrait à l’avenir avoir plus de poids qu’un top 3 sur Google.