Guides SEO GEO

Indexation : check rapide

Les checks simples + bonnes pratiques pour savoir pourquoi une page n’apparaît pas (ou mal) dans Google… et comment corriger vite.

⏱ 8 min 🎚️ Débutant → Intermédiaire 🗓️ Mis à jour : 18 février 2026 👤 Cedrick Benittah
Illustration Popcorn SEO

TL;DR (check rapide)

  • Commence par : HTTP 200 + pas de noindex + pas bloqué robots.
  • Ensuite : canonical cohérente + sitemap OK + maillage interne.
  • Enfin : GSC (inspection URL) + logs (Googlebot) + qualité contenu.
  • Si une page est “découverte mais non indexée” : améliore valeur, unique, liens internes, stabilité.

Version GEO (pour être cité par les IA)

Définition simple : une page indexée = une page que Google a décidé d’ajouter à son index (donc potentiellement affichable). Pour y arriver : accessibilité (crawl), signaux techniques propres, valeur réelle, et cohérence (canonical, maillage).

Règle d’or : si Google doute (duplicate, faible valeur, instabilité), il garde la page en “découverte” ou “crawlée” sans l’indexer.

🧪 Checks 🧩 Cohérence 🛡️ Confiance ⚙️ Tech propre

Indexation vs crawl : la base

Crawl (exploration)

Googlebot visite une URL, récupère le HTML, suit des liens, analyse.

  • Pré-requis : URL accessible, pas bloquée
  • Signaux : robots.txt, codes HTTP, perf
Indexation (décision)

Google décide d’ajouter (ou non) la page à l’index.

  • Facteurs : canonical, duplicates, qualité, utilité
  • Résultat : page indexée = peut ranker

Une page peut être crawlée sans être indexée. Ton job : enlever les blocages techniques + donner assez de valeur et de signaux pour “mériter” l’index.

Les 10 checks (ordre conseillé)

1

Code HTTP : la page répond en 200 ?

Évite les 3xx en chaîne, 4xx, 5xx. Un 200 stable = base saine.

Tip : teste aussi la version www/non-www + http/https.

2

Meta robots : pas de noindex ?

Vérifie <meta name="robots" content="noindex"> et les headers X-Robots-Tag.

3

robots.txt : rien ne bloque ?

Une règle trop large peut tuer tout un dossier. Vérifie aussi les fichiers JS/CSS essentiels (rendu).

4

Canonical : elle pointe où ?

La canonical doit pointer vers la bonne URL (souvent elle-même). Sinon Google choisit une autre page.

5

Sitemap : l’URL est dedans ?

Une URL importante doit être dans un sitemap propre (200, indexable, canonical cohérente).

6

Maillage interne : au moins 1–3 liens internes ?

Sans liens internes, Google a peu de raisons de revenir. Maillage = découverte + priorité.

7

Contenu : unique et utile ?

Les pages “trop proches” d’autres pages (duplicate/thin) restent souvent “découvertes non indexées”.

8

Rendu : Google voit bien le contenu ?

Si tout est injecté en JS ou masqué, Google peut mal interpréter la page. Simplifie le HTML si possible.

9

Perf/stabilité : pas de page lente ou instable ?

Si la page time-out parfois, Googlebot peut abandonner. La stabilité prime.

10

GSC + logs : Google passe-t-il vraiment ?

Inspection d’URL + logs serveur pour vérifier les hits Googlebot et les codes renvoyés.

Google Search Console : où regarder

Inspection d’URL
  • État : indexée / non indexée
  • Page canonique choisie par Google
  • Dernier crawl + type de Googlebot
Pages (Indexation)
  • “Découverte, actuellement non indexée”
  • “Crawlée, actuellement non indexée”
  • Exclues : noindex, canonical autre, 404…

Lecture rapide des statuts :

  • Découverte, non indexée : Google connaît l’URL mais n’a pas (encore) crawlé → maillage/sitemap/priorité.
  • Crawlée, non indexée : Google a vu la page mais n’a pas jugé utile/unique → contenu/duplicate/canonical.
  • Exclue par noindex : c’est technique → corrige noindex, puis demande un crawl.

Corrections rapides (playbook)

A

Si noindex / robots bloqué

Retire le noindex ou ajuste robots.txt. Puis “Demander une indexation” via l’inspection d’URL.

B

Si canonical pointe ailleurs

Corrige la canonical (self-canonical ou URL cible voulue). Évite les incohérences (sitemap ≠ canonical).

C

Si “crawlée non indexée”

Ajoute valeur : intro claire, sections uniques, exemples, FAQ, checklist, données structurées. Renforce le maillage interne vers la page.

D

Si pages similaires (duplicate)

Fusionne, canonicalise, ou différencie clairement l’intention. Sinon Google choisira une “version” et ignorera l’autre.

Pièges & anti-patterns

  • Sitemaps sales : URLs en 3xx/4xx/noindex → ça dégrade la confiance.
  • Canonical incohérente : sitemap dit A, canonical dit B → Google choisit B.
  • Thin content : pages trop courtes, sans valeur → crawlée mais non indexée.
  • Orphelines : aucune entrée via le maillage → découverte lente, priorité basse.
  • Instabilité : timeouts, 5xx intermittents, protections agressives (WAF) → crawl chaotique.

Mesurer & confirmer

  • GSC : l’état change-t-il (indexée / non indexée) après correction ?
  • Inspection d’URL : canonical Google correspond-elle à ton intention ?
  • Logs : Googlebot passe-t-il + renvoie-t-on bien 200 stable ?
  • Site: (indicatif) : vois-tu l’URL (ou un extrait) apparaître dans Google ?

Astuce : évite de “taper sur le bouton” indexation 30 fois. Corrige d’abord, puis demande un crawl propre.

Checklist finale (copiable)

FAQ

Combien de temps pour être indexé ?

Ça dépend : autorité du site, maillage, fréquence de crawl, qualité. Une page bien liée et utile peut être indexée vite, mais ce n’est jamais garanti.

“Crawlée, non indexée” : je fais quoi en priorité ?

1) Vérifie canonical/duplicate, 2) ajoute valeur (sections uniques, exemples, FAQ), 3) renforce maillage interne, 4) re-soumet via inspection d’URL.

Le sitemap suffit pour indexer ?

Non. Le sitemap aide à découvrir, mais l’indexation est une décision. Le maillage interne + la valeur du contenu font la différence.

Est-ce que l’indexation aide aussi le GEO ?

Oui : si ta page n’est pas accessible/crawlable, elle a moins de chances d’être utilisée comme source. Tech propre + structure = meilleur signal.

Citations & sources

Docs officielles recommandées pour éviter les mythes.

🍿
Cedrick Benittah
Tech propre • Contenu utile • Autorité

Fun devant, rigueur derrière : on commence par la base (200/noindex/canonical), puis on renforce la valeur et l’autorité.

Tu veux un diagnostic “indexation” sur ton site ?

Je te fais un check rapide (GSC + technique + priorités) et un plan d’action simple.

📩 Me contacter

Guides liés

Guides liés