Qu’est-ce que l’Indexation Google ?
L’indexation Google est une base de données de toutes les pages Web que le moteur de recherche a explorées et stockées pour les utiliser dans les résultats de recherche.
L’indexation agit comme une bibliothèque massive et consultable de contenu Web. Il stocke le texte de chaque page Web, ainsi que des métadonnées importantes telles que des titres, des en-têtes, des liens, des images, etc.
Toutes ces données sont compilées dans un index structuré qui permet à Google d’analyser instantanément son contenu et de faire correspondre les requêtes de recherche avec des résultats pertinents.
Ainsi, lorsque vous recherchez quelque chose dans Google, vous recherchez dans son puissant index les meilleures pages Web sur ce sujet.
Chaque page qui apparaît dans les résultats de recherche de Google doit d’abord être indexée.
Ainsi, si votre page n’est pas indexée, elle n’apparaîtra pas dans les résultats de recherche.
Voici comment l’indexation s’intègre dans l’ensemble du processus :
- Exploration : Googlebot explore le Web et recherche des pages nouvelles ou mises à jour
- Indexation : Google analyse les pages et les stocke dans une immense base de données
- Classement : l’algorithme de Google sélectionne les pages les meilleures et les plus pertinentes de son index et les affiche comme résultats de recherche.
Des algorithmes prédéterminés contrôlent l’indexation de Google. Cependant, vous pouvez influencer l’indexation en gérant la manière dont les robots découvrent votre contenu en ligne.
Table des matières
Comment vérifier si Indexation Google est active sur mon site ?
Google permet de savoir facilement si votre site a été indexé en utilisant l’ opérateur de recherche « site : » .
Voici comment vérifier :
- Aller sur Google
- Dans la barre de recherche, saisissez l’opérateur de recherche « site : » suivi de votre domaine (par exemple, site:votredomaine.com ).
- Lorsque vous regardez sous la barre de recherche, vous verrez une estimation du nombre de vos pages indexées par Google.
Si aucun résultat n’apparaît, aucune de vos pages n’est indexée.
S’il existe des pages indexées, Google les affichera comme résultats de recherche.
C’est ainsi que vous vérifiez rapidement l’état d’indexation de vos pages. Mais ce n’est pas la méthode la plus pratique, car il peut être difficile de repérer des pages spécifiques qui n’ont pas été indexées.
La manière alternative (et plus complexe) de vérifier si Google a indexé votre site Web consiste à utiliser Google Search Console . Nous y reviendrons de plus près dans le prochain chapitre.
Conseil
Si vous découvrez que Google n’a pas indexé vos pages, cela peut être dû à des problèmes techniques sur votre site.
L’outil d’audit de site de Semrush est parfait pour identifier et résoudre ces problèmes. Essaie.
Identifier les problèmes d’indexation avec un outil d’audit de site
Comment puis-je demander à Google d’indexer mon site ?
Si vous avez un nouveau site Web, l’indexation de Google peut prendre un certain temps. Ramper peut prendre de quelques jours à quelques semaines . (L’indexation a généralement lieu juste après, mais elle n’est pas garantie.)
L’indexation peut donc prendre du temps. Vous pouvez cependant accélérer le processus.
Le moyen le plus simple est de demander l’indexation dans Google Search Console .
Google Search Console (GSC) est un ensemble d’outils Google gratuit qui vous permet de vérifier la présence de votre site Web sur Google et de résoudre tout problème associé.
Si vous n’avez pas encore de compte GSC, vous devrez :
- Connectez-vous avec votre compte Google
- Ajoutez une nouvelle propriété (votre site Web) à votre compte
- Vérifier la propriété du site Web
Besoin d’aide? Lisez notre guide détaillé qui vous aidera à configurer votre Google Search Console étape par étape.
Créer et soumettre un plan de site
Un plan de site XML est un fichier qui répertorie toutes les URL que vous souhaitez que Google indexe.
Il indique à Google que ces pages sont importantes. Ce qui aide les robots à trouver vos pages principales plus rapidement.
Vous trouverez probablement votre plan de site sur cette URL : “https://votredomaine.com/sitemap.xml”
Si vous n’en avez pas, lisez notre guide pour créer un plan de site XML.
Une fois que vous avez l’URL de votre plan de site, accédez au tableau « Plans de site » dans GSC. Vous le trouverez sous la section « Indexation » dans le menu de gauche.
Entrez l’URL de votre plan de site et cliquez sur « Soumettre ».
Le traitement de votre plan de site peut prendre quelques jours. Lorsque c’est fait, vous devriez voir le lien vers votre plan de site et un statut vert « Succès » dans le rapport.
La soumission du plan du site peut aider Google à découvrir toutes les pages que vous jugez importantes. Et peut accélérer le processus de leur indexation.
Utilisez l’outil d’inspection d’URL
Pour vérifier l’état d’une URL spécifique, utilisez l’outil d’inspection d’URL dans GSC.
Commencez par saisir l’URL dans la barre de recherche « URL Inspection » en haut.
Si vous voyez le statut « L’URL est sur Google », cela signifie que l’URL inspectée a été explorée et indexée par Google.
Vous pouvez vérifier les détails pour voir quand il a été exploré pour la dernière fois, ainsi que d’autres informations utiles .
Si tel est le cas, vous êtes prêt et vous n’avez rien à faire.
Mais si vous voyez le statut « L’URL n’est pas sur Google », cela signifie que l’URL inspectée n’est pas indexée et ne peut pas apparaître dans les pages de résultats des moteurs de recherche (SERP) de Google.
Vous verrez probablement la raison pour laquelle la page n’a pas été indexée. Et vous devrez résoudre le problème (voir la section suivante).
Une fois cela fait, vous pouvez demander l’indexation en cliquant sur le lien « Demander l’indexation ».
Note
Si l’URL inspectée est relativement nouvelle, il se peut simplement que Google ne l’ait pas encore découverte. En cliquant sur « Demander l’indexation », vous pouvez accélérer le processus.
Comment rechercher et résoudre les problèmes d’indexation
Parfois, il peut y avoir des problèmes plus profonds avec le référencement technique de votre site Web . Il est donc possible que votre site (ou une page spécifique) ne soit pas indexé même si vous le demandez.
Cela peut se produire si votre site n’est pas adapté aux mobiles, si votre site se charge trop lentement, s’il y a des problèmes de redirection, etc.
Effectuez un audit technique de référencement pour détecter les problèmes sous-jacents susceptibles d’empêcher l’indexation de votre site.
Vous pouvez utiliser un outil d’audit comme Site Audit de Semrush .
- Créez un compte Semrush gratuit (aucune carte de crédit nécessaire)
- Configurez votre première exploration (nous avons un guide de configuration détaillé qui vous aidera à cela.)
- Cliquez sur le bouton « Démarrer l’audit du site »
Après avoir exécuté l’audit, vous obtiendrez une vue détaillée de la santé de votre site.
Vous pouvez également voir une liste de tous les problèmes en cliquant sur l’onglet « Problèmes » :
Les problèmes liés à l’indexation apparaîtront presque toujours en haut de la liste, dans la section « Erreurs ».
Examinons quelques raisons courantes pour lesquelles votre site peut ne pas être indexé et comment y remédier.
Rechercher et résoudre les problèmes d’indexation avec un outil d’audit de site
Vérifiez votre fichier Robots.txt
Votre fichier robots.txt donne des instructions aux moteurs de recherche pour ne pas explorer certaines parties d’un site Web.
Vous trouverez le vôtre sur : https://votredomaine.com/robots.txt
Vous souhaiterez peut-être empêcher Google d’explorer les pages en double, les pages privées ou les ressources telles que les PDF et les vidéos.
Mais si votre fichier robots.txt indique à Googlebot (ou aux robots d’exploration en général) que l’intégralité de votre site ne doit pas être explorée, il y a de fortes chances qu’il ne soit pas indexé non plus.
Chaque directive du fichier robots.txt se compose de deux parties :
- « User-agent » identifie le robot auquel il s’adresse
- L’instruction « Autoriser » ou « Interdire » indique au robot d’exploration que le site (ou une partie de celui-ci) peut ou non être exploré.
Par exemple:
<code>User-agent: *<br>Disallow: /</code>
Cette directive indique qu’aucun robot d’exploration (représenté par un astérisque) ne peut explorer ( disallow 🙂 l’ensemble du site (représenté par un symbole barre oblique) :
Inspectez votre robots.txt et assurez-vous qu’il n’y a aucune directive qui pourrait empêcher Google d’explorer votre site ou les pages/dossiers que vous souhaitez indexer.
Gérez vos balises Noindex et canoniques
L’un des moyens d’indiquer aux moteurs de recherche de ne pas indexer vos pages est d’utiliser les balises méta des robots avec un attribut « noindex ».
Cela ressemble à ceci :
<code><meta name="robots" content="noindex"></code>
Si une page contient cette ligne de code, vous dites à Google de ne pas l’indexer.
Vous pouvez vérifier quelles pages de votre site Web ont des balises méta noindex dans Google Search Console :
- Cliquez sur le rapport « Pages » dans la section « Indexation » dans le menu de gauche
- Faites défiler jusqu’à la section « Pourquoi les pages ne sont pas indexées »
- Recherchez « Exclus par la balise ‘noindex’». Cliquez dessus.
Si la liste des URL contient une page que vous souhaitez indexer, supprimez simplement la balise méta noindex du code source de cette page.
L’outil d’audit de site vous avertira également des pages bloquées via le fichier robots.txt ou la balise noindex.
Il vous informera également des ressources bloquées par la balise dite X-Robots, qui est généralement utilisée pour les documents non HTML (tels que les fichiers PDF).
Trouvez vos pages bloquées avec un outil d’audit de site
Gérer les balises canoniques
Une autre raison pour laquelle votre page peut ne pas être indexée est qu’elle contient une balise canonique .
Les balises canoniques indiquent aux robots d’exploration si une certaine version d’une page est préférée. Ils évitent les problèmes causés par l’apparition de contenu en double sur plusieurs URL.
Si une page comporte une balise canonique pointant vers une autre URL, Googlebot suppose qu’il existe une version préférée différente de cette page. Et n’indexera pas la page avec la balise canonique, même s’il n’existe pas de version alternative.
Le rapport « Pages » dans Google Search Console sera encore utile ici.
Faites simplement défiler jusqu’à la section « Pourquoi les pages ne sont pas indexées » et cliquez sur la raison « Page alternative avec la balise canonique appropriée » .
Vous verrez une liste des pages concernées. Parcourez la liste.
S’il y a une page que vous souhaitez indexer (c’est-à-dire que le canonique est utilisé de manière incorrecte), supprimez la balise canonique de cette page. Ou assurez-vous qu’il pointe vers la version de la page que vous souhaitez indexer.
Vérifiez vos liens internes
Les liens internes aident les robots à trouver vos pages Web. Ce qui peut accélérer le processus d’indexation.
Si vous souhaitez auditer vos liens internes, rendez-vous dans le rapport thématique « Liens internes » dans Audit de site .
Le rapport listera tous les problèmes liés aux liens internes.
Cela aiderait bien sûr à tous les réparer. Mais ces trois problèmes sont les plus importants en matière d’exploration et d’indexation :
- Les liens internes sortants contiennent un attribut nofollow : les liens Nofollow ne transmettent pas d’autorité . S’il est utilisé en interne, Google peut choisir d’ignorer la page cible lors de l’exploration de votre site. Assurez-vous de ne pas les utiliser pour les pages que vous souhaitez indexer.
- Les pages nécessitent plus de 3 clics pour être atteintes : Si les pages nécessitent plus de trois clics pour être accessibles depuis la page d’accueil, il est possible qu’elles ne soient pas explorées et indexées. Ajoutez plus de liens internes vers ces pages (et examinez l’architecture de votre site Web ).
- Pages orphelines dans le plan du site : les pages qui n’ont aucun lien interne pointant vers elles sont appelées « pages orphelines ». Ils sont rarement indexés. Résolvez ce problème en créant un lien vers toutes les pages orphelines.
Pour voir les pages affectées par un problème spécifique, cliquez sur le lien indiquant le nombre de problèmes trouvés à côté.
Enfin et surtout, n’oubliez pas d’utiliser les liens internes de manière stratégique :
- Lien vers vos pages les plus importantes : Google reconnaît que les pages sont importantes pour vous si elles contiennent davantage de liens internes
- Lien vers vos nouvelles pages : Intégrez les liens internes à votre processus de création de contenu pour accélérer l’indexation de vos nouvelles pages
Rechercher des problèmes de liaison interne avec un outil d’audit de site
Vérifiez la qualité globale de votre site
Les problèmes d’indexation ne sont pas toujours liés à des problèmes techniques.
Même si votre site répond à toutes les exigences techniques pour être indexé, Google ne peut pas indexer toutes vos pages. Surtout si Google ne considère pas votre site Web comme étant de haute qualité.
Voici une citation de John Mueller de Google :
Si vous avez un site plus petit et que vous constatez qu’une partie importante de vos pages ne sont pas indexées, je prendrais du recul et j’essaierais de reconsidérer la qualité globale du site Web et de ne pas trop me concentrer sur les problèmes techniques de ces pages. .
Si tel est votre cas, vous souhaiterez peut-être commencer à travailler sur les éléments suivants :
- Améliorer la qualité du contenu de votre site Web
- Créer des backlinks de qualité vers votre site Web
- Améliorer les signaux d’expertise, d’autorité et de fiabilité (EAT) de votre site Web
Note
Même s’il est vrai que les problèmes d’indexation ne sont pas toujours liés à des problèmes techniques, des facteurs techniques peuvent également empêcher indépendamment l’exploration et l’indexation des pages.
Ainsi, même si les problèmes de qualité peuvent avoir un impact négatif sur l’indexation, vous ne devez pas non plus considérer les problèmes techniques comme des obstacles potentiels.
Une approche diagnostique équilibrée évaluant à la fois les facteurs de qualité et les facteurs techniques est essentielle.
Surveillez vos problèmes d’indexation
Même si vous avez résolu vos problèmes d’indexation maintenant, de nouveaux problèmes pourraient survenir à l’avenir.
Cela est particulièrement vrai si vous ajoutez fréquemment du nouveau contenu ou mettez à jour la structure de votre site Web.
L’outil d’audit de site de Semrush peut vous aider à détecter les nouveaux problèmes techniques avant qu’ils ne s’aggravent.
Planifiez simplement des audits périodiques en accédant aux paramètres d’audit de site de votre site Web et en cliquant sur le bouton « Planifier ».
Vous avez la possibilité de configurer des analyses automatiques sur une base quotidienne ou hebdomadaire
Nous vous recommandons de configurer des analyses hebdomadaires pour démarrer. Plus tard, vous pourrez ajuster la cadence selon vos besoins.
Vous pouvez désormais être assuré que les problèmes techniques seront signalés rapidement afin que vous puissiez les résoudre avant qu’ils ne provoquent de graves problèmes.
Indexation Google : FAQ
Comment être indexé sur Google ?
L’indexation d’un site internet s’effectue par le biais de liens (internes ou externes au site) vers les pages du site web en question. La deuxième solution consiste à remplir directement un formulaire auprès de Google dans lequel vous renseignez l’URL de votre site.
C’est quoi l’indexation en SEO ?
L’indexation est une phase du référencement naturel visant à la prise en compte des pages d’un site web dans l’index des moteurs de recherche. Cette première phase du référencement d’un site web est un prérequis nécessaire (mais non suffisant) à son positionnement dans les pages de résultats des moteurs.
Quel est le but de l’indexation ?
L’indexation est une procédure consistant à associer ou à marquer des documents ou d’autres contenus avec des informations permettant par la suite de rechercher et récupérer ces documents.
Pourquoi indexer un site ?
L’indexation va permettre d’analyser les contenus, puis de les trier dans les résultats de recherche, en fonction de nombreux critères. Une page indexée peut donc ensuite apparaître dans les résultats des moteurs de recherche, quand l’internaute tape un mot clé spécifique.
Articles connexes
- Réseaux de diffusion de contenu (CDN) : Guide du débutant
- Google PageSpeed Insights : Définition et comment améliorer votre score
- SEO d’images et balise Alt : 10 astuces d’optimisation des images
- Mobile-First Indexing : Définition et meilleures pratiques
- Hreflang : Comment définir et implémenter
- Schema Markup : Définition et implémentation
- Sitemap HTML : Avantages pour le SEO et les Utilisateurs
- Comment réaliser un audit technique SEO en 10 étapes