Leçon 3 – Qu’est-ce que l’indexation ?

Transcription

Une fois que Google a trouvé une page, la question suivante est de savoir s’il doit la stocker et la rendre éligible à apparaître dans les résultats de recherche.

Ce processus s’appelle l’indexation et c’est un concept fondamental en SEO, car une page qui n’est pas indexée ne peut tout simplement pas apparaître dans les résultats.

Peu importe la qualité de sa rédaction, le nombre de backlinks qu’elle possède ou son utilité. Si elle n’est pas indexée, elle restera invisible pour les utilisateurs.

À la fin de cette vidéo, vous comprendrez ce que signifie l’indexation, comment vérifier si une page est indexée, pourquoi l’indexation mobile first est importante, et comment des éléments comme le fichier robots.txt et les balises meta influencent les pages que Google décide d’indexer.

Après le crawl d’une page, les moteurs de recherche décident ensuite s’ils doivent ou non l’indexer. L’indexation est le processus par lequel Google essaie de comprendre de quoi parle la page et si elle mérite d’apparaître dans les résultats.

Pendant l’indexation, Google analyse le contenu de votre page, ce qui inclut le texte, les images, les vidéos, les métadonnées et la structure globale. Toutes ces informations sont ensuite stockées dans l’index de Google, que vous pouvez voir comme une immense bibliothèque de pages dans laquelle Google peut piocher lorsqu’un utilisateur effectue une recherche.

Il est important de comprendre que le crawl ne garantit pas l’indexation. Une page peut être découverte sans jamais être ajoutée à l’index. Et il existe de nombreuses raisons à cela.

Par exemple, le contenu peut être trop léger ou dupliqué ailleurs. La page peut être bloquée volontairement. Le site peut essayer de pousser trop de pages en même temps. Dans certains cas, la page ou même le site peut ne pas atteindre le niveau de qualité attendu par Google.

Il existe plusieurs façons de vérifier si une page est indexée dans Google. Dans cette partie, nous allons voir les plus fiables. La première est Google Search Console, que j’ai déjà mentionnée plusieurs fois dans ce cours.

Je vais donc faire un petit détour pour vous montrer comment le configurer si ce n’est pas déjà fait, afin que vous puissiez suivre les prochaines étapes.

La première chose à faire est d’aller sur search.google.com/search-console/about. Une fois sur la page, cliquez sur le bouton « commencer maintenant ». Vous serez ensuite redirigé vers une nouvelle page.

Si vous n’avez encore aucune propriété dans Google Search Console, c’est exactement ce que vous verrez. Cliquez sur « ajouter une propriété », puis encore une fois sur « ajouter une propriété ».

Il existe plusieurs façons d’ajouter votre site, mais je vais vous montrer la plus simple, avec le préfixe d’URL.

Allez sur le site que vous souhaitez ajouter et copiez l’URL de la page d’accueil. Collez-la dans le champ prévu en gardant bien le HTTPS au début, puis cliquez sur « continuer ». Après quelques instants, plusieurs méthodes de validation vous seront proposées pour prouver que vous êtes bien propriétaire du site.

Vous pouvez choisir celle qui vous convient le mieux. Personnellement, la plus simple est de télécharger le fichier HTML proposé. Une fois téléchargé sur votre ordinateur, vous devez l’ajouter à la racine de votre site.

Pour cela, vous pouvez passer par votre développeur ou utiliser un client FTP si vous y avez accès. Le fichier doit être placé dans le dossier racine du site.

Je vais le faire maintenant. Je suis dans FileZilla et j’accède au dossier racine de mon site. Vous pouvez voir qu’un fichier similaire est déjà présent, car j’ai déjà effectué la vérification sur un autre compte.

Je prends le fichier téléchargé et je le glisse dans ce dossier. Une fois l’envoi terminé, je retourne dans Search Console et je clique sur « vérifier » pour confirmer que le fichier est bien en place.

La validation est maintenant confirmée. Je peux cliquer sur « accéder à la propriété » pour entrer dans Search Console.

Vous remarquerez peut-être qu’il y a déjà des données affichées. C’est parce que ce site était déjà connecté à un autre compte Google. Si de votre côté vous ne voyez aucune donnée et qu’on vous demande de revenir dans quelques jours, c’est tout à fait normal.

Il existe plusieurs façons de vérifier si une page est indexée dans Search Console, mais la plus simple est d’utiliser l’outil d’inspection d’URL.

Allez sur la page que vous souhaitez vérifier et copiez son URL. Ensuite, dans Search Console, utilisez la barre en haut de la page qui permet d’inspecter une URL. Collez l’adresse puis appuyez sur entrée.

Après quelques secondes, un rapport s’affiche et vous indique clairement si la page est indexée ou non. Par exemple, ici, il est indiqué que la page est bien indexée.

Une autre méthode très simple consiste à utiliser l’opérateur de recherche site dans Google. Tapez « site: » suivi de l’URL de la page que vous voulez vérifier.

Si la page apparaît dans les résultats, cela signifie qu’elle est indexée. Si elle n’apparaît pas, cela signifie qu’elle ne l’est pas. C’est une méthode rapide, mais elle ne vous donnera pas d’indications sur la raison du problème.

L’indexation mobile first signifie que Google utilise principalement la version mobile de votre site pour décider comment indexer et classer vos pages.

Ce changement a eu lieu parce que la majorité des utilisateurs naviguent désormais sur mobile plutôt que sur ordinateur, ce que vous pouvez souvent constater dans vos propres données Google Analytics.

D’un point de vue SEO, cela signifie que la version mobile de votre site n’est plus secondaire. C’est la version principale. Si elle contient moins de contenu que la version desktop, vous risquez de perdre des opportunités de classement, car Google s’attend à retrouver le même contenu sur les deux versions, même si la mise en page est adaptée au mobile.

De nombreux problèmes d’indexation viennent de réglages techniques simples mal configurés. Deux des causes les plus fréquentes sont les erreurs dans le fichier robots.txt et les balises meta mal utilisées.

Nous allons commencer par le fichier robots.txt, puis nous parlerons de la balise noindex. Il existe aussi un autre élément très courant appelé balise canonique, mais nous le verrons plus en détail dans une prochaine leçon.

Le fichier robots.txt se trouve à la racine de votre site, au même endroit que le fichier de vérification de Search Console que nous avons ajouté tout à l’heure.

Il indique aux robots des moteurs de recherche quelles zones ils peuvent explorer et lesquelles ils doivent éviter. Lorsqu’il est bien configuré, il est très utile pour empêcher l’accès à certaines parties du site comme les zones d’administration ou les dossiers de test.

Le problème, c’est qu’il est très facile de faire une erreur. Une seule mauvaise règle peut bloquer des sections entières du site, voire empêcher complètement le crawl du site.

Les balises meta sont une autre source importante de problèmes, en particulier la balise noindex. Les balises meta donnent des instructions au niveau de chaque page, et la balise noindex indique à Google et aux autres moteurs de ne pas indexer une page.

Parfois, elle est utilisée volontairement, par exemple sur des pages de confirmation après un formulaire ou du contenu privé.

Le problème apparaît lorsqu’elle est ajoutée par erreur. Cela arrive souvent lorsqu’un développeur crée un nouveau site et applique une balise noindex sur l’ensemble du site pendant la phase de développement.

Puis le site est mis en ligne, le trafic chute, et personne ne comprend pourquoi rien n’est indexé.

Une autre situation fréquente concerne la création d’une nouvelle page. Le développeur ajoute une balise noindex pour éviter son indexation pendant sa création, puis oublie de la retirer lors de la mise en ligne. Résultat, la page ne s’indexe pas et la raison reste inconnue.

Si vous constatez que certaines pages ne sont pas indexées, il est donc important de vérifier votre fichier robots.txt ainsi que la présence éventuelle de balises noindex.

En résumé, vous comprenez maintenant que l’indexation signifie que vos pages sont ajoutées à l’index d’un moteur de recherche et peuvent apparaître dans les résultats. Vous savez aussi comment vérifier si une page est indexée et quels éléments contrôler si ce n’est pas le cas.

Dans la prochaine vidéo, nous verrons les sitemaps et comment ils peuvent aider les moteurs de recherche à découvrir votre contenu plus efficacement.

Leçon 3 – Qu’est-ce que l’indexation ?

Transcription

Découvrez Dan M. Jones