Leçon 2 – Comment Googlebot explore le web

Transcription

Avant que vos pages puissent apparaître dans les résultats de recherche Google, Google doit d’abord les trouver. C’est le processus dont nous avons parlé dans la vidéo précédente, appelé le crawl, et qui constitue la base de tout le reste en SEO.

Si Googlebot ne peut pas accéder à vos pages, elles n’apparaîtront pas lorsque vos clients potentiels recherchent ce que vous proposez. Peu importe la qualité de votre contenu. S’il ne peut pas être exploré, c’est comme s’il n’existait pas.

Une bonne façon de comprendre cela est d’imaginer un magasin sans routes ni chemins pour y accéder. Les produits peuvent être excellents, mais si personne ne peut y aller, personne n’achètera quoi que ce soit. C’est pour cela qu’il est si important de comprendre comment fonctionne Googlebot.

Et une fois que vous comprenez le crawl, vous pouvez prendre de meilleures décisions pour votre site sans avoir à deviner.

À la fin de cette vidéo, vous comprendrez clairement ce qu’est le crawl et comment Googlebot découvre vos pages.

Googlebot est le robot d’exploration de Google. C’est un programme automatisé qui parcourt internet en visitant des sites web et en collectant des informations sur leurs pages. Son rôle est très simple. Il trouve des pages, les lit, puis envoie ces informations à Google pour qu’il décide comment elles doivent apparaître dans les résultats de recherche.

Ce processus de découverte des pages est ce que l’on appelle le crawl. Googlebot se déplace sur le web en suivant des liens, un peu comme une personne qui clique de page en page. Lorsqu’il visite une page, il analyse le texte, les images et le code, puis transmet ces données à Google pour une analyse plus approfondie.

Aujourd’hui, la majorité des sites sont explorés avec Googlebot smartphone. Cela signifie que Google se base principalement sur la version mobile de votre site et non sur la version desktop. C’est pour cela que l’optimisation mobile n’est plus une option.

Si votre site ne fonctionne pas correctement sur mobile, cela peut directement affecter la manière dont Google le comprend et l’explore.

Il existe plusieurs façons pour Googlebot de découvrir des pages. Dans cette partie, nous allons voir les plus courantes.

La première est en suivant les liens. Comme vous cliquez sur un lien pour passer d’une page à une autre, Googlebot fait la même chose pour trouver du nouveau contenu. Il peut s’agir de liens internes qui relient les pages de votre site entre elles, ou de backlinks externes provenant d’autres sites qui pointent vers le vôtre.

Un point important à retenir est que si vous avez des pages sur votre site qui ne sont reliées à aucune autre, que l’on appelle pages orphelines, Googlebot peut ne jamais les trouver. C’est pour cela que nous verrons plus en détail les liens internes plus tard dans ce cours.

La deuxième manière pour Googlebot de trouver des pages est via un sitemap XML. Comme son nom l’indique, il s’agit d’une liste des pages de votre site que vous souhaitez faire connaître à Google.

Une fois votre sitemap créé, vous pouvez le soumettre via un outil appelé Google Search Console, que nous étudierons également plus en détail plus tard dans ce cours. La plupart des sites, surtout ceux créés avec des systèmes de gestion de contenu comme WordPress, Joomla ou Magento, disposent d’un sitemap automatique. Cela signifie que les pages y sont ajoutées ou supprimées automatiquement lorsque vous modifiez votre site.

C’est très utile, car cela permet à Google de rester à jour sur les pages disponibles sur votre site.

La troisième méthode consiste à demander manuellement à Google d’explorer une page en utilisant l’outil d’inspection d’URL dans Google Search Console. Il suffit de coller l’URL de la page puis de cliquer sur « demander une indexation ».

C’est particulièrement utile lorsque vous publiez une nouvelle page ou que vous apportez des modifications importantes à une page existante et que vous souhaitez que Google la vérifie rapidement.

Les liens internes ne servent pas uniquement à aider Googlebot à trouver des pages. Ils aident aussi Google à comprendre quelles pages sont les plus importantes sur votre site. Vous pouvez considérer vos liens internes comme des signaux d’importance. Lorsque vous faites plusieurs liens vers une même page, vous indiquez à Google qu’elle mérite une attention particulière.

Par exemple, imaginez un site qui vend des machines à café. Si les articles de blog, les pages de catégories et d’autres contenus renvoient régulièrement vers une page intitulée « meilleures machines à café pour les bureaux », Google peut logiquement considérer que cette page est importante.

Cela dit, les liens internes doivent toujours être utilisés de manière pertinente pour les utilisateurs. Ajouter des liens uniquement pour le SEO sans réelle logique peut faire plus de mal que de bien. Ils doivent aider les visiteurs à naviguer plus facilement et à mieux comprendre votre site.

Le budget de crawl correspond au nombre de pages que Googlebot va explorer sur votre site sur une période donnée. Google ne dispose pas de ressources illimitées et doit donc décider combien d’attention accorder à chaque site.

Pour la plupart des sites de petite et moyenne taille, ce n’est pas un sujet dont vous devez vous préoccuper. Si votre site compte moins d’environ 10 000 pages, Google est généralement très efficace pour l’explorer correctement.

En revanche, si votre site dépasse les 10 000 pages, il peut être utile de s’intéresser au budget de crawl. Mais cela dépasse le cadre de ce cours, car cela ne concerne pas la majorité des personnes qui regardent cette formation.

À ce stade, vous comprenez déjà mieux le crawl et la manière dont Google découvre les pages que la grande majorité des personnes travaillant en SEO. Dans la prochaine vidéo, nous verrons l’indexation et comment Google décide si une page peut apparaître dans les SERP.

Leçon 2 – Comment Googlebot explore le web

Transcription

Découvrez Dan M. Jones