Transcripción
Antes de que tus páginas puedan aparecer en los resultados de búsqueda de Google, primero Google necesita encontrarlas. Este es el proceso del que hablamos en el vídeo anterior, conocido como rastreo, y es la base de todo lo demás en SEO.
Si Googlebot no puede acceder a tus páginas, no aparecerán cuando tus clientes potenciales estén buscando lo que ofreces. No importa lo bueno que sea tu contenido. Si no se puede rastrear, es como si no existiera.
Una buena forma de entenderlo es pensar en una tienda que no tiene carreteras ni caminos que lleven hasta ella. Los productos pueden ser excelentes, pero si nadie puede llegar, nadie va a comprar nada. Por eso es tan importante entender cómo funciona Googlebot.
Y una vez que entiendas el rastreo, podrás tomar mejores decisiones sobre tu sitio web sin tener que adivinar.
Cuando termines de ver este vídeo, vas a entender claramente qué es el rastreo y cómo Googlebot descubre tus páginas.
Googlebot es el rastreador web de Google. Es un programa automatizado que explora Internet visitando sitios web y recopilando información sobre sus páginas. Su trabajo es bastante simple. Encuentra páginas, las lee y luego envía esa información a Google para que pueda decidir cómo deben aparecer en los resultados de búsqueda.
Este proceso de descubrir páginas es lo que llamamos rastreo. Googlebot se mueve por la web siguiendo enlaces, de forma similar a como una persona hace clic de una página a otra. Cuando visita una página, analiza elementos como el texto, las imágenes y el código, y luego envía esos datos a Google para su análisis.
Hoy en día, la mayoría de los sitios web se rastrean usando Googlebot smartphone. Esto significa que Google analiza principalmente la versión móvil de tu sitio y no la versión de escritorio. Por eso, la usabilidad móvil ya no es algo opcional.
Si tu sitio no funciona bien en un móvil, puede afectar directamente a cómo Google lo entiende y lo rastrea.
Hay varias formas en las que Googlebot descubre páginas. En esta parte del vídeo vamos a ver algunas de las más comunes.
La primera es siguiendo enlaces. Igual que tú haces clic en un enlace para ir de una página a otra, Googlebot sigue enlaces para encontrar contenido nuevo. Estos pueden ser enlaces internos, que conectan páginas dentro de tu propio sitio web, o enlaces externos, también conocidos como backlinks, que provienen de otros sitios web que enlazan al tuyo.
Un punto importante aquí es que si tienes páginas en tu sitio web que no están enlazadas desde ningún otro lugar, conocidas como páginas huérfanas, Googlebot puede que nunca las encuentre. Por eso veremos los enlaces internos con más detalle más adelante en este curso.
La segunda forma en la que Googlebot encuentra páginas es a través de un sitemap XML, que es exactamente lo que parece. Básicamente, es una lista de todas las páginas de tu sitio web que quieres que Google conozca.
Una vez que tienes tu sitemap, puedes enviarlo a través de una herramienta llamada Google Search Console, que también veremos con más detalle más adelante en este curso. La mayoría de los sitios web, especialmente los creados con sistemas de gestión de contenido como WordPress, Joomla o Magento, tienen un sitemap automático. Esto significa que las páginas se añaden o eliminan automáticamente a medida que haces cambios en tu sitio web.
Esto es muy útil porque mantiene a Google actualizado sobre qué páginas están disponibles en tu sitio en ese momento.
La tercera forma es solicitando manualmente a Google que rastree una página usando la herramienta de inspección de URL que también está dentro de Google Search Console. Solo tienes que pegar la URL de la página y hacer clic en solicitar indexación.
Esto es especialmente útil cuando has publicado una página nueva o has hecho cambios importantes en una página existente y quieres que Google la revise lo antes posible.
Los enlaces internos hacen más que ayudar a Googlebot a encontrar páginas. También ayudan a Google a entender qué páginas son más importantes en tu sitio web. Puedes pensar en los enlaces internos como señales de importancia. Cuando enlazas a una página varias veces dentro de tu sitio, le estás diciendo a Google que esa página merece atención.
Por ejemplo, imagina un sitio web que vende máquinas de café. Si las entradas del blog, las páginas de categoría y otros contenidos enlazan con frecuencia a una página llamada mejores máquinas de café para oficinas, Google puede asumir razonablemente que esa página es importante.
Dicho esto, los enlaces internos siempre deben usarse de una forma que también tenga sentido para los usuarios. Añadir enlaces solo por SEO sin relevancia real suele hacer más daño que bien. Los enlaces internos deben ayudar a las personas a navegar por tu sitio web y entenderlo mejor.
El crawl budget se refiere a cuántas páginas Googlebot rastrea en tu sitio web dentro de un periodo de tiempo determinado. Esto se debe a que Google no tiene recursos ilimitados y necesita decidir cuánta atención le va a dar a cada sitio web.
Para la mayoría de los sitios web pequeños y medianos, el crawl budget no es algo de lo que tengas que preocuparte. Si tu sitio tiene menos de unas 10.000 páginas, Google suele rastrearlo de forma bastante eficiente.
Pero si tu sitio tiene más de 10.000 páginas, puede que quieras investigar más sobre el crawl budget. Aun así, esto queda fuera del alcance de este curso, ya que no aplica a la gran mayoría de las personas que están viendo esto.
De hecho, a estas alturas ya entiendes más sobre el rastreo y cómo Google encuentra páginas que la mayoría de las personas que trabajan en SEO. Y en el siguiente vídeo vamos a aprender sobre la indexación y cómo Google decide si una página puede aparecer en las SERP.