Krypton Solid

Lista de verificación técnica para rastreadores de SEO

La capacidad de rastreo es la base de su estrategia técnica de SEO. Los motores de búsqueda rastrearán sus páginas para recopilar información sobre su sitio.

Si estos rastreadores no pueden rastrear de alguna manera, no pueden indexar ni clasificar sus páginas. El primer paso para implementar el SEO técnico es asegurarse de que todas sus páginas importantes sean accesibles y fáciles de navegar.

A continuación, cubriremos algunos elementos para agregar a su lista de verificación, así como algunos elementos del sitio web que auditó para asegurarse de que sus páginas sean adecuadas para el rastreo.

1. Cree un mapa del sitio XML.

¿Recuerdas la estructura del sitio por el que pasé? Esto pertenece a algo llamado año Mapa del sitio XML que ayuda a los robots de búsqueda a comprender y rastrear sus páginas web. Puede considerarlo como un mapa para su sitio. Enviará su mapa del sitio a Consola de búsqueda de Google y Herramientas de Bing para webmasters una vez que esté completo. Recuerde mantener actualizado el mapa del sitio a medida que agrega y elimina páginas web.

2. Maximice su presupuesto de acceso de rastreo.

Su presupuesto de rastreador se refiere a las páginas y los recursos de su sitio los rastreadores rastrearán.

Dado que su presupuesto de rastreo no es infinito, asegúrese de priorizar las páginas de rastreo más importantes.

A continuación, se ofrecen algunos consejos para asegurarse de maximizar el presupuesto de acceso del rastreador:

  • Elimina o canoniza páginas duplicadas.
  • Repara o redirige los enlaces rotos.
  • Asegúrese de que sus archivos CSS y Javascript se puedan rastrear.
  • Verifique sus estadísticas de acceso de rastreo con regularidad y vea si hay caídas o aumentos repentinos.
  • Asegúrese de que cualquier bot o página que haya prohibido el rastreo esté destinado a ser bloqueado.
  • Mantenga su mapa del sitio actualizado y envíelo a las herramientas para webmasters adecuadas.
  • Recorta tu sitio de contenido inútil o desactualizado.
  • Tenga cuidado con las URL generadas dinámicamente, que pueden hacer que el número de páginas de su sitio se dispare.

3. Optimice la arquitectura de su sitio.

Su sitio tiene varias páginas. Estas páginas deben estar organizadas de manera que permitan a los motores de búsqueda encontrarlas y rastrearlas. Aquí es donde entra en juego la estructura de su sitio, a menudo llamada arquitectura informativa de su sitio.

De la misma forma que un edificio se basa en el diseño arquitectónico, arquitectura del sitio es cómo organiza las páginas de su sitio.

Las páginas relacionadas están agrupadas; por ejemplo, la página de inicio de su blog envía a publicaciones de blog individuales, cada enlace a las páginas respectivas del autor. Esta estructura ayuda a los motores de búsqueda a comprender la relación entre sus páginas.

La arquitectura de su sitio también debe moldear y ser moldeada por la importancia de las páginas individuales. Cuanto más cerca esté la página A de su página de inicio, más páginas enlazan con la página A y más equidad de enlace estas tienen las páginas, por lo que los motores de búsqueda le darán más importancia a la página A.

Por ejemplo, un enlace desde su página de inicio a la Página A demuestra más importancia que un enlace desde una publicación de blog. Cuantos más enlaces a la página A, más «significativa» se vuelve la página para los motores de búsqueda.

Conceptualmente, la arquitectura de un sitio podría verse así, donde Acerca de, producto, noticias, etc., las páginas se colocan en la parte superior de la jerarquía de importancia de la página.

Fuente

Asegúrese de que las páginas más importantes para su empresa estén en la parte superior de la jerarquía con los enlaces más internos (¡relevantes!).

4. Establezca una estructura de URL.

Estructura de URL se refiere a cómo estructura sus URL, que quizás determinado por la arquitectura de su sitio. Explicaré el enlace en un momento. Primero, aclaremos que las URL pueden tener subdirectorios, como blog.hubspot.comy / o subcarpetas, como hubspot.com/blog, que indica a dónde va la URL.

Por ejemplo, una publicación de blog titulada Cómo cuidar a tu perro ingresaría un subdominio o subdirectorio de blog. La URL podría ser www.bestdogcare.com/blog/how-to-groom-your-dog. Mientras que una página de producto en el mismo sitio sería www.bestdogcare.com/products/grooming-brush.

Si usa subdominios o subdirectorios o «productos» versus «tienda» en su URL, depende completamente de usted. La belleza de crear su propio sitio web es que puede crear sus propias reglas. Lo importante es que esas reglas sigan una estructura unificada, lo que significa que no debe cambiar entre blog.yourwebsite.com y yourwebsite.com/blogs en diferentes páginas. Cree una hoja de ruta, aplíquela a la estructura de su URL y cúmplala.

A continuación, se ofrecen algunos consejos adicionales sobre cómo escribir URL:

  • Utilice caracteres pequeños.
  • Utilice guiones para separar las palabras.
  • Hágalas breves y descriptivas.
  • Evite el uso de palabras o caracteres innecesarios (incluidas las preposiciones).
  • Incluya sus palabras clave objetivo.

Una vez que haya habilitado la estructura de la URL, enviará a los motores de búsqueda una lista de las URL de sus páginas importantes como Mapa del sitio XML. Esto le da a los robots de búsqueda un contexto adicional sobre su sitio, por lo que no tienen que averiguarlo mientras rastrea.

5. Utilice robots.txt.

Cuando un rastreador web rastrea su sitio, primero verificará /robot.txt, también conocido como Protocolo de exclusión de robots. Este protocolo puede permitir o prohibir que ciertos rastreadores web rastreen su sitio, incluidas ciertas secciones o incluso páginas de su sitio. Si desea evitar que los robots indexen su sitio, utilizará una metaetiqueta de robots noindex. Analicemos ambos escenarios.

Es posible que desee bloquear ciertos robots para que no rastreen su sitio. Desafortunadamente, hay algunos robots maliciosos: robots que raspan su contenido o foros de la comunidad de spam. Si nota este mal comportamiento, utilizará robot.txt para evitar que ingrese a su sitio web. En este escenario, puede pensar en robot.txt como su campo de fuerza de los robots malos en Internet.

En términos de indexación, los rastreadores rastrean su sitio para recopilar pistas y encontrar palabras clave para que puedan hacer coincidir sus páginas web con consultas de búsqueda relevantes. Pero, como veremos más adelante, tiene un presupuesto de rastreador que no desea gastar en datos innecesarios. Por lo tanto, es posible que desee excluir páginas que no ayuden a los robots de búsqueda a comprender de qué se trata su sitio, por ejemplo, un Gracias página de una oferta o una página de inicio de sesión.

No importa que tu El protocolo robot.txt será único dependiendo de lo que quieras lograr.

6. Agregue el pan rallado.

Recuerda la vieja fábula Hansel y Gretel donde dos niños arrojaron migas de pan al suelo para encontrar el camino de regreso a casa? Bueno, estaban tramando algo.

Las migajas son exactamente como suenan: una ruta que guía a los usuarios de regreso al comienzo de su viaje en su sitio. Es un menú de página que les dice a los usuarios cómo vincular su página actual con el resto del sitio.

Y no es solo para los visitantes del sitio web; los robots de búsqueda también los utilizan. breadcrumb-menu-navigation-técnica-seo

Fuente

Las migas de pan deben ser dos cosas: 1) visibles para los usuarios para que puedan navegar fácilmente por sus páginas web sin usar atrás y 2) tener un lenguaje de marcado estructurado para proporcionar un contexto preciso a los motores de búsqueda que rastrean su sitio.

¿No estás seguro de cómo agregar datos estructurados a las rutas de navegación? Utilice esta guía para BreadcrumbList.

7. Utilice la paginación.

¿Recuerda cuando los profesores le pedían que numerara las páginas de su trabajo de investigación? A esto se le llama paginación. En el mundo técnico del SEO, la paginación tiene un papel ligeramente diferente, pero aún puedes pensar en ella como una forma de organización.

La paginación utiliza código para informar a los motores de búsqueda cuando las páginas con distintas URL están vinculadas entre sí. Por ejemplo, puede tener una serie de contenido que divide en capítulos o en varias páginas web. Si desea facilitar que los robots de búsqueda descubran y rastreen estas páginas, entonces utilizará la paginación.

La forma en que funciona es bastante simple. Irás a de la primera página de la serie y utilizar

rel = «siguiente» para decirle al motor de búsqueda qué página rastrear por segundo. Luego, en la segunda página, usará rel = «anterior» para indicar la página anterior y rel = «siguiente» para indicar la página siguiente y así sucesivamente.

Se ve como esto…

En la página uno:

 

 

<link rel=“next” href=“https://www.website.com/page-two” />

En la segunda página:

 

 

<link rel=“prev” href=“https://www.website.com/page-one” />

<link rel=“next” href=“https://www.website.com/page-three” />

tenga en cuenta que paginación es útil para rastrear, pero Google ya no lo admite para agrupar páginas indexadas como antes.

8. Verifique los archivos de registro de SEO.

Puede pensar en los archivos de registro como una entrada de registro. Los servidores web (registro) registran y almacenan datos de registro sobre cada acción que realizan en su sitio en archivos de registro (registro). Los datos registrados incluyen la hora y la fecha de la solicitud, el contenido solicitado y la dirección IP solicitante. También puede identificar el agente de usuario, que es un software de identificación única (como un robot de búsqueda, por ejemplo) que satisface la solicitud de un usuario.

Pero, ¿qué tiene esto que ver con el SEO?

Bueno, los motores de búsqueda dejan un rastro en forma de archivos de registro cuando rastrean su sitio. Puede determinar si, cuándo y qué se rastreó comprobando los archivos de registro y filtrando por agente de usuario y motor de búsqueda.

Esta información es útil para usted porque puede determinar cómo se gasta su presupuesto de rastreo y a qué barreras se enfrenta o accede un rastreador. Para acceder a sus archivos de registro, puede preguntarle a un desarrollador o utilizar un analizador de archivos de registro, como La rana que grita.

El hecho de que un motor de búsqueda pueda rastrear su sitio no significa necesariamente que pueda indexar todas sus páginas. Echemos un vistazo a la siguiente capa de su auditoría técnica de SEO: indexabilidad.

< Lista de verificare a indexării bazelor tehnice SEO >

Publicado originalmente el 11 de noviembre de 2019 12:45:00 p.m., actualizado el 26 de marzo de 2020

Deja un comentario