Revisión del experimento SEO con enlaces (un mes después)

Revisión del experimento SEO con enlaces (un mes después)

Tras ampliar el experimento SEO con enlaces internos un mes más, toca revisar los resultados obtenidos ¿Cuáles han sido los resultados?

Punto de partida, ¿qué vimos en el experimento inicial?

Este experimento parte de los resultados que analizamos en la fase previa. De estos análisis pudimos pudimos comprobar que:

  • Google ve y sigue las URLs de los eventos “onclick” empleadas en etiquetas <span>
  • Google NO sigue las URLs de los eventos “onclick” si se emplean en etiquetas <button>

Mi hipótesis

La falta de relevancia de esta web en general y de la URL del experimento en concreto, hace que Google no destine recursos necesarios y no analiza en profundidad la URL. Por ello no detecta las URLs presentes de forma explícita en todos los eventos “onClick” declarados en el código fuente de la URL del experimento.

Re-Experimentando

Para revisar si se trataba de un problema de relevancia de la URL original del experimento, seleccioné una de las URLs más relevantes de esta web (WordPress Multisite para SEO) e introduje –como en el experimento original– un “pseudo enlace” creado con una etiqueta <button> que emplea un evento onClick=”location.href=’https://comunycaos.com/parte3-historia.html'”, tal que así:

<button style="border: 0px;background-color: #ffffff;" id="tercero" onclick="location.href='https://comunycaos.com/parte3-historia.html'">Parte 3 de la historia</button>

Para curarme en salud y evitar que Google pudiese leer la URL del experimento tras escribirla en el post donde explico el experimento, añadí espacios en blanco entre cada letra de la URL que aparecía escrita en dicho post.

Un mes después… ¡A revisar se ha dicho!

Tras un mes desde que comenzara el re-experimento (desde el 9 de agosto al 9 de septiembre de 2019), comencé a analizar los datos de Google Search Console, los datos que arrojaba el comando “site:comunycaos.com” y los logs del servidor de la web. De todo esto he podido concluir lo siguiente:

  • En Google Search Console no hay rastro de la URL definida en el pseudo-enlace. Es decir: “https://comunycaos.com/parte3-historia.html”
  • El comando “site:comunycaos.com” tampoco daba señales de vida de la URL.
  • Los Logs analizados con Screaming Frog Log File Analyzer no mostraban ni un solo “toque” a dicha URL por parte de Bots, ni GoogleBot, ni BingBot, ni nada que se le parezca.
  • Los logs analizados muestran que sí se han rastreado de forma periódica las URL del experimento original y la URL de mayor relevancia empleada para la revisión del experimento, ergo, sige sin “tocar a la puerta” de la URL definida en el onclick del <button> definido para el experimento.

In-conclusiones y nueva hipótesis

Después de analizar por enésima vez los logs y comprobar que Google sigue revisitando las URLs que contienen los enlaces de los experimentos, sin llegar a rastrear dichas URLs, la teoría de “falta de relevancia” la dejaré en la reserva.

Por otro lado, tampoco me aventuro a afirmar que Google lee los eventos onclick en algunas etiquetas HTML como <div> o <span>, pero no de <button>.

Hola, Google, ¿me lees?

Mi nueva hipótesis es que Google va a leer la URL de este mismo post. Para ello, nada más publicar esta revisión forzaré la exploración de la misma, para que Google se ponga las pilas cuanto antes. ¿Encontrará por fin Google la URL https://comunycaos.com/parte3-historia.html? ¡Hagan sus apuestas!

Actualización tras las últimas pruebas (21 de octubre de 2019)

En todo el tiempo transcurrido tras esta revisión del experimento y pese a las sucesivas hipótesis que fueron surgiendo, puedo decir que:

  • Según logs del servidor, ningún bot de Google ha pasado a visitar la URL “parte3-hstoria.html”
  • Como se esperaba, tampoco han sido detectadas las demás URLs: “parte4-historia.html” y “parte1-historia..html”.
  • En este periodo, pese a haber sido descubierta, explorada e indexada, la URL “parte2-historia.html” tampoco ha sido revisitada por los bots de Google. Es más, para más júbilo de este experimento, en estre transcuros la URL “parte2-historia.html” ha desaparecido del índice de Google y ahora aparece en GSC como “URL rastreada actualmente sin indexar”:
URL rastreada actualmente sin indexar del experimento SEO con enlaces
URL rastreada actualmente sin indexar del experimento.

Quizás, como ya apuntaba en los inicios del experimento, la clave sea el volumen y popularidad del sitio. Seguramente en una web cuyo contenido se renueva de manera frecuente y mejor posicionada, obtenga unos resultados bastante diferentes a los que yo he obtenido con este experimento.

¡2ª Actualización ¿in?esperada! (4/12/2019)

¡Sorpresa, sorpresa…! Apenas una semana después de dar por zanjado el experimento y de esbozar ms in-conclusiones, el día 3 de noviembre sonó la campana:

Log de la visitilla – descubrimiento que ha hecho GoogleBot de la URL del experimieto “parte3-historia.html”

Pues sí, como pude comprobar mediante un comando “site:comunycaos.com” al inicio de diciembre, Google había explorado por primera vez la URL “parte3-historia.html” (publicada allá por el mes de mayo). Tras analizar el log del servidor y revisar la caché de la URL indexada, se confirmó: GoogleBot Mobile había visitado la URL por fin.

¿Cómo la encontró? Buena pregunta. Puedo imaginar que la tuviera previamente “fichada” y en cola para ser explorada, pues el log del 3 de noviembre muestra que el bot de Google sólo accedió a:

  • https://comunycaos.com/
  • https://comunycaos.com/amp/
  • https://comunycaos.com/parte3-historia.html
  • Adicionalmente, también accedión a ficheros .css y .js
Logs correspondientes a GoogleBot Mobile el 3 de noviembre.

Sea como fuere, este experimento ha dado tantos giros que resulta imposible saber si Google detectó la URL por haberla leído del código del enlace <span> con evento onclick, o símplemente la localizó por el hecho de estar presente como texto plano en las páginas de seguimiento del experimento. En cualquier caso, puedo descartar que esta URL fuera enlazada (<a>) en este sitio o web externos.

En resumen, que aquí tenemos en Google Search Console el resultado mencionado:

Informe de cobertura de Google Search Console con la URL “parte3-historia.html” indexada.

Dato curioso en relación al experimento

Como curiosidad, en uno de los proyectos que trabajo a diario pude observar en GSC, cómo en el renderizado de la página que realiza Google, este acciona un botón simulado similar al empleado en este experimento: una etiqueta <span> con un atributo “onclick”.

Se trata de un “falso botón” que se emplea para aceptar la política de cookies. Al clicar dicho botón, la web instala una cookie en el navegador que comprueba para evitar que se vuelva a mostrar la bara de la politica de cookies.

¿Por qué supongo que Google está clicando ese botón? Por lo siguiente:

  • Si el botón de la política de cookies se acepta, la web aloja una cookie en el navegador.
  • En la siguiente recarga o navegación por la web, esta comprueba que la cookie exista.
  • Si la cookie existe, la web no muestra la barra de la política de cookies. Y no sólo deja de aparecer la barra visualmente, sino que en el código HTML (no renderizado), el fragmento correspondiente a la barra de cookies ya no aparece.
  • Al explorar cualquer URL del proyecto en Google Search Console, pude observar que no aparecía la barra de la política de cookies. Además, en el código HTML que ve Google tampoco aparece el fragmento correspondiente a dicha barra, por lo que podemos suponer que Google “ha aceptado” la política de cookies mediante el click al “falso botón” <span onclick=”…”>

¿Estaré en lo cierto o loco? Quién sabe. Sea como fuere sólo espero que os haya resultado interesante y os despierte la curiosidad. Si tienes alguna duda o aportación no dudes en darme un toque por Twitter.

Deja una respuesta