¿Cómo superar un error 403?

error 403 rastreo

Tenemos que admitir que, si en algún momento Google se revuelve contra un sitio web y le aplica una de sus famosas sanciones, el SEO encargado del susodicho sitio web seguramente tendrá una idea más o menos precisa acerca de qué es lo que puede haber ocurrido. Es decir, si un SEO se levanta una mañana y descubre que el posicionamiento de su sitio web ha tenido una caída dramática, tan dramática que sólo se puede achacar a un airado castigo por parte de los chicos de Mountain View, es bastante probable que, en el mismo momento de ser consciente de esa caída el SEO en cuestión ya tenga una cierta noción acerca de qué puede haber provocado la furia del buscador.

Quizás Google no siempre sea del todo claro a la hora de hablarnos sobre las mejores prácticas de posicionamiento (y dentro de esta falta de claridad el espectro va de lo ambiguo a lo utópico). Pero también es cierto que las líneas rojas sí están meridianamente bien trazadas. Es decir, puede que no nos dé un mapa indudable sobre qué es lo que debemos hacer para mejorar nuestros rankings, pero sí tenemos una lista bastante detallada acerca de qué prácticas Google se considera libre de penalizar. Por lo tanto, si un sitio sufre una sanción de Google, el SEO encargado de ese sitio probablemente sí sabrá, desde el primer momento, cuál es la razón del castigo (¿se habrá portado mal con los links?, ¿habrá contenido en su página que no es todo lo visible que debería ser?).

Pero… ¿Qué pasa si el SEO en cuestión se ha mantenido perfectamente fiel a las recomendaciones y buenas prácticas sugeridas por los buscadores y, aun así, se encuentra con que es víctima de represalias por parte del buscador?

Es cierto que, en ocasiones, el departamento de SEO no tiene un control total sobre un proyecto. El SEO puede ser una pieza más de un proyecto en el que diferentes departamentos trabajan con objetivos y plazos que hay que cuadrar. El SEO, a menudo, es un paso más en la optimización del contenido.

De vez en cuando, dentro de un proyecto de envergadura, a alguien se le ocurrirá que, puesto que el departamento SEO está tan empeñado en tener contenido, quizás bastará con colocar unos párrafos detrás de una imagen o hacer un poco de cloaking. El responsable de estas ideas no tendrá intenciones aviesas. Al contrario, lo más probable es que estas ideas se le hayan ocurrido en algún momento particularmente lúcido y que, en ese momento, se haya sentido de lo más contento con su arranque de creatividad. Hay que reconocer que estas tácticas implican un notable nivel de inventiva, sobre todo si no se ha tenido contacto previo con esta clase de estrategias.

La moraleja de todo esto es que, en proyectos de envergadura, una parte de trabajo del SEO pasa por la “evangelización” de los principios del SEO y por establecer buenos flujos de información con el resto de departamentos.

Buscando culpables. El dedo acusador.

Lo que sigue está basado en hechos reales. Nos encontramos el caso de un cliente que, de la noche a la mañana, había experimentado una caída dramática en su posicionamiento. El desplome no sólo había afectado a las kw que se habían ido posicionando, sino incluso al posicionamiento de las kw branded.

Como decíamos arriba, la primera reacción es repasar mentalmente si acaso hemos podido hacer mal. ¿Hay algo que hubiese podido provocar un castigo por parte de Google? Bien, puede que el departamento de SEO no tenga conciencia de nada en concreto pero ya sabemos que hay ocasiones en las que el SEO no es el único agente implicado en una página.

Analizando el error

En nuestro caso, la primera pista de valor la obtuvimos al observar que, si bien nuestra marca había perdido su posicionamiento, por el contrario había “resurgido” la URL de uno de nuestros dominios, que había desaparecido tiempo atrás. Se trataba de una de las antiguas páginas de la marca, que habíamos redirigido a la página actual y que, ahora, volvía a aparecer indexada en el buscador. Ya teníamos una primera pista: algo estaba pasando con las redirecciones.

El siguiente paso fue ir a revisar qué pistas nos daba Webmaster Tools. Mientras tanto, informamos al departamento técnico de que había algún problema con una redirección en concreto, que había dejado de apuntar a nuestra página y había “recobrado vida”.

Dentro de WMT observamos que el robot no estaba consiguiendo entrar en nuestra página. Dentro de la sección “Rastreo” en “Explorar como Google” pudimos comprobar que algo estaba dejando al robot fuera de nuestra página.

 

Error 403 al rastrear como google

 

El siguiente paso parecía obvio: comprobar qué errores de rastreo había provocado la falta de acceso del robot. Vimos que, durante el fin de semana (este error se detectó un lunes) el robot se había dedicado a pedir acceso una y otra vez a nuestra página y que esta se lo había negado recurrentemente. El resultado: más de 30.000 errores 503 en unas 48 h que habían ido eliminando, poco a poco, nuestros resultados del buscador.

De nuevo, acudimos al departamento técnico con un listado de sugerencias. En este momento ya sabíamos algo: no habíamos sido sancionados por Google (buena noticia), sino que algo, todavía desconocido, estaba provocando que el robot no pudiese acceder a nuestra página (mala noticia). Enviamos un listado de posibles errores, mientras revisábamos aquellos puntos que, como departamento SEO, nos resultaban más conocidos: sitemap, robots.txt, log…

Una vez descartados los sospechosos habituales nos enfrentamos al hecho de que había dos síntomas, aparentemente desconectados: por una parte, el robot de Google no podía rastrear nuestra web, por otra teníamos una redirección que estaba fallando, lo cual había provocado que una web redirigida a nuestra web hubiese sido reindexada por Google. Un dato nuevo es que, al acceder a la URL redireccionada el servidor nos devolvía un error de redirección en bucle. Todo apuntaba a que, fuese cual fuese el error, debía ser algo que implicase ambos factores: una redirección había bloqueado a Google.

Finalmente encontramos el error. De alguna forma la famosa redirección se había modificado provocando un redireccionamiento en bucle. Al dejar de apuntar a nuestro sitio, Google volvió a indexar la antigua URL, pero el bucle provocó que el sistema de seguridad del servidor ¡confundiese el bot de Google con un ataque DoS!. La solución fue, por tanto, rápida: sólo tuvimos que volver a dar acceso al robot de Google.

Error 403. Las consecuencias

Durante el tiempo que sufrimos esta crisis de error 403 el error la página se desindexó rapidísimamente. En apenas un par de días la página desapareció casi absolutamente de los resultados de Google. Para ayudar a la reindexación solicitamos al equipo de RRSS que volviese a colgar una selección de URL en Google+ mientras utilizábamos Webmastertools para intentar volver a procesar las URL de la página. En definitiva, empezamos a hacer señales de humo.

En los gráficos vemos cómo, durante esos días, perdimos una buena parte de nuestro ranking y que, cuando solucionamos el problema, la recuperación no fue, ni mucho menos inmediata.

Consecuencias del error 403

Es más, si revisamos el gráfico que SEMRush nos da acerca del posicionamiento de todas las kw que tenemos entre los veinte primeros resultados vemos cómo el error trunca una racha claramente ascendente. Un mes después, los resultados de posicionamiento todavía estaban por debajo de nuestros resultados del mes anterior. La gráfica revela también que el error provocó el descenso más acusado de posicionamiento de la página a lo largo de toda su historia.

Consecuencias en las keywords del error 403

Error 403. ¿Qué podemos aprender?

De esta crisis podemos deducir una pequeña checklist acerca de cómo afrontar una inesperada e inexplicable desindexación

● Comprobar en webmaster tools el tipo de error que ha provocado la caída
● Revisión simultánea de aspectos técnicos y SEO
● Comprobar Sitemaps
● Comprobar robots.txt
● Comprobar logs
● Comprobar DNS (durante nuestra investigación descubrimos que, en algunos casos, han provocado errores 403, aunque no fue nuestro caso).
● Comprobar que nuestro sistema de seguridad no esté vetando el acceso al bot de Google.


Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Si necesitas especialistas para desarrollar o mejorar tu negocio digital, podemos ayudarte