(+34) 91 635 52 47 info@flat101.es
¿Hablamos? (+34) 91 635 52 47 - info@flat101.es

Analítica web basada en logs y analítica web basada en javascript, pros y contras

Si me remonto a finales de los 90, cuando servidor comenzó a trabajar en esto tan bonito del “sector” web/digital, yo ya hacía uso de analítica web, pero sin ser consciente de que lo hacía (el concepto “analítica web” no se usaba, así de claro), consultando de manera periódica herramientas como Webalizer (mi favorita) o AWStats. Herramientas muy toscas en lo gráfico pero que ya aportaban información de valor acerca de los accesos que tenía un sitio web. Eran herramientas de visualización de datos procedentes del log del servidor en el que se encontraba alojado el sitio web. Datos muy básicos, pero datos.

A principios de los 2000 conocí Urchin, una herramienta de analítica web bastante más potente y con mayor capacidad que Webalizer o AWStats. Y en 2005 Urchin fue comprado por Google para dar forma a lo que hoy conocemos como Google Analytics, que fue lanzado al mercado a finales de 2005. Durante 2006 trabajé una barbaridad de horas con Google Analytics, pero simultaneamente con herramientas como AWStats o Webalizer, y en aquellas compañías donde esta situación se daba, siempre me hacían la misma pregunta, “Ricardo, ¿por qué Google Analytics me da unas visitas y AWStats me da otras, cual es el dato bueno?La respuesta es fácil, ambos datos son correctos.

Esta historia del abuelo cebolleta sirve para explicar en plan breve la diferencia entre las herramientas de analítica web basadas en datos de logs (AWStats) y herramientas de analítica web basadas en javascript (Google Analytics).

Hoy día, en el escenario de la analítica web / digital, tenemos múltiples herramientas, en las que coexisten ambos sistemas de medición, basados en logs y basados en javascript.

¿Qué miden las herramientas de analítica web basadas en logs?

Muy sencillo. Como el dibujo que encabeza este post, representa, las herramientas de analítica web basadas en logs recogen la información de la actividad del log y la representan de manera gráfica o estructurada en tablas de datos. Un archivo log es un archivo generado por el servidor que contiene un registro de todas las peticiones (llamadas hits) que recibe el servidor. Insisto, todas las peticiones, lo que incluye no solo archivos HTML, sino archivos de cualquier tipo siempre que pertenezcan al conjunto de datos que se deben solicitar para “ver” un sitio web. Los datos que se reciben se almacenan anónimamente e incluyen detalles como la fecha y hora de la petición, la IP que la hizo, la URL solicitada y el user-agent del navegador.

Imagen de como se ve un archivo log

Imagen de un archivo log. Así de bonito se ve

Básicamente, un log registra la actividad del servidor, de forma que las herramientas de analítica web basadas en este sistema en realidad representan datos acerca de los archivos y peticiones que se realizan contra el host.

OK, ¿y qué miden las herramientas de analítica web basadas en javascript?

Explicación de la analítica web basada en javascript

Un dibujo muy sencillo para explicar de manera muy básica como funciona la analítica web basada en javascript

En este bloque están las herramientas más populares del mercado, encabezadas por Google Analytics. A diferencia de las herramientas basadas en logs, que extraen la información del log, las herramientas basadas en javascript funcionan a través de un pequeño fragmento de javascript que debe ser insertado en cada uno de los documentos HTML que forman nuestro sitio web, de manera directa o via tag manager. Cada vez que un usuario solicita una URL en la que está presente ese javascript, los datos de la cabecera del navegador de ese usuario son recogidos via cookie, enviados a los servidores de Google (en el caso de Analytics) y procesados para ser impresos en un panel gráfico que es vuestro amigo Google Analytics.

Imagen del codigo de Google Analytics

Ejemplo de código clásico de Google Analytics en funcionamiento en un sitio web

En resumen, se trata de herramientas que interpretan datos procedentes de la cabecera del navegador del usuario, y juegan con estos elementos base: URLs, cookies y javascript.

Entonces, ¿miden lo mismo, sí o no?

No, no miden lo mismo. Una herramienta de analítica web basada en logs ofrece datos de peticiones que se han hecho a la máquina, al servidor que aloja el sitio web. Una herramienta de analítica web basada en javascript ofrece datos basados en las cabeceras de navegador de los usuarios que han accedido al sitio web y en los que ha podido ejecutarse el ciclo URL-javascript-cookie para recoger esa información.

Pero, ¿cual es la diferencia? No lo pillo

Muy sencillo. Una herramienta de analítica web basada en logs te dirá, por ejemplo, que la URL de la home de un sitio web se ha solicitado 400 veces, por decir algo. En el mismo periodo de tiempo, una herramienta de analítica web basada en javascript te dirá que esa misma URL se ha solicitado 300 veces, por ejemplo. ¿A qué se debe esa diferencia? Muy sencillo. El log procesa peticiones, como hemos dicho, independientemente de que éstas vengan de usuarios, bots o sistemas de navegación que no empleen javascript o cookies. Por contra, una herramienta como Google Analytics solo te dará los datos que haya podido capturar de esa triada URL-javascript-cookie. Si alguno de esos elementos ha fallado o no está presente, esa visita no será contabilizada.

Pros y contras de la analítica web basada en log y la analítica web basada en javascript

De inicio, hay que decir que ambos sistemas de medición no son sustitutivos el uno del otro, sino complementarios. No miden lo mismo, y por tanto, son sistemas de medición complementarios, que hay que emplear en función del tipo de información que necesitemos en un momento dado y según que problema debamos resolver o que ineficiencia debamos solventar.

La analítica web basada en logs nos proporciona datos muy valiosos acerca de, por ejemplo:

  • Accesos de bots a nuestro sitio web
  • Peticiones de archivos que “cuelgan” de nuestro sitio web, como PDFs o documentos
  • Errores en el sitio web vinculados a HTTP Status
  • Detalles técnicos de los accesos al sitio web: IPs, etc
  • Y sobre todo, son datos que pueden ser reprocesados todas las veces que se quiera, porque son datos 100% en bruto
Acceso de bots en AWStats

Como puede verse en la imagen, un sistema de analítica web basado en logs tan sencillo como AWStats recoge los accesos de los bots de los buscadores que se han producido

La analítica web basada en javascript es, por contra, de acceso más sencillo, muy accionable a nivel de herramienta, muy fácil de comprender por el usuario, con una curva de aprendizaje relativamente rápida. Es, por decirlo de una forma, una analítica web pensada para ser usada por personas “normales”, sin grandes conocimientos técnicos.

Dicho todo esto, parece que queda claro que ambos sistemas pueden y deben coexistir y emplearse en función de las necesidades que la evolución de un proyecto digital vaya demandando. Es lo correcto, dado que un único sistema de medición es un error en tanto en cuanto solo nos aporta una visión parcial del sitio web.

De hecho, si yo tuviera que elegir un solo sistema de medición, probablemente me decantaría por los logs… mucho más dificiles de trabajar, sí, pero mucho más fiables en términos absolutos. Aunque teniendo ambos sistemas, ¿por qué elegir?


4 respuestas a “Analítica web basada en logs y analítica web basada en javascript, pros y contras”

  1. Weky dice:

    Muy interesante!.

    El otro día leí un post de Errioxa muy bueno, de como analizar los logs y mostrar los datos en gráficas, os lo pongo para los interesados.
    http://www.mecagoenlos.com/Posicionamiento/usar-los-logs-para.php

    • Ricardo Tayar dice:

      Hola Weky, gracias por tu comentario!

      Conozco bien ese post de Lino Uruñuela del que hablas. Muy bueno. Hace poco, en Congreso Web Zaragoza y en SEOnthebeah, explico como ver datos de logs en Analytics. Es una buena solución, pero no te muestra todos los datos que puedes obtener, aunque dede luego permite acceder a datos de corte técnico en un formato “Analytics”, lo que es mucho más amable para el usuario.

      Un saludo,

      Ricardo

  2. ant dice:

    Ademas de la analitica de servidor y de cliente añadiria la del crm/erp. Aunq en Analytics se pueda hacer resulta algo costoso dado q esa no es su principal mision. No se si conoceis alguna herramienta que consolide analitica del crm/erp con logs del servidor. Mas adelante (pensando en una empresa nueva) ya si añadiria la analitica web, pero no como punto de partida.

    • Ricardo Tayar dice:

      Hola Ant! Que bueno que también nos leas por aquí.

      Totalmente de acuerdo con lo que dices. Al final, la analítica digital, como concepto general, va mucho más allá del uso de Analytics, que solo muestra una pequeña parte de los datos que afectan e inciden en un negocio digital. Para la consolidación de datos de la que hablas puedes usar por ejemplo Tableau o QlikView. Nosotros hace años diseñamos una herramienta propia para construir un CMI digital importando datos de diferentes fuentes, para que la visión de datos fuera 360 y no solo parcial.

      Espero haberte ayudado en algo. Un saludo,

      Ricardo

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Si necesitas especialistas para desarrollar o mejorar tu negocio digital, podemos ayudarte.