Dic 01 2009
Las distintas formas de obtener los datos. Diferencias entre la medición por logs y tags
Antecedentes.
A mediados de la década del noventa se comienza a medir la audiencias de los sitios web mediante el análisis de los registros de los servidores web, conocidos por logs files, por su nombre en inglés, con estos datos se comienza a obtener respuestas a las interrogantes comunes en un inicio de cuantos usuarios me visitan, me están visitando, o quien me visita.
A medida que la web se convirtió en un medio de comunicación global, cualquier entidad coloca su información en Internet, puede competir sin importar su tamaño y necesita más que respuestas sencillas para poder optimizar su posición.
Diferencias en la medición vía logs y tags.
Estos dos estándares son los más utilizados, y los dos tienen limitaciones. La medición por tags se implementa introduciendo un código JavaScript en cada una de las páginas que quieran ser auditadas, este código le envía una petición al servidor almacenando los datos de las visitas.
Mientras tanto la medición vía log tiene se nutre de la información generada en el archivo log del servidor, esta es analizada y representada en forma de reportes a los usuarios finales.
Medición a través de logs
Ventajas
- Implementación sin necesidad de tocar las páginas
- No hay que incluir ningún código. El programa gestiona la interrogación del archivo de log de forma programada.
- Informes de código de error, ancho de banda y carga del servidor
Ofrece informes de errores a la hora de ejecutar las páginas muy valiosos para detectar errores. - Registra descargas sin necesidad de etiquetarlas
Registra las descargas de todo tipo de archivos (se puede actualizar la lista) con detalles de nivel de descarga (total o parcial) y la actividad de formularios enviados a través de la web. - Permite reprocesar los datos
Los archivos de logs están en tu servidor y los puedes reprocesar cuando quieras aplicando los filtros que necesites sin la pérdida de datos. - No hay problemas con sistemas de seguridad
Inconvenientes
- Por lo general información menos exacta sobre el usuario.
Problemas al interpretar el tráfico detrás de servidores proxies o sistemas de caché. - Dependencia de soporte.
Si quieres personalizar los datos necesitas asistencia técnica. - Costes indirectos asociados.
Mantenimiento del servidor, almacenamiento y tráfico interno de los logs.
Medición a través de Tags
Ventajas
- Fácil de implementar
Inclusión del código en cada una de las páginas. La mayoría de los gestores de contenidos (CMS) tienen sistemas y procesos automatizados que permiten implantarlo de forma rápida y eficaz. - Si no se utiliza una gestión de contenido, se puede automatizar mediante un include (fichero de inclusión con el código en todas las páginas de forma automática) u otros scripts a medida.
- Independencia de soporte externo a la hora de la personalización.
- La personalización se basa en la configuración del código de Javascript de cada una de las páginas y secciones así como de otros parámetros que personalizan los resultados de los informes.
- El cliente puede subcontratar este servicio y sólo consume recursos internos para subir el código a las páginas Web.
- Datos más exactos de usuarios, sesiones. Gracias a su sistema de utilización de cookies (se almacenan) en el navegador, previenen el uso de servidores cache y proxies. Esto hace que identifican con mayor calidad a usuarios y usuarios recurrentes y el conjunto de informes de las sesiones.
- La mayoría de las soluciones tienen modules especiales para medir e integrar la información de usuarios, campañas y transacciones.
- Seguimiento de eventos (flash, vídeo…) y elementos de la web 2.0. Gracias al desarrollo de las nuevas versiones del código de JavaScript de la mayoría de los proveedores, es posible el seguimiento de los nuevos estándares de web como el vídeo, flash, Ajax, XML…etc.
- Estandarización y evolución de la tecnología
Inconvenientes
- La exactitud de los datos depende si el navegador admite las cookies o deja ejecutar la función de Javascript.
- Hay que etiquetar todos los archivos que no sean html .Los documentos que no contienen el código hay que incluirles una función para poder pasar el parámetro a la base de datos. Todo archivo que no tenga el código o no esté etiquetado, no se registra en los informes.
- No hay trazabilidad de los archivos no html (office, pdfs…) por los que se accede directamente de un buscador. Si el resultado de Google es un archivo pdf y accedemos a él, al no tener el código no sabremos que ese archivo ha sido descargado a través de Google.
- Si el servidor que almacena los datos para generar el archivo de logs (donde se guarda la información recogida), los datos se pierde y no se pueden recuperar (las empresas aseguran la estabilidad en un 99%).
- No se pueden reprocesar los datos. Si has generado mal los códigos de seguimiento y no has incluido algún parámetro (por ejemplo que identifique un buscador local en los informes), la información que no se ha almacenado, no se puede recuperar.
- Problemas con Firewalls u otros sistemas de seguridad (Intranets o redes internas). Muchas organizaciones no tienen acceso a Internet y no se puede enviar la información al servidor del proveedor. Las reglas de seguridad en según qué organizaciones pueden ocasionar problemas.
- No puede registrar la actividad de los spiders de los buscadores.Los buscadores tienen un sistema de crawler que ejecuta las páginas pero no el código. Y la información no se envía. Es una carencia para medir, planificar y gestionar cuando te ha visitado el buscador.
- No ofrece informes técnicos. No puede cuantificar el consumo de ancho de banda, ni registrar los códigos de errores del acceso a las páginas.
La unión de las dos estadísticas es una solución bastante completa a la hora de la recolección de información para desarrollar un análisis web de calidad.
Airesweb es una sistema híbrido de medición de tags y logs que soluciona mucho de las imcompatibilidades de los dos sistemas.