Adiós al spam en Google Analytics

Adiós al spam en Google Analytics

En los últimos meses el spam de Google Analytics se ha convertido en un tema recurrente en cualquier blog de analítica web. Obviamente, debido a su brutal expansión que nos ha hecho mucho más conscientes de su existencia y sus consecuencias. Pero por fin parece que Google ha acabado con el problema y ya no lo veremos más. Empecé a escribir este artículo para analizar cómo es ese spam y en saber hasta qué punto puede afectar a las métricas de cualquier web, hoy ha saltado la noticia de que Google eliminaba definitivamente el spam (veremos si es así). De momento, con los datos a mi alcance puedo confirmar que desde el día 24 de enero no detecto visitas fantasma. ¿Cómo es el spam en Google Analytics? Hace casi un año, trabajando en la configuración de la cuenta de un cliente me encontré que el spam suponía la mitad de sus visitas, con lo cual sacar cualquier conclusión de sus datos de analytics, en bruto, era pura ciencia ficción, lo que me llevó a preguntarme: ¿Cuánto puede llegar a afectar el spam a las cifras reales? Sabemos que hay dos tipos de visitas fraudulentas: las de robots que realmente visitan el sitio y dejan su rastro, y los ataques directos a Google Analytics a través de Measurement Protocol que ni siquiera visitan la web y que son los que más crecieron el año pasado. Si se trata de ataques a IDs aleatorios, cualquier propiedad de Google Analytics debería recibirlos aunque no esté en uso en ninguna web, de modo que hice una propiedad nueva, únicamente destinada a recoger esos...
Data Science: qué es y qué necesito para ser un científico de datos

Data Science: qué es y qué necesito para ser un científico de datos

La ciencia de datos es la disciplina que se encarga de la extracción del conocimiento de los datos. La misión del científico de datos es la de extraer el conocimiento de los datos disponibles y transmitirlo a los líderes de las organizaciones para tomar las decisiones de negocio de forma más eficaz. Un científico de datos, en palabras de Anjul Bhambhri, vicepresidente de productos de Big Data en IBM, es “parte analista, parte artista”, es alguien curioso capaz de mirar los datos y las nuevas tendencias  del mercado y el negocio. Una curiosidad, ¿sabíais que el considerado mejor científico de datos del mundo es el español José Antonio Guerrero? ¿En qué se está usando Data Science? Más bien habría que decir en qué no se está usando. Actualmente en campos como la economía y las finanzas (modelos predictivos de bolsa, operaciones de alta frecuencia), la medicina (seguimiento y predicción de pandemias, estudios de prevalencia de enfermedades bajo distintas variables), las compañías de transportes (para optimizar rutas aéreas, terrestres, marítimas), compañías alimenticias (seguimiento de popularidad en redes sociales, trazabilidad de las ventas), telecomunicaciones (prevención del fraude, incremento del “rendimiento” de los clientes), retail (incremento de las ventas por conocimiento de hábitos de consumo), etc.  Las redes sociales, por ejemplo, son uno de los campos dónde más rápido está creciendo esta disciplina puesto que todas (casi todas) las compañías quieren y necesitan saber a quiénes les gusta sus productos y a quiénes no, lo que opinan de ellos, los perfiles de sus seguidores… Estos son sólo algunos ejemplos de uso en algunos campos, pero existen muchísimos más. El potencial y las perspectivas...
Cómo y por qué etiquetar como campañas cualquier enlace que generemos

Cómo y por qué etiquetar como campañas cualquier enlace que generemos

Una de las finalidades básicas de cualquier análisis de una web es identificar el origen de las visitas y clasificarlas lo mejor posible por tres motivos: primero porque normalmente dependiendo de su origen se comportan de manera diferente, segundo para identificar de dónde llegan las visitas que más beneficios nos producen, y tercero porque no todas las visitas tienen el mismo coste. Sin embargo es frecuente no usar ­(o hacerlo incorrectamente) el etiquetado de campañas específico para la herramienta de analítica que estemos usando. En este artículo nos vamos a basar en Google Analytics para explicar cómo etiquetar nuestras URL, pero debes tener presente que, aunque el concepto es el mismo, cada herramienta tiene sus propios parámetros. Pero si Google Analytics ya me dice el medio y la fuente de origen… Puede que en este momento te estés preguntando por qué hay que hacer nada en especial si Google Analytics (o cualquier herramienta de analítica) ya tiene su informe de fuente y medio en el que podemos ver, por ejemplo, las visitas que llegan desde Twitter, las de Facebook, etc. La clave está, principalmente, en el tercer motivo que hemos citado: desde Facebook, por poner un ejemplo, pueden llegar tres tipos de visitas: Visitas desde enlaces que han compartido los usuarios por iniciativa propia. Visitas desde enlaces que hemos compartido nosotros mismos. Visitas desde anuncios pagados. Y todas ellas aparecerán en el informe de fuentes como tráfico de referencia procedente de Facebook,  sin que podamos distinguir unas visitas de otras. Sin embargo es evidente que para nosotros no tienen el mismo coste. Las primeras (medios ganados) no suponen ningún...
¿Cómo funciona Google Analytics?

¿Cómo funciona Google Analytics?

Google Analytics es una herramienta que ayuda a los propietarios de sitios web a medir cómo los usuarios interactúan con el contenido de dicho sitio. Google Analytics proporcionará una serie de etiquetas de página (librerías) JavaScript para registrar información sobre la página que un usuario ha visto, como por ejemplo la dirección URL de la página. Estas etiquetas deben colocarse en todas las páginas que se desean rastrear. Las librerías de JavaScript de Google Analytics, o Código de seguimiento de Google Analytics (GATC), utilizan cookies http para “recordar” lo que un usuario ha hecho en las páginas anteriores y sus interacciones con el sitio web. Es importante destacar que Google Analytics no recoge ninguna información personal acerca de sus usuarios de la web. Google Analytics es compatible con dos librerías de JavaScript (tags) para medir el uso del sitio web: analytics.js y ga.js. A continuación hablaremos únicamente de ga.js, que es la que nos ocupa en este capítulo. ¿Cómo funciona Google Analytics? Como hemos indicado con anterioridad, Google Analytics inserta un bloque de código javascript en las páginas de nuestra web. Cuando alguien que visita nuestra web solicita una página, el código javaScript referencia a un fichero javascript el cual ejecuta el código de seguimiento de GA. Esta operación recupera los datos acerca de la solicitud de página a través de diversos medios y envía esta información al servidor de análisis a través de una lista de parámetros unidos a una solicitud de imagen de un solo píxel (también llamadas etiquetas de internet). Podemos ver el flujo de procesamiento de Google Analytics (GA) en la siguiente imagen 1. El...
Las cookies de Google Analytics. Nivel Friki.

Las cookies de Google Analytics. Nivel Friki.

En este artículo veremos en detalle qué cookies utiliza Google Analytics, de qué tipo son, cómo podemos leer su contenido, y cómo modificarlas para adaptarlas a nuestras necesidades. Si recordamos los artículos anteriores, una cookie es un archivo de texto que se utiliza para almacenar información sobre los visitantes, sus preferencias, la ubicación y otros detalles, pudiendo ser de primera parte, si las fija el dominio visitado, o de tercera parte, si las fija otro. En el caso concreto de Google Analytics se utilizan cookies de primera parte, es decir, que cuando se visita lametrica.com, la cookie de analítica no llega desde Google, sino desde lametrica.com. Además, clasificábamos las cookies en persistentes y temporales en función de si se mantenían en el ordenador después de cerrar la sesión o el navegador, o bien se borraban al cerrar sesión, respectivamente. ¿Qué cookies de origen son fijadas por Google Analytics en el disco duro del visitante? Google Analytics puede configurar cinco cookies de origen:  _utma: cookie de usuario único. _utmb: cookie de sesión. _utmz: cookie de campaña. _utmv: cookie de segmentación de visitante. _utmx: cookie del optimizador de sitios web de Google. Hay, además, una cookie que Google Analytics coloca en el disco duro de un visitante, que es la cookie  _utmc, utilizada para determinar el estado de sesión (si se utiliza código de seguimiento ga.js). Todas las cookies de Google Analytics son persistentes, excepto la cookie _utmc que es una cookie temporal. ¿Cuándo crea Google Analytics la cookie  _utmv en el disco duro de un visitante? La cookie _utmv se crea sólo cuando el código de seguimiento de Google Analytics llama...