La respuesta es un rotundo NO. Analytics nos dice que pasan cosas, pero nunca por qué suceden.
Aun así, Analytics nos puede dar muchas pistas, y el analista puede llegar a concluir los motivos por los cuales las cosas pasan.
Pero veamos un ejemplo que ilustra este asunto:
Hace unos días venimos observando un aumento en las visitas a nuestra web. Como continuamente estamos introduciendo pequeños cambios, nos preguntamos cuál será el que habrá hecho que tengamos más visitas.

Pues ya empezamos mal: Hemos introducido una asunción en nuestro planteamiento. ¿Cual? Que el aumento de visitas es efecto de un cambio hecho por nosotros. Pero cuidado porque, como veis, es sumamente fácil introducir este tipo de error en nuestro planteamiento.
Así que mejor empecemos de nuevo:
¿Cuál es el planteamiento correcto?
Análisis exploratorio de datos
Al contrario que cuando tenemos una hipótesis a priori, el análisis exploratorio de datos (o EDA por sus siglas en inglés) nos ayudará a identificar relaciones entre variables. Existen numerosas técnicas EDA, entre las cuales algunas de las más conocidas son:
- Estadísticos descriptivos (media, intervalos de confianza,…)
- Distribución (Normalidad, forma, kurtosis, simetría,…)
- Histograma
- Correlaciones, diagramas bivariantes
- Segmentación: estadística descriptiva por grupos
- etcétera
El propósito de estas técnicas es empezar a familiarizarnos con la información que estamos estudiando.
Así que empecemos: Analytics nos da muchas posibilidades de segmentación. Entre otros: datos demográficos, de comportamiento, tecnológicos, sociales, sobre el origen de las visitas, sobre el contenido visitado…
Formulación de hipótesis
A medida que el analista profundiza en la exploración de datos se irá planteando posibles explicaciones para el fenómeno observado. ¿tendrá que ver este comportamiento con un fenómeno asignable externo? ¿qué fenómenos podrían explicar este comportamiento? En este momento, está cambiando al planteamiento a priori, la confirmación (o desmentido) de una hipótesis.
En el caso expuesto, los datos pertenecen a una web de información meteorológica. El analista se pregunta: ¿tendrá que ver con la ola de frío siberiano que está sufriendo Europa?
A continuación, se plantea modos de contrastar esta hipótesis: Si el aumento proviene básicamente de visitantes europeos dará por buena la hipótesis de partida.
Contraste de hipótesis
Veamos: Segmentamos las visitas según su origen geográfico (ubicación en términos de Analytics). He aquí el resultado:

En naranja tenemos los datos pertenecientes a las visitas de Europa; en verde las correspondientes a América. Parece evidente que el aumento de visitas viene originado por los visitantes europeos.
A continuación el analista deberá comprobar que no hay otras variables cuyo efecto se pueda confundir con el origen geográfico. Por ejemplo, podría haber aparecido en una web de difusión europea un artículo sobre esta otra web; en ese caso, la causa del aumento de visitas podría ser la publicación de dicho artículo y no la ola de frío. De ahí nuestra afirmación inicial. Nunca sabremos mediante un análisis a posteriori por qué sucede aquello que observamos. Formularemos tantas hipótesis como nos parezca razonables y las rechazaremos o bien las aceptaremos como válidas.
El analista se siente satisfecho con este análisis (aunque no afirmará que esa es la causa del incremento de visitas) En este caso, y puesto que la ola de frío pasará, el analista esperará paciente a que eso suceda y observará si las visitas ‘europeas’ regresan a valores parecidos a aquellos anteriores a la ola de frío.



