Proyectando Tráfico Web con Machine Learning y Google Analytics

El Jefe de Marketing de un cliente nuevo estaba muy preocupado por la baja que observaba en Google Analytics, respecto al tráfico en su sitio web. Su preocupación basada en el escenario actual y también porque notaba que la baja era mayor de lo que esperaba.

Si bien comenzaríamos hacernos cargo de sus campañas de anuncios tanto en Facebook/Instagram y Google Ads, quisimos darle un poco de calma a través de la proyección del tráfico al sitio web con Machine Learning en los próximos 60 días.

El plan fue conectar Python con la API de Google Analytics y extraer diversos datos que nos servirían para proyectar el tráfico de su sitio.

Posteriormente crearíamos un modelo de serie tiempo con Machine Learning que nos permitiera proyectar las sesiones.

Por último, crearíamos un GIF con las predicciones de manera que fuera atractivo mostrar los resultados.

  • Conexión de Python con API de Google Analytics:

Después de lograr conectarnos con la API de Analytics, pudimos exportar una serie de métricas y dimensiones que utilizaríamos también con otros objetivos, pero para poder responder la inquietud de nuestro cliente, lo que hicimos fue explorar las variables sesiones y page views de los últimos 600 días.

Con esta información, seríamos capaces de proyectar la cantidad de sesiones que obtendríamos en los próximos 60 días, de manera de poder aclarar si esta era una tendencia constante a la baja o bien era un efecto estacional.

  • Modelo de Proyección con Machine Learning:

Lo primero que se hizo fue graficar el tráfico en los 600 días que tenemos como base de datos y podemos observar cierta estacionalidad. A fines de Diciembre baja el tráfico, manteniéndose bajo hasta todo Febrero y después sube levemente, comenzando un verdadero repunte en Agosto.  

Aquí uno de nuestros desafíos, romper esas estacionalidades con las campañas de anuncios bien ejecutadas y haciendo uso de los datos para personalizar las recomendaciones a los clientes actuales.

Prediciendo el Futuro

Comenzamos limpiando la base de datos, de manera de eliminar la data faltante y los outliers y así realizar un buen modelo de proyección.

Existen diversos factores y variables que pueden ser modificadas en beneficio del modelo, como por ejemplo modificar la pendiente de la tendencia al 90% de los datos y fijar el modo de la estacionalidad como “mutliplicative”, porque la estacionalidad crece en su influencia.

De manera de proyectar con este modelo, fijamos en 60 días la proyección y corrimos el modelo, una vez que todos los parámetros se definieron, como el tope máximo y mínimo de sesiones.

Lo que proyectamos es lo que se encuentra enmarcado en rojo. Corresponde a 60 días desde el 04 de Febrero de 2023 en adelante.

Los puntos negros son los datos y la línea azul en el cuadro rojo es la predicción. Ya podemos notar que el tráfico en Marzo y Abril comienza a subir, aunque levemente.

Analizar Componentes:

Uno de los aspectos interesantes del desarrollo de un modelo de predicción es que podemos analizar diversos componentes:

A partir de estos gráficos podemos obtener interesantes insights:

  • Se observa en el primer gráfico de tendencia general, que hay un incremento en la tendencia a partir de Febrero. De hecho si observamos desde Febrero 2023 en adelante, se mantiene la tendencia al crecimiento.
  • En la tendencia semanal podemos observar que el  peor día es de Viernes a Sábado. El Martes es el mejor día para anunciar, por lo que este es un gran dato que debemos utilizar en las campañas de anuncios que haremos en Facebook y Google Ads.
  • En la tendencia anual podemos ver que el peak se obtiene en Diciembre. Además, podemos notar que Febrero es el peor mes, pero también se observa un bajo rendimiento la última semana de Diciembre. El periodo más fructífero es desde Septiembre a Diciembre, lo que coincide con análisis de ventas realizado.

Estos son insights bastante útiles que nos sirven para guiar las campañas de anuncios, que no sólo indican a qué día se debe destinar más presupuesto, pero además podemos confirmar que es un comportamiento normal la disminución en el tráfico estos días de Enero – Febrero y que ya en Marzo comenzará su recuperación. Esto será bastante tranquilizador para el Jefe de Marketing.

En el siguiente gráfico podemos observar la tendencia general en conjunto con los datos y detectar cuándo cambia la tendencia y se genera una variación de la pendiente.

Testeamos el Modelo

Utilizamos cross validation para el testeo, donde con ventanas móviles de 60 días de uso de los datos, evaluamos qué tan bien predijeron y así siguen prediciendo los próximos 30 días.

Como métrica de performance utilizamos Root Mean Square Error (RMSE) y lo graficamos.

En el gráfico obtuvimos el Root Mean Square Error por 30 días y podemos ver, cuánto más lejos en los días, mayor es el error.

  • Visualización y Animación del Modelo de Serie de Tiempo:

En la primera parte capturamos los datos desde google analytics, después creamos un modelo de serie de tiempo y en esta tercera parte debíamos buscar la forma de hacer una visualización que resaltara el esfuerzo realizado.

Como una manera de hacer la visualización más atractiva hicimos un GIF, de esta forma captamos de mejor forma la atención de nuestros clientes. Esto ayudó al Jefe de Marketing a comprender que era normal tener una disminución del tráfico en esta época y que pronto comenzará la recuperación.

Una vez que obtuvimos el GIF, animamos en el gráfico la predicción de los siguientes 60 días.

Es clave para los negocios hoy en día utilizar Data Science y Machine Learning para tomar decisiones informadas, optimizar el approach a acciones de marketing personalizadas, la adquisición de clientes, retención de clientes a largo plazo y un engagement continuo.

Si necesitan implementar una estrategia Data Driven con Data Science y Machine Learning y contar con este tipo de proyecciones de series de tiempo en tu negocio, escríbenos a contacto@datainsights.cl. Siempre estamos dispuestos a aclarar tus dudas y ayudarte a comprender cómo otras empresas han logrado superar desafíos comerciales similares.

Leave a Comment

Su dirección de correo no se hará público. Los campos requeridos están marcados *