lunes, 13 de enero de 2014

19. ¿Es Google Trends un buen indicador económico? Avance EPA 4º Trimestre 2013 con GT

NUEVA ESTIMACIÓN (1/3/2014)
La estimación lineal para el mes de enero de 2014 con datos del 2 al 28 de febrero es de  4.807.183 parados registrados en INEM en febrero de 2014, es decir unos siete mil parados menos que los registrados en enero, que fueron 4.814.435


ESTA ENTRADA, QUE IRÉ RENOVANDO, LA INICIÉ A PRINCIPIOS DE ENERO. FUE ASÍ:


Hoy me apartaré un poco de la geografía para testar lo bueno que es Google Trends haciendo una predicción de la Tasa de paro que dará la EPA del 4º trimestre de 2013 y un adelanto del paro registrado en el INEM para enero de 2014. 

Primero la historia. 

Empiezo por mostrar la serie de búsquedas en Google de las palabras crisis (azul), paro (rojo), epa (amarillo), subsidio (verde) y desempleo (morado):

El período que se muestra va del 1 de enero de 2004 al 11 de enero de 2014.

Aquí tenéis lo mismo pero para crisis (azul), paro (rojo) y paro+ere+subsidio+desempleo (amarillo).
Se ve un poco mejor. Aumenta el paro con la crisis de crédito internacional, vienen los brotes verdes de Zapatero y la preocupación por el paro disminuye. Pero tras el verano de 2010, llega el segundo hostiazo, con un máximo en enero de 2013. Abajo en verde, las búsquedas de "prima riesgo" ilustran bien lo ocurrido. En noviembre de 2010, aparece una nueva preocupación pública en España: la prima de riesgo (verde). El lapso entre los máximos entre los máximos de las crisis y el paro es de unos 5-6 meses.


Y ahora descargo los datos de búsquedas relativas de GT (en escala semanal); los de tasa de paro de la EPA (escala trimestral, desde 1er trimestre de 2005 hasta 3º de 2013); y los de paro registrado en INEM (escala mensual, desde enero de 2004 a octubre de 2013). 

Empiezo con los datos de INEM. La serie de GT para paro correlaciona de forma muy significativa con los datos de paro registrado (R2 es de 0,88) y lo mismo para las búsquedas agregadas de paro+ere+subsidio+desempleo.


De todas formas, la cosa varía un tanto según el periodo temporal elegido, como se comprueba fácil:
Así que, para hacer el cálculo, tomo sólo la correlación entre los datos de paro mensuales registrado por el INEM desde 2009 y los de Google Trends para el mismo periodo:
La estimación lineal para el mes de enero de 2014 según esta relación los parados registrados en enero de 2014 serán 4.771.014.

La estimación lineal para el mes de enero de 2014 con datos del 5 al 25 de enero es de  4.858.025 parados registrados en INEM en enero de 2014.

La estimación lineal para el mes de enero de 2014 con datos del 2 al 28 de febrero es de  4.807.183 parados registrados en INEM en febrero de 2014, es decir unos siete mil parados menos que los registrados en enero, que fueron 4.814.435

Hago lo mismo para los datos trimestrales EPA.


La correlación con los datos EPA (trimestrales) es todavía mejor, (R2=0,92), pero como en los datos del INEM, la serie temporal está claramente dividida por la crisis. Así que para el cálculo utilizo los datos desde 2009 hasta el tercer trimestre de 2013 (que es lo que me da INEbase)

Con este extraordinario coeficiente de correlación (R2 de 0,97) y en base a la búsqueda relativa de "paro" en Google en el último trimestre de 2013, la tasa de paro EPA del 4º trimestre de 2013 será del 24,96%. 

Y ya, para rizar el rizo, tomando los valores de búsqueda relativa de los 11 primeros días de enero, la tasa de paro EPA para el 1er trimestre de 2014 será del 26,54 %

Mala cosa. De todas formas, ya que Google nos ofrece resultados semanales, veré cómo va evolucionando.

De propina, unos mapas con la distribución de los términos de búsqueda sin más comentarios (2004 a 11/1/2014). Que cada cual saque sus conclusiones.






1 comentario:

  1. Hola, la verdad es que está muy chulo el blog, sólo te pediría que pusieras leyenda en algunos de los cuadros, pero por lo demás, la diversidad de temas, el entusiasmo que transmites la hace más amena.
    Gracias.

    ResponderEliminar