miércoles, 13 de julio de 2016

136. Elecciones 26J y prediciones electorales. ¿Error de la predicción o incertidumbre del suceso?

No dejo de preguntarme: si yo usé datos de Google Trends para hacer las previsiones electorales y no encuestas, ¿por qué fallé de modo tan parecido a las encuestas?  

Encuestas publicadas durante la campaña electoral (Electomanía)

Encuestas publicadas el día anterior y el mismo día de las elecciones (Electomanía)
Última previsión electoral que hice el 26/6, el mismo día de las elecciones. 

Mi previsión se basaba em la correlación entre búsquedas en Google con pasados resultados electorales pero también con las encuestas del CIS, de modo que , en cierto modo,  lo que yo calculaba era tanto los resultados de las elecciones como las previsiones de las encuestas CIS, pero lo cierto es que:

1.- NADIE daba al PP más de un 30%, y
2.- la mayoría daban a UP cerca del 25 % 

Media de encuestas desde enero de 2015 calculada por K. Llaneras


¿Y entonces?

Bien, la mayoría de los opinadores coincide en achacar lo ocurrido a tres tipos de causas.  

1.- Un sutil cambio sociopolítico del 20D al 26J no detectado. Tanto si usamos datos de Google como encuestas, con independencia de los métodos, usamos las correlaciones del pasado (la experiencia) para prever el futuro, pero en cierto modo estas fueron unas elecciones inéditas, a segunda vuelta, cosa que nunca se había dado y, por tanto, tanto los supuestos previos que traducían interés, simpatía o afinidad con voto no funcionaron. Lo que no se explica, no obstante, es porqué falló también (y tanto) el megasondeo a pie de urna de Sigma Dos (132.000 entrevistas, nada menos), pues aquí ya no estamos en la indeterminación de traducir un interés o intención (de votar) en una acción, sino en una simple encuesta sobre lo hecho. ¿Es que los votantes no solo cambiaron su opinión respecto del 20D sino que se volvieron más mentirosos? 

2.- El efecto manada, o efecto cascada, según el nombre que cada cual le quiera poner. En un juicio más severo no sería más que un chusco corta y pega, pero en un juicio más benévolo sería como el dicho de Newton: levantarse sobre los hombros de gigantes; el habitual proceso acumulativo con el que se capitaliza conocimiento. Yo mismo me basé en los datos de CIS, y es posible que todos en España sigan un poco al gran encuestador gubernativo. Sin embargo, tampoco explica todo lo ocurrido, pues por ejemplo, mi previsión para Cs se alejó tanto de los resultados como de las encuestas (salvo, de nuevo, del macrosondeo de 132.000 entrevistas a pie de urna de Sigma Dos, la famosa israelita para TVE, que daba a Cs apenas un 11%). 

3.- El error intrínseco de las encuestas. Lo que es algo así como decir que no siempre se acierta, o que las encuestas son probabilísticas, no determinísticas. Sin embargo, creo que aquí se confunde el error de la encuesta con la incertidumbre del suceso electoral para sumar un todo que no es. Por ejemplo, en la gráfica de medias de encuestas  que puse arriba, el valor medio es suavizado. La razón no solo es simular más certidumbre en el resultado como parecen decir aquí, sino lograr una mejor lectura de la tendencia general. 

Aquí lo vemos en la última de las gráficas de votos a partir de búsquedas en Google que fui publicando cada tres o cuatro semanas desde el 20D. Están suavizadas a 24 horas. 


Hora a hora, que es el paso con el que Google Trends da datos semanales, el aspecto de la gráfica de arriba es: 


Y no solo esto. Al dar los pronósticos, como el del 26J, no usé medias diarias sino medias semanales de medias diarias. La razón es bien sencilla: son los datos de mayor confianza. Pero esas fluctuaciones que se ven no son errores del medida, son debidas a la incertidumbre del suceso, que en este caso es el hecho de buscar pp o psoe o podemos en Google. Hay un claro ciclo diario de búsquedas comos e ve en la gráfica de abajo, y es posible que haya ciclos semanales, mensuales o estacionales... 



Hace años era recurrente en cada proceso electoral en Galicia discutir lo que influiría el hecho de que lloviese o no lloviese el día de elecciones.No tengo ninguna duda de que si las votaciones fueran en horario nocturno, los resultados cambiarían. También cambarían si fuese un día laboral, un sábado o un lunes, o en medio de un largo puente, en verano o en invierno.   

Yo contaba con un error del 8 % en mi previsión. Me separé de los resultados un 12 % pero no tengo claro que ese 4 % (al menos) sea un error estadístico del modelo o sea parte de la incertidumbre asiociada al suceso de votar. El 26J ocurrió una anomalía, pero tratar lo ocurrido como un error de las encuestas puede ser un error de juicio más general. Votar, elegir, decidir, es un suceso no determinista, con una incertidumbre asociada, irreductible a la encuesta, a toda monitorización. Quizá por eso, mientras que la técnica logra reducir los errores de todos los sistemas mecánicos, las encuestas siguen fallando con sorprendente regularidad. Quizá también habría que prestar menos atención a las causas de error de las encuestas y un poco más a las causas de la incertidumbre en los sucesos electorales. 

No hay comentarios:

Publicar un comentario