¿Por qué han fallado las encuestas en Estados Unidos?
A la espera de que el recuento final se cierre, la distancia entre Trump y Kamala Harris es de 2,5 puntos porcentuales, mientras que las encuestas daban a la demócrata entre 0,2 y 2 puntos de ventaja
BarcelonaImagine que estás en un bar jugando a dardos y el objetivo es que todos vayan al centro. Con alguna copa de más, comience a disparar a la babalà. La diana acaba llena de agujeros, distribuidos sin ningún patrón. Otro día, ya sobrios, clava todos los dardos en una casilla lejos del centro. Ha fallado y lo ha hecho de forma sistemática.
Ahora imagináis que el centro de la diana es el resultado real de las elecciones presidenciales en Estados Unidos del pasado 5 de noviembre. Un resultado que quería entender y predecir con el uso de encuestas. Errar en la predicción puede ocurrir, como cuando el dardo no acierta la casilla. Sin embargo, y por tercera vez consecutiva, todos los dardos han ido a parar al mismo sitio, lejos del dato real. Algunos de los 1.800 sondeos realizados antes de los comicios han acertado, pero la desviación entre predicción y realidad ha sido a menudo notable.
A la espera de que el recuento final se cierre, la distancia entre Donald Trump y Kamala Harris es de 2,5 puntos porcentuales, mientras que las encuestas daban a la demócrata entre 0,2 y 2 puntos de ventaja. Una historia parecida la vemos en los swing states o estados clave: los sondeos predijo bien la victoria de Trump en Arizona, Nevada y Carolina del Norte, mientras que erraron (por poco) en tres estados clave del muro azul: Minnesota, Michigan y Pensilvania. Por el contrario, la desviación es mucho mayor en los estados no competitivos. En Virginia, Harris debía ganar por unos 7 puntos y lo hizo por 5; en Florida, Trump tenía que ganar por 6,5 puntos y lo hizo por 13.
El post mortem de las elecciones necesitará tiempo, pero ya pueden apuntarse algunos motivos.
Ya nadie coge el teléfono
Este año, el Pew Research Centre ha alcanzado un récord negativo: por primera vez en su larga historia ha necesitado 140 llamadas de media para realizar una encuesta. Es decir, menos del 1% de las personas a las que se llama cogido el teléfono para responder a las preguntas. Es un fenómeno que pasa por todas partes: cada vez se necesitan más llamadas (o visitas en persona) para conseguir una respuesta. los sondeos son diferentes de los que no lo hacen y, por tanto, las proyecciones que se derivan pueden estar sesgadas. pollsters estadounidenses lo sabían y decían haberlo corregido en la cocina –al fin y al cabo, errarla tiene un coste reputacional importante–, pero no ha sido suficiente.
Muchas casas de encuestas utilizan ahora otras estrategias, desde encuestas online hasta realizar llamadas con robots para evitar que el elector cuelgue, pero el problema persiste, al menos cuando Donald Trump compite. Esta vez, las empresas de encuestas republicanas lo han hecho mejor de media. Según dicen, porque han logrado llegar a un perfil escurridizo para el resto. Pero queda la duda sobre si simplemente han tenido suerte.
La proyección de un futuro incierto
Una mala mala no hace verano, porque pueden tener buenas que compensen el resbalón. Si se agregan y se modelizan estadísticamente, puede sacarse un resultado preciso. Esto es precisamente lo que hacen muchos medios y, si bien ha funcionado en el pasado, esta vez ha ido distinto. En resumen, si agregas errores, tendrás más errores.
Hay algunas predicciones que han funcionado mejor, como las basadas en lo que se conoce como “los fundamentos”. Los modelos estadísticos basados en cuestiones como la evolución de la economía, la satisfacción con el trabajo realizado por la administración Biden o la identificación partidista parecen haber acertado más. Este patrón podría indicar que cuestiones socioestructurales (como la clase social o la inmigración) importaron más para orientar el voto, lo que muchas casas de encuestas podrían haber obviado, centrándose sobre todo en lo que ocurre durante la campaña y en factores más coyunturales.
Sin embargo, un problema añadido de primera magnitud: elecciones norteamericanas ha habido pocas y no se dispone de suficiente información para predecirlas. Tal y como calculaban tres investigadores antes de los comicios, cabría esperar entre 28 y 2.588 años, en el mejor de los casos, para saber si el modelo de predicción es cierto o erróneo.
Comunicar una encuesta
Comunicar lo que nos dice una encuesta es extremadamente complicado. Siguiendo las leyes de la probabilidad, que los sondajes mostraran un empate no significa que el resultado final lo sea. Asimismo, el foco en el sube-baja en las últimas semanas antes de la votación esconde que dos terceras partes de estas oscilaciones se deben a sesgos de no respuesta inducidos por la misma campaña y no a cambios reales del electorado. Las encuestas son intrínsecamente inciertas y saber explicar la incertidumbre es fundamental, pero la receta secreta todavía no se ha encontrado.
Quizás, sin embargo, es necesario (re)parafrasear aquí Bill James: la alternativa a la estadística mala no es la no estadística, sino la estadística buena. Aunque se tarde tiempo en llegar.