¿Votar en el peor momento de la pandemia? Un examen de la evidencia disponible

Anexo Metodológico

Informe en CIPER

Autores: Cristóbal Cuadrado, Cristóbal Moya, Monica Gerber, Valentina Andrade, Ismael Puga, María José Monsalvez, Josefina Aubert y Gabriel Rada

Anexo Metodológico

Este anexo metodológico describe en mayor detalle la investigación realizada para estimar el posible impacto de la participación en el plebiscito del 25 de octubre de 2020 en los contagios por COVID-19 en Chile.

Datos

Para realizar estos análisis se utilizó la base de datos del Monitoreo Nacional de Síntomas y Prácticas (MOVID-19). MOVID-19 es un panel longitudinal online con mediciones semanales realizadas entre el 14 de abril del 2020 y el 19 de marzo del 2021 entre personas mayores de 18 años en Chile. Este estudio corresponde a un proyecto colectivo desarrollado por un grupo de investigadores e investigadoras de distintas universidades chilenas y de distintas disciplinas (por ejemplo, salud pública, sociología, psicología y medicina). El proyecto ha recibido financiamiento de la Universidad de Chile, del Colegio Médico de Chile, de la Universidad Diego Portales, la Universidad San Sebastián, la Universidad Central, la Universidad de la Frontera y la Agencia Nacional de Investigación y Desarrollo (ANID) a través del Fondo ANID-COVID N° 960. Para los análisis sobre el efecto del voto en los contagios por COVID-19 consideramos solamente los datos que fueron recolectados 4 semanas antes y 4 semanas después del proceso electoral.

Muestra

Este estudio considera una muestra no probabilística con participantes invitados a través de redes sociales, mailings masivos y prensa. Los datos presentados en estos análisis incluyen a 19.712 individuos y 117.778 observaciones para 10 olas de seguimiento.

Mediciones

Caso confirmado de COVID-19. Es definido como aquellos individuos que reportaron un PCR positivo para COVID-19. Esta pregunta se hace a todos los participantes de la encuesta, independiente de la presencia o ausencia de síntomas de COVID-19.

Caso sospechoso de COVID-19. Es definido como aquellas personas que (a) desarrollan cualquier combinación de al menos dos de los siguientes síntomas: tos, diarrea, odinofagia o cefalea; y/o (b) hayan tenido contacto estrecho con un paciente confirmado mediante PCR; y/o (c) presente fiebre (temperatura axilar mayor a 37.8ºC), sin otra causa evidente; y/o (d) presente manifestación aguda de anosmia.

Voto. A los participantes se les preguntó la siguiente pregunta: “¿Fue usted a votar al plebiscito del 25 de octubre?” (Sí, No).

Tiempo en lugar cerrado durante la votación. A los participantes se les preguntó sobre el tiempo que pasaron dentro de un lugar de votación como forma de medir el riesgo de contagio. Se les preguntó “El día del plebiscito de octubre del 2020, ¿aproximadamente cuánto tiempo estuvo Ud. adentro de un lugar cerrado en establecimientos de votación?” y las respuestas fueron recodificadas en menos de 30 minutos y 30 minutos o más.

Tasa de incidencia de COVID-19 a nivel comunal. Este indicador se encuentra calculado considerando el número de casos activos dividido por el número de casos totales de la comuna. Este indicador es calculado desde los datos entregados por el Ministerio de Salud para el día de las elecciones.

Variables de control. Como variables control se consideraron el número de respuestas de cada persona, haber tenido COVID-19 en el pasado, la percepción de riesgo del COVID-19 (“qué tan peligroso crees que es el coronavirus para tí y tus cercanos”, con respuestas que van desde 1=nada de peligroso hasta 5=extremadamente peligroso), sexo (0=Femenino, 1=Masculino), edad (en años), nivel educacional (educación media o menos, educación técnica y grado universitario), ocupación (“¿cuál de las siguientes ocupaciones describe mejor su ocupación actual?”, recodificada en 0=no trabaja, 1=trabaja), trabajador de salud (0=No, 1=Sí), alguna condición crónica (se preguntó si actualmente tenían diagnóstico de alguna enfermedad o condición de salud de una lista, incluyendo hipertensión arterial, diabetes, enfermedad respiratoria crónica y enfermedades cardiovasculares, 0=No, 1=Sí), salidas de casa (número de veces en la última semana) y uso de transporte público (número de veces en la última semana).

Análisis

La estrategia de análisis que se ha optado por utilizar es un Modelo de Diferencias en Diferencias (Abadie, 2005; Card & Krueger, 1995) en la que el grupo tratado son las personas que participaron de la elección del 25 de Octubre y el grupo control son quienes no asistieron a votar. El período pretratamiento corresponde a las olas de medición previas a la semana del 25 de Octubre y el período de tratamiento a las olas posteriores a dicha fecha.

Dado que la probabilidad de asistir a votar está determinada por características de los individuos que también pueden estar asociadas a la probabilidad de contagio de COVID-19 - llevando a que los grupos de votantes y no votantes no sean necesariamente comparables en términos de su riesgo basal de sufrir el evento de interés- utilizamos puntajes de propensión a votar estimados a partir de un modelo que utiliza como variables predictoras la edad, sexo, nivel educacional, caracteristicas vinculados a la ocupación (estar empleado; ser o no trabajador de la salud), tener alguna condición crónica de salud, percepción de riesgo del COVID-19 y conductas de riesgo en el contexto de pandemia (frecuencia de salidas fuera el hogar y el uso de transporte público). Estos puntajes de propensión son utilizados para estimar pesos dados por el inverso de la probabilidad de ser votante estimada por el modelo, realizando los análisis en una pseudo-población lo que es conocido en la literatura de inferencia causal como Inverse Probability of Treatment Weights (IPTW) (Robins et al, 1994).

Por otra parte, dado que los datos provienen de una encuesta longitudinal de tipo semanal existen personas que no responden todas las semanas la encuesta, llevando a la existencia de datos perdidos. Dado que la probabilidad de no contestar la encuesta puede también estar asociada al evento de interés, se hace necesario ponderar las observaciones para ajustar por la probabilidad de no respuesta. Para esto, se utilizaron pesos de probabilidad inversa suavizados según la propensión de respuesta de los participantes.

Finalmente, cabe destacar que nuestro análisis restringe el período de análisis a 6 semanas en el período pre-tratamiento y 4 semanas en el período post-tratamiento. Así mismo, excluimos del análisis a las personas que al comienzo del período análitico utilizado (semana 39) hayan sido confirmados como caso COVID-19 anteriormente. Esto se realizó con el fin que al comienzo del período de observación, todos los individuos pudieran ser considerados susceptibles de contagiarse.

En términos de la estimación, dado que la variable respuesta es de tipo dicotómica se utilizaron Modelos Lineales Generalizados con una función tipo logit y distribución binomial, incorporando un intercepto aleatorio a nivel de los individuos para incorporar la estructura anidada de los datos (múltiples observaciones en el tiempo para cada individuo). Así estimado, el estimador de diferencias en diferencias refleja los cambios en los odds de ser un caso confirmado entre quienes fueron y no fueron votantes, controlando por las diferencias de odds de ser caso confirmado en el período de las 4 semanas previo al plebiscito y las 4 semanas del período posterior al plebiscito. Esto permite ajustar por características no observadas invariantes que son comunes entre quienes son votantes (vs no votantes) y por características no observadas variantes en el tiempo que afectan tanto a votantes como no votantes (por ejemplo, la evolución del riesgo de contagio por cambios en la curva epidémica).

Además del efecto global en la muestra, estimamos la diferencia en diferencias para subgrupos de interés determinados por el tiempo que pasaron las personas en un lugar cerrado en la votación, haber realizado una actividad de alto nivel de exposición durante el proceso electoral (vocales, apoderados, tricel, entre otros), tasa de incidencia de casos activos COVID-19 al momento del plebiscito y la densidad de votantes promedio por mesa en la comuna de residencia de la persona durante el plebiscito. Exploramos estos elementos para identificar posibles moderadores que pudieran explicar heterogeneidad en los efectos del plebiscito y que pudieran ser relevantes para identificar puntos a ser intervenidos por la política pública en futuros procesos electorales.