Escuela de Ciencia y Tecnología, home

Big Data: De llamados telefónicos al control de brotes de COVID-19

Científicos de la UNSAM desarrollaron una alerta de brotes de COVID-19 a partir del procesamiento de llamados telefónicos. La herramienta no solo se está aplicando en la provincia más grande de la Argentina, sino que despertó el interés de una de las principales revistas científicas inglesas.

Por Alejandro Zamponi. Fotos: Pablo Carrera Oser

—Hola. Llamo por síntomas de COVID19.

—¿Cuáles son y cuándo empezaron?

—Pérdida de olfato, 39 de fiebre y dolor de cabeza desde ayer.

—¿Dónde vivís?

 Y así 20 mil veces en un día. Algunos de los llamados derivarán en pruebas de laboratorio y otros serán desestimados. ¿Cómo se pasa de esa información a una estrategia de control epidemiológico innovadora? Un equipo interdisciplinario liderado por el investigador de la UNSAM Ezequiel Álvarez, encontró la respuesta y conquistó un doble logro: aportar una herramienta de gestión para la pandemia en la provincia de Buenos Aires y publicar un artículo en una revista inglesa de máximo nivel internacional (Royal Society Open Science). En ambos casos se trata de lo mismo: del desarrollo de un algoritmo que permite alertar sobre brotes de casos de COVID19, a partir del análisis de los llamados telefónicos al 148, con hasta cinco días de anticipación respecto a la curva de casos confirmados por laboratorio.

La articulación entre la UNSAM y la PBA comenzó en mayo de 2020 y se consolidó con un convenio de colaboración entre ambas partes; se espera que continúe al menos mientras dure la pandemia. Además, éste proyecto fue seleccionado por el Banco Latinoamericano de Desarrollo (CAF) para realizar un upgrade y aplicarlo en la Ciudad de San Martín, Provincia de Buenos Aires, donde actualmente funciona y se utiliza por el servicio de Salud de la Municipalidad para trackear la epidemia y posibles brotes.

Royal Society Open Science (RSOS) es una de las principales revistas científicas en el área de epidemiología, matemática y física de todo el mundo, y se destaca en el primer cuartil Q1 del ranking Scimago. En su nueva edición publicó el artículo “Estimating COVID-19 cases and outbreaks on-stream through phone calls” (Estimación de casos de COVID19 y brotes en directo a partir de llamados telefónicos) disponible haciendo clic aquí. Está firmado por Álvarez, como primer autor, y por funcionarios del ministerio de Salud de la provincia de Buenos Aires: el viceministro Nicolás Kreplak, Daniela Obando, Sebastián Crespo, Enio García y Franco Mársico.

Ezequiel Álvarez es doctor en física teórica e investigador del CONICET en el Instituto ICAS de la Escuela de Ciencia y Tecnología de la UNSAM. Sus investigaciones se relacionan con el experimento con el colisionador de hadrones LHC, pero sus intereses e iniciativas son múltiples, como ilustra esta entrevista y haciendo clic aquí, y aquí.

El gobernador de la Provincia de Buenos Aires, Axel Kicillof; el jefe de Gabinete, Carlos Bianco; el ministro de Salud, Daniel Gollán; y el viceministro de Salud, Nicolás Kreplak, en videoconferencia con el investigador de la UNSAM Ezequiel Álvarez en el marco del proyecto de alerta de brotes temprana. Crédito: Prensa PBA

El algoritmo detrás de la alerta temprana de brotes

Consultado sobre el algoritmo, Álvarez explicó que permite automatizar el procesamiento de grandes volúmenes de información disminuyendo la acumulación de errores humanos. “El algoritmo llegó a procesar 20 mil llamados por día pero tiene la capacidad de procesar millones. La clave es que establece un método para distinguir un conjunto estable de llamadas, de otro conjunto ocasionado por un crecimiento abrupto de los casos. Esta estrategia nos permite estimar los casos de COVID19, casi con la misma efectividad que los test de laboratorio, con dos diferencias: esta información está disponible antes y no se refiere a casos individuales, sino a grupos”, introdujo Álvarez, antes de explicar la relevancia de la herramienta desarrollada.

“El COVID19 tiene períodos de incubación largos y elevada contagiosidad. Entonces no es lo mismo aislar a las personas infectadas cinco días antes o cinco días después del primer síntoma. La curva de casos en cada municipio de la provincia se actualiza cada 24 horas y anticipa en cinco días los resultados finales de los testeos de laboratorio. La precisión es muy alta: en términos estadísticos el R es de 0,92. Como referencia 0,7 es aceptable y 1 lo máximo”, aseguró.

Además de los méritos científicos del algoritmo, que mereció la publicación en la revista RSOS, existió y existe un trabajo de articulación entre la ciencia de calidad global hecha desde el Campus Miguelete de la UNSAM y la gestión de la provincia que alberga casi al 40% de la población argentina.

“El brote de casos en Villa Azul que tuvo tanta exposición mediática no habría existido como tal si no fuera por este algoritmo. Ese operativo se hizo porque nuestro algoritmo indicó un brote en Quilmes y a partir de ahí se delimitó el área de Villa Azul. De otra forma los contagios hubieran escalado”, aseguró Álvarez. Ese fue el caso más conocido, pero no el único. “Se estima que de cada 30 personas infectadas, una muere. La efectividad del algoritmo articulado con los operativos DETECTAR permitieron y permiten salvar vidas, al disminuir la tasa de contagios. Para mí que me especialicé en buscar señales en temas muy abstractos participar en este desarrollo es increíble”, aseguró.

 

Cómo funciona el sistema de alerta temprana

El sistema utiliza información anonimizada. Si bien las personas que llaman al 148 ofrecen su ubicación voluntariamente, luego esa dirección se “desparrama” antes de ingresar a la base de datos: pasa de representar un punto en el GPS a representar un círculo con 100 metros de diámetro. Además, el sistema de alerta temprana nunca sabe quién está infectado y quién no. Lo que hace es estimar qué porcentaje de los llamados corresponden a personas infectadas. ¿Cómo lo hace?

El modelo asume que cada región espacial tiene asociada una determinada cantidad de población, así como una cantidad estable de llamados al 148 por sospecha de COVID, los “llamados background”. Así mismo, el modelo presupone que del total de llamados hay una segunda fracción que corresponde a llamados de personas infectadas. Es justamente esta segunda fracción de “llamados señal” la que crece cuando hay brotes. “Diseñamos un algoritmo y lo alimentamos de información durante algunas semanas para entrenarlo y tener los ajustes que a partir de entonces nos permiten establecer la base de llamados “background” y el aumento o no de los llamados “señal” por nuevas infecciones”, especificó Álvarez.

El trabajo de Álvarez codo a codo con funcionarios de la provincia no fue una cosa de una sola vez, ni tampoco en solitario. Lxs becarios de posgrado de su equipo también aportaron y aportan en discusiones de trabajo semanales.

“Nadie puede predecir nada sobre el COVID19 como quedó demostrado. Nuestro algoritmo no predice sino que estima tempranamente. Para hacerlo con la efectividad con que lo hace es clave interpretar las barras de error. No es lo mismo decir que hay 10 nuevos contagios con un margen de error de +/- 5 que decir que hay 5 casos con un margen de +/- 1. La interpretación de estas barras de error requiere la aplicación de técnicas de física estadística y que quienes nos especializamos en eso hagamos un seguimiento día a día”, detalló.

, , , , , , , , , , , , , ,

Nota actualizada el 17 de marzo de 2021

No están permitidos los comentarios.