COVID-19 Infodemia ¿Cómo interpretar los datos de una pandemia?

0

*Este articulo surge de la motivación que generó un taller para periodistas de Latinoamérica, cuyo tema 
central fue hablar de la Infodemia y principalmente responder a la pregunta
 ¿Cómo interpretar los datos de una pandemia?

 

Dada la coyuntura de la pandemia que ha afectado a todos los países y a todas las personas sin importar la condición económica, social, racial, religiosa, de edad o género entre muchas diversas condiciones, ha surgido un interés y una necesidad generalizada por saber y estar informado acerca del COVID-19. Dada la facilidad de acceder a diferentes tipos de medios se ha generado un fenómeno particular conocido como “Infodemia”, el cual es definido por la Organización de Naciones Unidad como una epidemia de desinformación vía datos falsos, errados o maliciosos.

COVID-19 en los medios

En esta primera parte podemos ver algunos ejemplos de la manera como se informa a la audiencia respecto a la pandemia. Básicamente se presentan registros de manera puntual para cada día como el acumulado total de casos confirmados con COVID-19, el número total de muertos y el número de recuperados, es decir aquellos pacientes que después de una nueva prueba tienen un resultado negativo (Figura 1).

Figura 1: Gráficos de resultados COVID-19 en medios locales.

Otros medios con un alcance regional o incluso global centran el reporte y presentación de la información basado en las mismas cifras y resultados descritos anteriormente, valores acumulados totales por día, posiblemente incluyendo unos gráficos de georreferenciación para presentar los resultados a nivel de país. Y en el mejor de los casos se presenta un resultado contemplando la variable del tiempo para tratar de reflejar los días pico en que sean reportado el mayor numero de contagiados.

Figura 2: Gráficos de resultados COVID-19 en medios internacionales.

Para los periodistas y en general para todas las personas que difunden información al respecto, el propósito de analizar e interpretar datos debe ser obtener información útil y de interés, razón por la cual vamos a explicar de manera simple la interpretación de un gráfico de frecuencias y un gráfico de frecuencias acumulado, además de algunos indicadores básicos utilizados en epidemiología para tener la trazabilidad del comportamiento de la epidemia y su propagación entre la población.

Análisis de Gráficos y Tendencias

El análisis de datos, aunque parezca algo sencillo, puede llegar a ser un ejercicio que se quede en lo subjetivo, por ello nos enfocamos primero en el gráfico de la frecuencia diaria de nuevos casos confirmados con COVID-19 y después en el total acumulado de casos confirmados para poder hacer una interpretación de tendencia respecto a las tasas de propagación del virus. Para más información sobre las frecuencias acumuladas se puede consultar el blog How to read a cumulative frequency graph.

En la Figura 3 tomando el gráfico de la izquierda tenemos en la parte inferior el registro de nuevos casos confirmados por día, si se observa detenidamente para el día 10 se presentaron aproximadamente 40 casos nuevos y los siguientes dos días (día 11 y 12) presentaron la misma frecuencia de casos nuevos. Extrapolando esas líneas verticales de los días hasta el gráfico superior siendo la frecuencia acumulada de casos, encontramos que entre el día 10 y 12 se acumularon alrededor de 120 casos nuevos. Como en el día 10 se tenía un acumulado de casos de 220, al sumar los 120 casos nuevos de los días 10, 11 y 12 tenemos que para el día 12 se acumularon en total 380 casos aproximadamente.

Respecto a la gráfica de la derecha podemos concluir que, si se presenta el mismo número de casos nuevos todos los días, entonces se va a presentar una tasa constante de crecimiento de propagación del virus y esto se vera reflejado en el gráfico de frecuencias acumuladas a través de una línea recta cuya pendiente es constante. Es importante notar que el número de casos nuevos es una variable no negativa, es decir toma valores de cero en adelante, de esta manera el gráfico de frecuencias acumuladas nunca va a decrecer, en el caso extremo que se presenten cero casos en varios días consecutivos lo que observaremos es una línea recta horizontal paralela al que identifica el número de días.

Figura 3: Gráficos de frecuencias y gráfico de frecuencias acumuladas.

Con ayuda de los gráficos de frecuencia acumulada es posible comenzar a identificar tendencias que permiten suministrar información más allá de la foto de un día y de esta manera transmitir información que pueda dar un parte de tranquilidad o pueda servir para generar conciencia frente a algún descuido o desacato en las medidas de higiene y sociales.

En la Figura 4 encontramos dos tipos de tendencia, el gráfico de la izquierda no muestra una tasa rápida de crecimiento y esto se debe a un incremento acelerado en el número de casos que se presentan especialmente en los primeros diez días, comparado con una tasa constante de crecimiento (línea punteada). En el grafico de la derecha cuando logramos controlar el número de casos nuevos que se presentan cada día logramos que la gráfica de frecuencia acumulada se vaya “aplanando” alcanzando un nivel de casos totales que sea posible ser manejado por un sistema de salud.

Figura 4: Gráficos de frecuencia acumulada con Tasas de Crecimiento.

En el Figura 5 se presentan los comportamientos de las tasas de crecimiento del COVID-19 que no son las ideales y las que se buscan evitar a través de medidas de higiene y aislamiento social. La primera es una Tasa Exponencial de Crecimiento la cual impactaría fuertemente los sistemas de salud y por otra parte tenemos una situación donde se ha controlado el brote o la propagación del COVID-19, aplanando la curva de manera que se percibe una línea horizontal paralela al eje X, se comienzan a flexibilizar las medidas y poder perder conciencia de la situación por la que se atravesó y repentinamente comienza a aparecer un segundo brote lo cual nos llevaría a un escenario no deseado y desesperanzador.

Figura 5: Gráficos con tendencias que procuramos evitar.

Interpretación de Indicadores Epidemiológicos

Para presentar y explicar algunos indicadores epidemiológicos que ayuden a los comunicadores y a la audiencia a tener información y contexto más completo acerca de la epidemia COVID-19, nos apoyaremos en el SAS Coronavirus Report, tablero de control habilitado por SAS Institute.

En el Figura 6 se presenta el gráfico de frecuencias acumulado de Casos Confirmados por COVID-19 para los países más afectados de Latinoamérica. Ya como un ejercicio de aplicación de la teoría vista previamente, podemos determinar como Brasil y Perú vienen presentado una Tasa de Crecimiento Exponencial en el número de casos confirmados por COVID-19, otros países como Chile, Ecuador y México están presentado una tasa rápida de crecimiento. Finalmente podemos catalogar a Colombia y Argentina como países con una tasa de crecimiento gradual en el número de casos confirmados.

Figura 6: Gráfico de frecuencias acumulado para casos confirmados de COVID-19.

Una vez analizada la tendencia quedamos con la inquietud o incertidumbre de que tan rápido puede estar incrementando la tasa de crecimiento, para esto tenemos en cuenta el número de días que se requieren para duplicar el número de casos confirmados de COVID-19. La cual se calcula de siguiente manera:

Siendo,

t = número de días que han pasado desde el día 0

 N (t) = número de casos confirmados en el día t

 N (0) = número de casos confirmados en el día 0

De esta manera se obtiene el número de días para duplicar la cantidad de casos confirmados, especialmente para la Figura 7. Se presenta teniendo en cuenta intervalos de tiempo de 3 días, por ejemplo, para el día 21 tenemos:

t = 3

N(21) = 2709

N(18) = 2054

Siendo, Tiempo Duplicación ≅ 8

Figura 7: Gráfico del tiempo para duplicar la propagación del COVID-19.

La Figura 7 presenta junto con la frecuencia acumulada de casos confirmados el gráfico del número de días para duplicar los casos confirmados para Colombia, donde podemos observar que en promedio para los últimos 10 días de medición esta alrededor de 8-9 días, siendo un indicativo de que se está disminuyendo la velocidad a la que se propaga el virus, corroborando la efectividad de las medidas de precaución tomadas tanto higiénicas como sociales.

Las medidas vistas hasta ahora son indicadores dados en términos absolutos, es decir se da el número total de casos confirmados, pero ese valor no determina el impacto y dimensionamiento que pueda tener en la población, no puede considerarse o medirse el impacto si hablamos de 2.000 casos confirmados en Perú en comparación con 2.000 casos confirmados en Brasil. Perú tiene aproximadamente 32M de habitantes frente a Brasil que tiene 210M.

Por esta razón, finalizamos presentado la Tasa de Prevalencia, la cual se define y calcula de la siguiente manera:

Tasa de prevalencia (%) = Total casos confirmados de COVID-19 / Población 2018

Se refiere a la ocurrencia de casos totales de COVID-19 en una población durante un período de tiempo específico expresado en porcentaje. Dado que a veces esta terminología puede ser difícil de expresar e interpretar por parte de una audiencia o gran parte de los ciudadanos, entonces presentamos la prevalencia de la siguiente forma:

Prevalencia / 100K = número de casos totales confirmados por cada 100,000 personas.

Esto se refiere a la ocurrencia de casos totales de COVID-19 en una población durante un período de tiempo específico ajustado para una población de 100K.

Por ejemplo, en la Figura 8 podemos observar que Perú tiene una prevalencia de 36 personas confirmadas con COVID-19 por cada 100 mil habitantes, mientras que Brasil presenta una prevalencia de 14 personas confirmadas con COVID-19 por cada 100 mil habitantes. Aunque las cifras absolutas del total de casos confirmados son muy altas, en términos relativos e Perú quien presenta una situación de propagación del virus mucho más crítica.

Figura 8: Gráfico de la tasa de Prevalencia COVID-19.

Para finalizar este blog quiero dejarlos con una animación bastante ilustrativa sobre cómo ha sido la propagación del virus COVID-19 a partir del 22 de enero de 2020 donde se presentó la confirmación del primer caso de COVID en USA y China contaba con 548 casos confirmados siendo el origen de la pandemia.

Figura 9: Animación SAS de la propagación del COVID-19 a 15 de abril 2020.

Share

About Author

Ivan Fernando Herrera

Customer Advisory SAS Colombia & Ecuador

Cuenta con más de 10 años de experiencia en analítica y minería de datos, es especialista en Machine Learning, Métodos Estadísticos, Text Mining y Bussiness Intelligence. Es estadístico egresado de la Universidad Nacional de Colombia y cuenta con un Máster en Estadística de la universidad Federal de Pernambuco en Brasil.

Leave A Reply

Back to Top