El objetivo de la Mesa de Datos COVID-19 liderada por el Ministerio de Ciencia, Tecnología, Conocimiento e Innovación es disponer la información epidemiológica de nuestro país para promover el uso de datos para investigación científica, clínica y para soluciones innovadoras que contribuyan a la toma de decisiones de las autoridades y la ciudadanía frente a esta pandemia. Como primer resultado de este equipo técnico, se disponen los datos epidemiológicos provenientes del Ministerio de Salud (MINSAL), documentados y abiertos para el análisis de la comunidad, en concordancia con la Ley Nº 19.628.
Ver http://www.minciencia.gob.cl/COVID19 para más información.
data product 1: Casos totales por comuna incremental: archivo con valores separados por coma (csv) que concatena historia de publicaciones de MINSAL sobre casos totales por comuna. Contiene los campos 'Región', 'Comuna', 'Población', '[fecha]', donde la última columna tiene los 'Casos Confirmados' reportados en cada publicación.
data product 2: Casos totales por comuna (un archivo por informe): archivos con valores separados por coma (csv) con la información a nivel comunal por cada informe publicado. Cada archivo contiene los campos 'Región', 'Comuna', 'Población', 'Casos Confirmados'.
data product 3: Casos totales por región incremental: archivo con valores separados por coma (csv) que concatena historia de publicaciones de casos totales por parte de MINSAL. Contiene los campos 'Región', '[fecha]', este último con el valor de la columna 'Casos totales' reportados por el MINSAL diariamente.
data product 4: Casos totales por región (un archivo por informe): archivos con valores separados por coma (csv) con la información a nivel regional publicada diariamente por MINSAL, las columnas varían a mediada que MINSAL dispone la información. Los campos para archivos posteriores a 31/3 son 'Región', 'Casos Nuevos', 'Casos totales', '%Casos Totales', 'Fallecidos'; para archivos anteriores son 'Región', 'Casos Nuevos', 'Casos totales', 'Recuperados'.
data product 5: Casos totales recuperados: archivo con valores separados por coma (csv) con casos recuperados totales con el valor diario reportado por el MINSAL. Contiene los campos '[fecha]', 'Recuperados'
data product 6[contributed]: enriquecimiento del data product2: producto2 con todos los datos compilados en formato CSV y JSON, llamados producto2.csv y producto2.json respectivamente.
data product 7: Exámenes PCR por región: 2 archivos con valores separados por coma (csv), el primero corresponde al reporte de exámenes PCR realizados, y el segundo, a la serie de tiempo de los datos anteriores, por región. Contiene los campos 'Región', 'Población', '[fecha]', este último con el valor de 'Exámenes PCR' reportados por el MINSAL diariamente. Nota: el dato no refleja la cantidad de muestras por región, en algunos casos se toman más muestras que la capacidad de exámenes PCR que tiene la región, por ende se envían a laboratorios fuera de la región
data product 8: Pacientes en UCI por región: 2 archivos con valores separados por coma (csv), el primero corresponde al reporte de hospitalizados UCI, y el segundo, a la serie de tiempo de los datos anteriores, por región. Contiene los campos ''Grupo de edad', '[fecha]', donde esta última columna contiene 'Pacientes en UCI' reportados por día.
data product 9: Pacientes en UCI por grupo de edad: 2 archivos con valores separados por coma (csv), el primero corresponde al reporte de serie de tiempo de hospitalizados UCI, y el segundo, a la serie de tiempo de los datos anteriores, por grupo de edad. Contiene los campos 'Grupo de edad', '[fecha]', donde esta última columna contiene 'Pacientes en UCI' reportados por día por grupo de edad.
data product 10: Fallecidos por grupo de edad: 2 archivos con valores separados por coma (csv), el primero corresponde al reporte de serie de tiempo de fallecidos, y el segundo, a la serie de tiempo de los datos anteriores, por rango etario. Contiene los campos ''Grupo de edad', '[fecha]', donde esta última columna contiene 'Fallecidos' reportados por día.
data product 11 [contributed]: enriquecimiento del data product4: producto4 con todos los datos compilados en formato CSV y JSON, llamados producto4.csv y producto4.json respectivamente.
data product 13: Casos nuevos por región incremental: 2 archivos con valores separados por coma (csv), el primero corresponde a casos nuevos por región con los valores diarios reportados por el MINSAL, y el segundo a la serie de tiempo de los datos anteriores. Contiene los campos 'Región', '[fecha]', donde esta última columna contiene 'Casos Nuevos' reportados por región.
data product 14: Fallecidos por región incremental: 2 archivos con valores separados por coma (csv), el primero corresponde a casos fallecidos por región con los valores diarios reportados por el MINSAL, y el segundo a la serie de tiempo de los datos anteriores. Contiene los campos 'Región', '[fecha]', donde esta última columna contiene 'Fallecidos' reportados por región.
data product 15: Fecha de inicio de síntomas de casos confirmados por comuna: 3 archivos con valores separados por coma (csv), el primero reporta el total de casos con inicio de síntomas por comuna, para casos confirmados por semana epidemiológica, el segundo la serie de tiempo de los datos anteriores y el tercero indica las fechas que marcan los inicios y términos de cada semana semana epidemiológica. El primer archivo contiene los campos 'Región', 'Comuna', 'Población', '[semana epidemiológica]', donde la última columna contiene el 'Total de casos con inicio de síntomas para casos confirmados' reportados en cada comuna, para cada semana epidemiológica. Nota: acorde a lo informado por Epidemiología MINSAL, la fecha de inicio de síntomas corresponde al momento de la manifestación clínica de la enfermedad, y son provisorios a la fecha del último reporte, pues se van actualizando retroactivamente a medida que se confirman casos y evoluciona la investigación epidemiológica
data product 16: Casos por genero y grupo de edad: 2 archivos con valores separados por coma (csv), el primero corresponde a casos totales separados por genero y rango etario (valores reportados por el MINSAL), y el segundo a la serie de tiempo de los datos anteriores. Contiene los campos 'Grupo de Edad', 'Sexo', '[fecha]', donde esta última columna contiene 'Casos totales' reportada para un rango etario y sexo por informe epidemiológico.
data product 17: PCR acumulado e informado en el último día por tipo de establecimientos: archivo con valores separados por coma (csv), corresponde al numero de test realizados por establecimiento, y al numero informado en las últimas 24 horas. Contiene los campos 'Tipo de establecimiento', 'exámenes' que contiene 2 categorías: 'realizados' para el total acumulado e 'informados en el último día', y '[fecha]' que contiene la cantidad reportada para ambas categorías.
data product 18: Tasa de incidencia historica por comuna y total regional: archivo con valores separados por coma (csv), corresponde a la tasa de incidencia por comuna y total regional, reportado por el MINSAL. Contiene los campos 'Región', 'Comuna', 'Población', '[fecha]', donde esta última columna contiene la 'tasa de incidencia' reportada para comunas y total regional por informe epidemiológico.
Nota: La fecha otorgada a cada reporte corresponde a la publicación por MINSAL del registro del día anterior
En cuanto a los archivos a nivel comunal: Transcribimos los datos publicados por el Ministerio de Salud en pdf en: https://www.minsal.cl/nuevo-coronavirus-2019-ncov/informe-epidemiologico-covid-19/ A partir de esa transcripción se genera un archivo csv, ubicado en la carpeta input. Este se procesa con el código en src, para generar los archivos csv en output.
En cuanto a los archivos a nivel regional: Hacemos scrapping de tabla en https://www.minsal.cl/nuevo-coronavirus-2019-ncov/casos-confirmados-en-chile-covid-19/ y generamos archivo csv por día.
Si encuentras errores, por favor repórtalos acá. La automatización de este proceso y disposición de datos ha sido inicializada por el equipo del Data Observatory (http://www.dataobservatory.net), estan todos invitados a colaborar. Si has creado una solución que permita facilitar el trabajo con estos datos, algún análisis, o simplemente tienes una solicitud de data product considerando los datos que MINSAL hace públicos hoy, escríbenos a [email protected]
Geógrafo Virginia Behm - académica Escuela de Salud Pública U. Chile.
Miguel A. Bustos Valdebenito | Estudiante Dr. Ing. Mec. - U.Chile | Mtr. Ing. Ind. - UAI | Ing. Civil y Ejec. Mec. - U. de Santiago
Annabella Zapata y Carlos Navarrete, Chilecracia y Datawheel