Predição de UTI's necessárias para pacientes internados com COVID-19 no Hospital Sírio Libanês
Para entender melhor este projeto, leia os notebooks na seguinte ordem:
1 - Leia o Notebook VISUALIZANDO DADOS
2 - Leia o Notebook MATHEUS NARANJO CORREA IMPLEMENTANDO OS MODELOS
3 - Leia o Notebook PIPELINE PROJETO
Cada Notebook serve de implementação para entender melhor o conteúdo todo.
PROBLEMA Conforme mostrado pela direção do Hospital Sírio Libanês no Kaggle(link para leitura), apresentaremos abaixo uma proposta de solução para o seguinte problema:
A pandemia da SARS-COVID-19 (popularmente conhecido como coronavírus), vem causando grandes estresses nos sistemas de saúdes globais. Países com alta taxa de desenvolvimento vêm sofrendo com a falta de leitos de Unidade de Terapia Intensiva (UTI) na internação de seus pacientes, levando equipes médicas a terem que aplicar métodos de escolha severos, dando prioridade para os mais idosos e graves. Contudo, tais métodos não auxiliam na resolução do problema dado a alta taxa de contaminação existente, consequência das ondas de infecção que vêm sendo causadas em um efeito de onda ao redor do mundo.
Tal problema afeta também países emergentes e subdesenvolvidos, que geralmente já possuem sistemas de saúde superlotados, como no caso do Brasil. Infelizmente a superlotação e a falta de leitos já sobrecarregou sistemas de vários estados, como no caso do estado do Amazonas (link da matéria), onde pacientes não estão mais conseguindo acesso a UTI, assim como não possuem equipamentos básicos para a manutenção de vida, como oxigênio.
Com base nesses acontecimentos e até mesmo na prevenção de sobrecarga do sistema de saúde das redes privadas, o Hospital Sírio-Libanês, referência internacional em saúde, busca prevenir e até mesmo predizer, com base em dados clínicos de seus pacientes, conforme forem sendo admitidos no ambiente hospitalar, a necessidade ou não de internação nas UTIs nas próximas horas. A ideia por trás disso é conseguir desenvolver um modelo de aprendizagem de máquina, conhecido com Machine Learning, que consiga auxiliar a junta médica a tomar decisões referentes a necessidade ou não de internação na UTI para aquele paciente, usando as boas práticas de programação e respeitando a Lei Geral da Proteção de dados, conforme indica a lei federal Lei nº 13.709/2018.
Em nosso conjunto de dados, temos a seguinte janela de dados, ou como é chamado no dataset, WINDOW
:
WINDOW | DESCRIÇÃO |
---|---|
0-2 | From 0 to 2 hours of the admission |
2-4 | From 2 to 4 hours of the admission |
4-6 | From 4 to 6 hours of the admission |
6-12 | From 6 to 12 hours of the admission |
Above-12 | Above 12 hours from admission |
Como é alertado pelo próprio hospital:
OBSERVAÇÃO: Cuidado para NÃO usar os dados quando a variável de destino estiver presente, pois a ordem do evento é desconhecida (talvez o evento de destino tenha acontecido antes de os resultados serem obtidos). Eles foram mantidos lá para que possamos aumentar este conjunto de dados em outros resultados posteriormente.
-
Foram limpos e ajustados para uma escala de -1 até 1.
-
Dados disponíveis:
- Informações demográficas do paciente (03)
- Doenças anteriores agrupadas de pacientes (09)
- Resultados de sangue (36)
- Sinais vitais (06)
-
No total, são 54 recursos, expandidos quando pertinentes à média, mediana, máximo, mínimo, dif e dif.
Fórmula Usada para os cálculos feitos pela equipe do sírio libanês:
Este projeto foi minha primeira tentativa de trabalho com Machine Learning voltada para classificação de dados. Espero que possa lhe ajudar em alguma coisa. Muito Obrigado ! 🚀🚀🚀