- sex 10 abril 2020
- datasets
- Álvaro Justen
- #covid19, #opendata, #ddj, #colaboração
Desde que lançamos o dataset covid19, todos os dias dezenas de voluntários coletam os dados das Secretarias Estaduais de Saúde, checam, entram em contato para resolver inconsistências e preparam os dados para serem atualizados. Desde então, melhoramos o processo de atualização (que em parte é manual), automatizamos diversas tarefas, aprimoramos nossa metodologia e, com isso, atualizamos nossos dados diversas vezes por dia, que estão sendo acessados por milhares de pessoas todos os dias. Para gerar um maior impacto com nosso trabalho, decidimos buscar outras fontes que possam validar os dados que já coletamos, gerar estimativas de subnotificação e nos permitir fazer análises mais complexas. Por isso, resolvemos coletar, limpar e divulgar no Brasil.IO os dados de óbitos por suspeita ou confirmação de covid19 registrados em cartório.
O Portal da Transparência do Registro Civil criou uma página especial onde é possível ver a quantidade de óbitos por suspeita ou confirmação de covid19 por dia:
Nota: o baixo número de casos para os 6 últimos dias não quer dizer que o número de óbitos diminuiu - eles apenas não entraram no sistema e serão atualizados nos próximos dias.
Os dados são atualizados a cada hora e para coletá-los por dia por estado criei um programa de coleta em Python usando o framework de Web scraping scrapy. Você pode acessar os dados no Brasil.IO de três formas:
Independente de como preferir acessá-los, confira:
- A documentação de nossa API
- As perguntas (e respostas) mais frequentemente perguntadas sobre nossos dados
Depois de uma simples análise, uma péssima notícia: ultrapassmos os 1.000 óbitos no dia 6 de abril (e não hoje), ou seja, os dados divulgados pelas SES e pelo Ministério da Saúde estão atrasados em 4 dias. Veja:
Além de óbitos em decorrência de suspeita ou confirmação de covid19, adicionamos também os óbitos em decorrência de pneumonia e insuficiência respiratória para 2020 e 2019; esses dados poderão nos ajudar a estimar a subnotificação por falta de testes, principalmente se comparados aos mesmos períodos de anos anteriores. Além desses dados, adicionamos no repositório uma planilha com as semanas epidemiológicas e consultas em SQL que facilitam análises.
Todo o trabalho desenvolvido no Brasil.IO é feito de maneira voluntária e colaborativa é mantido através de doações; ajude-nos doando para nossa campanha de financiamento coletivo e se puder, fique em casa: o isolamento social é a única forma de diminuirmos a quantidade de mortes!