1 Ano de Dados Acessíveis


Tive a ideia de criar o Brasil.IO há muitos anos, em 2013, porém por diversos motivos (incluindo mudanças na ideia inicial) o desenvolvimento da plataforma como existe hoje foi iniciado somente em 2018 - o pontapé inicial aconteceu após uma palestra que apresentei na Python Sudeste 2018, em São Paulo: algumas das pessoas que assistiram ficaram comovidas com a ideia e se voluntariaram a ajudar, daí no evento mesmo já estruturamos algumas coisas.

O site foi ao ar alguns dias depois do evento e diversas alterações foram sendo feitas, então eu tive que escolher um desses dias para considerar o início do projeto; escolhi o dia em que adicionei o código de configuração de infraestrutura do PostgreSQL. PostgreSQL é um dos mais avançados sistemas de gerenciamento de banco de dados, é software livre e peça fundamental no Brasil.IO: os metadados, os dados e os índices de busca de todos os datasets da plataforma são servidos por ele e, por conta disso, resolvi fazer essa homenagem.

Nesses últimos 12 meses tivemos algumas conquistas e ainda temos alguns desafios pela frente:

Interface Acessível

Apesar de razoavelmente simples, nossa interface facilita muito o trabalho de diversas pessoas (que possivelmente não teriam tempo/conhecimento técnico/dinheiro suficientes para fazer todo o trabalho de coleta, limpeza, conversão e hospedagem dos dados), pois apresenta datasets com milhões de registros de uma maneira rápida, possibilitando filtros, paginação e exportação dos resultados (seja baixando como CSV ou através de nossa API). Além das páginas de datasets, as páginas especiais facilitam o cruzamento entre datasets e análises mais profundas, com poucos cliques.

Como ponto a melhorar temos a experiência do usuário e usabilidade das páginas.

Datasets Relevantes

Dois datasets da plataforma são de extrema relevância tanto para jornalistas investigativos, cientistas políticos, advogados, ativistas, dentre outros: socios-brasil (contém a lista de CNPJs das empresas brasileiras e seus sócios) e eleicoes-brasil (contém dados de candidaturas, votação, declaração de bens e filiação partidária das eleições, desde 1996).

Por conta de termos esses dados acessíveis possibilitamos diversas matérias serem publicadas, como:

Contribuímos também com o desenvolvimento de aplicativos que ajudaram no processo eleitoral:

Como ponto a melhorar, precisamos adicionar mais datasets à plataforma: apesar de eu ter criado divesos outros programas de coleta de dados (como recentemente um em que extraí os beneficiados da Lei da Anistia), parte deles não está disponível porque precisamos melhorar o processo de criação e atualização de datasets, que tem parte manual.

Luta por Dados Abertos

Infelizmente, nem sempre os dados que precisamos estão disponíveis - e quando isso acontece tenho duas tarefas: alertar sobre o problema e utilizar a Lei de Acesso à Informação para resolver a questão.

Um caso bastante famoso que teve diversas repercussões foi quando a Receita Federal quis nos cobrar meio milhão de Reais por dados públicos, porém diversos outros casos aconteceram (e os processos ainda estão rolando), como:

Acredito que esse ativismo seja importante não só para resolver as questões pontualmente, mas também para mudar a cultura do setor público com relação às políticas de transparência e dados abertos. Utilizo bastante minha conta no Twitter e minhas palestras para divulgar esses casos (em breve talvez eu faça uma sessão de vídeos contando em mais detalhes!).

Comunicação

Por muitas vezes a comunicação da plataforma foi falha, deixando dúvidas sobre seu funcionamento, processo de desenvolvimento, atualizações etc. Para suprir essa necessidade criamos uma newsletter e, recentemente, nosso blog (que em breve terá mais publicações técnicas). Aos poucos estamos mudando as páginas da plataforma para comunicarem melhor o que gostaríamos (que inclusive irá diminuir o fluxo que recebo de emails com dúvidas).

Financiamento

Durante os 12 últimos meses foquei bastante na questão técnica (criar novos programas coletores de dados, melhorar o código da plataforma) e divulgação (palestras) e acabei deixando de lado a questão financeira. Hoje o projeto é deficitário: ainda não arrecadamos o suficiente em doações para pagar a infraestrutura (veja sobre os custos do projeto) e, por isso, mantenho boa parte dos custos. Precisamos de em torno de R$ 1.100,00 mensais (varia conforme a cotação do dólar - valores em abril de 2019) apenas para manter a plataforma online (esse valor não contempla horas de trabalho) e por enquanto nossa campanha de financiamento coletivo recebe metade desse valor.

Estou buscando instituições que acreditem nos valores do projeto e queiram apoiá-lo (seja em forma de apoios voluntários ou grants/editais com algum entregável) e também clientes de projetos de Web scraping de dados públicos que paguem o tempo de desenvolvimento de novos coletores ou a melhoria dos já existentes. Se você puder ajudar ou conhece alguém que possa, por favor entre em contato.

Conclusão

Os últimos 12 meses foram maravilhosos, a plataforma se mostrou madura e geramos diversos impactos positivos, porém ainda temos muito o que melhorar principalmente no que diz respeito à sustentabilidade financeira do projeto. Para os próximos 12 meses estamos abertos a colaborações para criar um ecossistema de dados abertos acessíveis que facilite o surgimento de diversas iniciativas que tem como objetivo exercer controle social. Vida longa ao Brasil.IO!