Afinal de Contas

por Marcelo Soares

 -

Marcelo Soares escreve sobre dados e o que eles podem revelar

PERFIL COMPLETO

Publicidade

A lista dos planos de saúde: em PDF, é um desserviço

Por Marcelo Soares

Eu, o repórter André Monteiro, a editora Lívia Marra, um técnico de informática da Folha e talvez você também perdemos um bom pedaço da tarde tentando (sem sucesso) baixar a lista dos planos de saúde que tiveram a comercialização suspensa hoje pela Agência Nacional de Saúde (ANS).

A lista está em um arquivo PDF de 500 kb. O arquivo não baixou no meu computador, nem no do André, pelo menos. O site da ANS estava lento demais. Baixava 20% do arquivo e travava. Agora cheguei em casa e há 5 minutos a homepage da ANS estava TENTANDO abrir.

(EDITADO: Às 19h52, após três horas de tentativas, o André conseguiu colocar no ar a lista, num PDF adaptado pela Folha. Mais enxuto, o nosso tem apenas 39kb. Baixe aqui.)

LEIA MAIS
ANS suspende a comercialização de 268 planos de saúde (Folha)
HTML dos planos no site da ANS (HOJE funciona)
PDF dos planos no site da Folha (este sempre funcionou)
Princípios de dados abertos governamentais (Dataprev)

O que provavelmente aconteceu é que muitas dezenas de milhares de usuários da internet – particulares e nas empresas – estão tentando baixar o bendito PDF para ver se o SEU plano de saúde teve a comercialização suspensa. Chutando por baixo, digamos que sejam uns 30 mil usuários. É pouco para a internet brasileira.

Para quem costuma baixar arquivos, 500kb parece pouco. Geralmente baixa rapidinho no computador. Uma música curta em MP3 tem seis vezes esse tamanho.

Ocorre que 30 mil usuários baixando um PDF de 500 kb dá um tráfego de mais ou menos 15 GB de dados. Isso se cada um tentar baixar uma só vez. Só eu insisti umas 10 vezes por causa da lentidão. Vamos dizer que sejam 30 mil usuários, cada um insistindo, digamos, 5 vezes.  Isso dá uma tentativa de gerar 75 GB de tráfego.

Facinho derrubar um site com esse volume de demanda. É por isso que, quando o TCU publica listas de gestores públicos inelegíveis (também no maldito PDF, também desnecessariamente), ele o faz num servidor separado, para evitar que a demanda derrube seu site principal.

Neste momento, eu adoraria ser uma mosca na parede da sala onde se administra o site da ANS. Ou na parede do call center da ANS. Os dois lugares devem estar agitados.

Tinha outra saída? Ô, se tinha. Poderia estar em texto puro, não tomando mais de 20kb, ou em HTML, com uns 30kb. Ou numa planilha em XLS, ou em CSV, também formatos de kbytagem irrisória. Você clicaria no link e a lista apareceria quase imediatamente.

O PDF é um formato bonitinho, mas ordinário. Dá pra fazer coisas coloridas, cheias de fotinhos (o PDF da ANS, a julgar pelas primeiras páginas, é todo cheio de corzinhas), mas não dá para trabalhar com a informação. Se a ideia é consulta, a função deveria se sobrepor à forma, não o contrário.

Assim, o PDF é o formato favorito dos gestores públicos que querem demonstrar transparência sem precisar ser necessariamente transparentes. PDF de informações públicas costuma ser, portanto, um desserviço.

As câmaras municipais adoram usar o PDF para abrir suas contas nos “portais de transparência”.

O governo do Estado de São Paulo certa vez publicou os dados do seu cartão corporativo em PDFs de mais de 4 mil páginas por ano. A menos que se passasse algumas horas convertendo e limpando os dados (eu fiz isso), seria impossível fazer qualquer análise com aquela maçaroca de dados.

Prezado gestor público que eventualmente leia este blog: ponha a mão na consciência e mire-se no exemplo da dor de cabeça que a ANS deve estar tendo agora. Eles não precisavam de nada disso.

Na dúvida, leia este guia da Dataprev sobre como publicar dados abertos governamentais.

Se o gestor de informações públicas da ANS fosse meu aluno, eu mandaria escrever 500 vezes no quadro (uma para cada kbyte do PDF), com giz, a seguinte frase:

PDF É UM FORMATO DO MAL; PDF NÃO É TRANSPARÊNCIA
PDF É UM FORMATO DO MAL; PDF NÃO É TRANSPARÊNCIA

Maldade? Nada. Certeza de que ele terminaria mais rápido do que o download do maldito PDF.

Blogs da Folha

Mais acessadas

Nada encontrado
Publicidade
Publicidade
Publicidade