Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Corrigir/atualizar esquema da tabela obitos_cartorio #193

Open
augusto-herrmann opened this issue Jul 28, 2020 · 12 comments
Open

Corrigir/atualizar esquema da tabela obitos_cartorio #193

augusto-herrmann opened this issue Jul 28, 2020 · 12 comments
Assignees
Labels
automation bug Something isn't working

Comments

@augusto-herrmann
Copy link
Contributor

Recentes atualizações quebraram os testes automatizados de validação de dados. Especificamente, as colunas do arquivo obitos_cartorio.csv não correspondem mais ao que está no esquema.

É necessário fazer atualizações no esquema para refletir a nova estrutura dessa tabela.

@endersonmaia
Copy link
Collaborator

identifiquei que o arquivo obito_cartorio.csv conta apenas com os campos a seguir :

date
state
new_deaths_pneumonia_2019
new_deaths_pneumonia_2020
new_deaths_respiratory_failure_2019
new_deaths_respiratory_failure_2020
new_deaths_covid19
epidemiological_week_2019
epidemiological_week_2020
deaths_covid19
deaths_respiratory_failure_2019
deaths_respiratory_failure_2020
deaths_pneumonia_2019
deaths_pneumonia_2020

é isso mesmo @turicas ?

pois não tá de acordo com :

@endersonmaia
Copy link
Collaborator

também não condiz com o disponibilizado em https://brasil.io/dataset/covid19/obito_cartorio/

acredito ser uma falha na geração do arquivo obito_cartorio.csv

@endersonmaia endersonmaia added the bug Something isn't working label Jul 28, 2020
@turicas
Copy link
Owner

turicas commented Jul 28, 2020

@endersonmaia pode verificar agora, baixando de https://data.brasil.io/dataset/covid19/obito_cartorio.csv.gz ? Parece que deu algum problema no spider, estou checando.

@endersonmaia

This comment has been minimized.

@endersonmaia
Copy link
Collaborator

@endersonmaia pode verificar agora, baixando de https://data.brasil.io/dataset/covid19/obito_cartorio.csv.gz ? Parece que deu algum problema no spider, estou checando.

continua dando erro, não por causa da quantidade de campos mais, mas pela ordem dos campos

a ordem dos campos no arquigo data/output/obito_cartorio.csv não tá respeitado a ordem definida em schema/obito_cartorio.csv, que é a mesma seguida no datapackage.json

se corrigir a ordem, o validate vai passar

o fix que eu imaginei, seria corrigir a ordem dos campos em datapackage.json e schema/obito_cartorio.csv, mas não me parece o correto

@augusto-herrmann
Copy link
Contributor Author

Deixo aqui um comentário só para lembrar que o problema permanece até hoje. Os dados não estão validando.

@turicas, já que você implementou essa mudança nos dados em julho, poderia corrigir? Precisa de ajuda?

@augusto-herrmann
Copy link
Contributor Author

Vocês também recebem essas notificações de que a build falhou?

@endersonmaia
Copy link
Collaborator

Vocês também recebem essas notificações de que a build falhou?

Não tenho recebido, mas tb não recordo de ter configurado para não receber. 🤔

@augusto-herrmann
Copy link
Contributor Author

Não tenho recebido, mas tb não recordo de ter configurado para não receber. thinking

Eu recebo todos os dias. Eu poderia ir lá corrigir a tabela, mas o tempo é escasso e fico com o receio do Turicas alterá-la de novo e o trabalho ser em vão...

@augusto-herrmann
Copy link
Contributor Author

O meu ponto é: se a build está dando falha há meses e até hoje ninguém investiu o tempo em corrigir, significa que ter essa verificação automática não está servindo ao seu propósito.

@endersonmaia
Copy link
Collaborator

endersonmaia commented Sep 24, 2020

Tem uma PR (#200) de ajuste na documentação da API, talvez quem propôs os ajustes pudesse ajudar com essa tb.

O tempo por aqui tb tá escasso. =/

@augusto-herrmann
Copy link
Contributor Author

Eu poderia fazer um PR com essa mudança. Todavia, considerando que o PR #200 está aberto, sem resposta, há cinco meses, e alguns PRs aqui estão abertos, sem resposta, desde março do ano passado, ele provavelmente também ficaria parado no limbo. Creio que esse tempo poderia ser melhor empregado em outros projetos.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
automation bug Something isn't working
Projects
None yet
Development

No branches or pull requests

3 participants