Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

BPE n'est plus disponible à cet url #65

Open
linogaliana opened this issue Jul 12, 2021 · 6 comments
Open

BPE n'est plus disponible à cet url #65

linogaliana opened this issue Jul 12, 2021 · 6 comments

Comments

@linogaliana
Copy link
Contributor

Il semblerait que la BPE ait changé d'URL

doremifasol::telechargerDonnees("BPE_ENS")
essai de l'URL 'https://www.insee.fr/fr/statistiques/fichier/3568629/bpe19_ensemble_csv.zip'
Error in download.file(url = caract$lien, destfile = nomFichier) : 
  impossible d'ouvrir l'URL 'https://www.insee.fr/fr/statistiques/fichier/3568629/bpe19_ensemble_csv.zip'
De plus : Warning message:
In download.file(url = caract$lien, destfile = nomFichier) :
  cannot open URL 'https://www.insee.fr/fr/statistiques/fichier/3568629/bpe19_ensemble_csv.zip': HTTP status was '500 '
@py-b
Copy link
Member

py-b commented Jul 12, 2021

Effectivement, cette page semble dynamique, la BPE 2020 a remplacé la BPE 2019 à cette url : https://www.insee.fr/fr/statistiques/3568629/

Le fichier s'appelle maintenant bpe20_ensemble_csv.zip.

linogaliana added a commit to InseeFrLab/utilitr-presentation that referenced this issue Jul 12, 2021
@py-b
Copy link
Member

py-b commented Jul 23, 2021

J'étais parti pour faire la petite modif constitant à changer le 19 en 20. Mais je me suis rendu compte qu'il fallait aussi vérifier les modalité des variables (notamment la nomenclature TYPEQUIP), et ça m'a découragé.

Je persiste à penser que ces infos ne devraient pas être dans le json parce que ça rend la maintenance difficile. Elles sont dispo en téléchargement sur le site et pour l'instant on ne fait rien de ces informations contenues dans le json.

@pierre-lamarche
Copy link
Contributor

Bien reçu, normalement ce genre de travaux est scripté là : https://github.com/InseeFrLab/DoReMIFaSol/blob/master/data-raw/archive/liste_donnees.R
La bonne réponse est je pense à terme d'automatiser ce travail de mise à jour de la base de données.

@linogaliana
Copy link
Contributor Author

linogaliana commented Jul 23, 2021

Dans le cadre de pynsee, je voulais écrire un script qui check de manière automatique l'ensemble des URL pour chaque entrée du JSON. Avec python, cela ne devrait pas être excessivement compliqué.

Ce script pourrait tourner à intervalles réguliers avec cron.

Cela donne un indicateur régulier des clés à mettre à jour

@py-b
Copy link
Member

py-b commented Aug 16, 2021

J'ai corrigé les noms de fichiers : 1b6397d
Les métadonnées restent pour l'instant celles de la BPE 2019.

@py-b
Copy link
Member

py-b commented Jul 28, 2022

Remplacé 2020 par 2021.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants