Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Intégration des indicateurs conjoncturels d'activité #66

Open
linogaliana opened this issue Sep 13, 2021 · 1 comment
Open

Intégration des indicateurs conjoncturels d'activité #66

linogaliana opened this issue Sep 13, 2021 · 1 comment

Comments

@linogaliana
Copy link
Contributor

linogaliana commented Sep 13, 2021

Sur insee.fr on peut trouver toute une série d'indicateurs conjoncturels d'activités (ICA)

L'URL est assez bien structuré et permet donc de récupérer facilement ces données. Par exemple, au hasard, pour récupérer la série 010539343 (celle-ci). L'URL est le suivant:

https://www.insee.fr/fr/statistiques/serie/telecharger/csv/010539343?ordre=antechronologique&transposition=donneescolonne&periodeDebut=1&anneeDebut=1999&periodeFin=6&anneeFin=2021

On peut donc identifier la structure suivante:

https://www.insee.fr/fr/statistiques/serie/telecharger/csv/{IDENTIFIANT}?ordre=antechronologique&transposition=donneescolonne&periodeDebut=1&anneeDebut={ANNEE_DEBUT}&periodeFin=6&anneeFin={ANNEE_FIN}

qui permet de requêter facilement plusieurs séries avec une fonction aux arguments bien faits.

Dans pynsee, tous les éléments sont en place pour récupérer ces données, en modularisant le code ci-dessous. Je pense que c'est pareil pour doremifasol

import os
import requests
from pynsee.download import download_pb, unzip_pb
 
download_pb("https://www.insee.fr/fr/statistiques/serie/telecharger/csv/010539344?ordre=antechronologique&transposition=donneescolonne&periodeDebut=1&anneeDebut=1999&periodeFin=6&anneeFin=2021",fname = "data.zip")
 
unzip_pb("data.zip", "ica", desc="Extracting")
 
os.listdir()
os.listdir("./ica")

J'ai donc deux questions:

  • est-ce que vous êtes partants pour intégrer ces sources dans doremifasol ?
  • A votre avis, quelle est la meilleure manière d'intégrer ces sources ? Doit-on intégrer ça au JSON ou faire une fonction qui plugge des arguments dans un url, sans faire les vérifications (md5 checksum...) faites pour les autres sources de données ?
@py-b
Copy link
Member

py-b commented Sep 14, 2021

Salut @linogaliana

Je me demande si ce n'est pas géré par le package insee d'Hadrien.

Si on veut intégrer ça à doremifasol, ma première idée serait d'ajouter une entrée dans le json avec le motif de l'url de téléchargement et un champ supplémentaire contenant les paramètres (années).

Ensuite, il faudra donner la possibilité à l'utilisateur de passer ces paramètres en entrée (via une liste par exemple). Ceci pourrait se faire par l'ajout d'un nouvel argument à telechargerFichier.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants