Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Nouvelle source - Fichier des naissances - juillet 2023 #84

Open
gperonne opened this issue Sep 20, 2023 · 2 comments
Open

Nouvelle source - Fichier des naissances - juillet 2023 #84

gperonne opened this issue Sep 20, 2023 · 2 comments

Comments

@gperonne
Copy link

Vous souhaitez proposer une une nouvelle source et ses caractéristiques, afin que les administrateurs l'intègrent au package ?

Inclure a minima l'url sur insee.fr à partir de laquelle on peut télécharger le fichier correspondant.

Par exemple : https://www.insee.fr/fr/statistiques/2115011

Autres informations

Les informations suivantes étant également nécessaires, compléter la liste suivante faciletera la tâche des administrateurs du package (remplacer les valeurs exemples par les valeurs de la nouvelle source).

"date_ref": "2023-09-07",
"lien": "https://www.insee.fr/fr/statistiques/fichier/7665393/naissances_juil_2023.xlsx",
"zip": false,
"type": "xlsx",
"fichier_donnees": "naissances_juil_2023.xlsx",
"fichier_meta": ""

Signification des champs :

  • date_ref : la date (éventuelle) de référence des données
  • lien : l'URL pour le téléchargement des données
  • zip : les données sont-elles zippées ou non (true ou false)
  • type : le format des données (csv, xls, xlsx), à l'intérieur de l'archive si "zip": true
  • fichier_donnees : le nom du fichier de données, dans un éventuel zip
  • fichier_meta : le nom du fichier descriptif des données, dans un éventuel zip
@pierre-lamarche
Copy link
Contributor

pierre-lamarche commented Sep 25, 2023

Je regarde cette demande, le fichier n'est pas à proprement parler un fichier détail mais une série chronologique. Il me semble qu'on trouve la même série dans la BDM : https://www.insee.fr/fr/statistiques/serie/001641601
De sorte que le code suivant permet de récupérer la donnée sans passer par doremifasol :

url_nais <- "https://bdm.insee.fr/series/sdmx/data/SERIES_BDM/001641601"
data_nais <- rsdmx::readSDMX(url_nais)

nais <- as.data.frame(data_nais) %>%
  arrange(TIME_PERIOD)

@Benjamin-Phan
Copy link

Bonjour Pierre,

On peut effectivement récupérer des données de naissances de cette façon. Cependant, elles n'ont pas le même format, ce qui est un peu embêtant pour la fluidité de la séquence de formation que nous écrivons.

Quitte à télécharger les données via une url, on peut utiliser le fichier initialement souhaité de cette façon :

url_nais <- "https://www.insee.fr/fr/statistiques/fichier/7665393/naissances_juil_2023.xlsx"
data_nais <- openxlsx::read.xlsx(url_nais)

Est-ce que cela conviendrait pour la formation R Consolidation ?

Aussi, pour que l'on comprenne bien ; doremifasol n'a pas pour vocation de donner accès à n'importe quelles données sur le site de l'Insee mais seulement certains types de données ?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants