hvor-er-damene

Lagrer data månedlig fra teamkatalogen med formål å kunne følge med på utviklingen av kvinneandel på ulike roller og områder

Team Heda er ansvarlig.

Datalast

Kilde

Data hentes fra teamkatalogen via deres API.

Tabeller

Tabellene ligger i BigQuery i Heda sitt prod gcp-prosjekt. Datasettet heter teamkatalogen, og her ligger følgende tabeller:

Tabell	Beskrivelse
monthly_snapshot_raw	Rådata fra teamkatalogen, insert hver måned
teamkat_gender_pred	Prosessert data med sannsynlig kjønn
omraade_rolle_stats	Aggregerte data på måned, område og rolle
omraade_stats	Aggregerte data på måned og område
rolle_stats	Aggregerte data på måned og rolle

Skedulering

Datalasten kjøres månedlig via Heda sin airflow. Pga at lasten trenger tilgang til teamkatalogen, kjøres den i Knada sitt miljø.

Servicebruker

Vi har opprettet egen servicebruker i gcp heda-access, som har fått BigQuery Admin-rolle i Heda sitt gcp-prosjekt. Nøkkel for denne servicebrukeren ligger i Google Secret Manager.

Quarto

Vi har et eget dashbord for å visualisere dataene.

Kjør quarto preview dashboard.qmd for å se dashbordet lokalt.

Kjør så publish_story.py for å publisere dashbordet til datamarkedsplassen.

Oppsett

Poetry

Vi har brukt poetry for å håndtere avhengigheter og miljø. Man må da installere poetry for å lage et miljø, men vi har også lagt til en requirements.txt-fil for de som ikke ønsker å bruke poetry, via denne komandoen:

poetry export --without-hashes --format=requirements.txt > requirements.txt

Vi trenger også en requirement.txt-fil for å kjøre dags-ene våre.

Name		Name	Last commit message	Last commit date
Latest commit History 68 Commits
analyse_team		analyse_team
dags		dags
navn		navn
pp_charts		pp_charts
quarto		quarto
teamkatalogen_bq		teamkatalogen_bq
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
initialize.sh		initialize.sh
kilder.md		kilder.md
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

hvor-er-damene

Datalast

Kilde

Tabeller

Skedulering

Servicebruker

Quarto

Oppsett

Poetry

About

Releases

Packages

Contributors 4

Languages

License

navikt/hvor-er-damene

Folders and files

Latest commit

History

Repository files navigation

hvor-er-damene

Datalast

Kilde

Tabeller

Skedulering

Servicebruker

Quarto

Oppsett

Poetry

About

Resources

License

Security policy

Stars

Watchers

Forks

Releases

Packages 0

Contributors 4

Languages

Packages