diff --git a/data-raw/chargement_aom_epci.R b/data-raw/chargement_aom_epci.R index ce66d9fe4c2024703991da0f810aa0e525756cb2..4a154ce006e15a4ecd309527fe0548dd97a2e9c7 100644 --- a/data-raw/chargement_aom_epci.R +++ b/data-raw/chargement_aom_epci.R @@ -2,9 +2,10 @@ # chargement_aom_epci # chargement des autorités organisatrices de la mobilité (AOM) à partir du site Banatic -# https://www.banatic.interieur.gouv.fr/V5/fichiers-en-telechargement/fichiers-telech.php# dans fichiers en télechargement, fichier "France"-"compétence des groupements" -# fichier excel , transformé en csv -# données au 01/04/2022 +# https://www.banatic.interieur.gouv.fr/V5/fichiers-en-telechargement/fichiers-telech.php +# dans Archives, prendre la dernière année, type d'archive: "périmetre des groupements", +# échelon "France"-télécharger le tableau csv +# données au 01/04/2024 # valeur des codes de compétence disponibles sur # https://www.banatic.interieur.gouv.fr/V5/ressources/documents/document_reference/Banatic_Metadonnees2019.xlsx # le code correspondant aux AOM est le C4530 "Organisation de la mobilité, au sens des articles L.1231-1 et suivants du code des transports" @@ -23,12 +24,15 @@ library(dplyr) library(COGiter) library(DBI) library(RPostgreSQL) +library(datalibaba) +library(googlesheets4) rm(list = ls()) # chargement des données -------- -aom <- read.csv2("extdata/AOM_Compétences des groupements - France entière.csv", +# aom <- read.csv2("extdata/AOM_Compétences des groupements - France entière.csv", +aom <- read.csv2("extdata/aom_Périmètre_des_groupements_en_2024.csv", dec='.', header = TRUE, sep=";", @@ -44,13 +48,14 @@ epci_interreg <- epci %>% mutate(EPCI=as.character(EPCI))%>% pull(EPCI) -date = 2022 +date = 2024 aom <- aom %>% mutate(N..SIREN = as.character(N..SIREN)) %>% filter(C4530 == 1 , N..SIREN %in% epci_interreg)%>% rename(epci = N..SIREN) %>% select("epci") %>% + unique() %>% mutate(date = make_date(date,04,01), AOM ="TRUE") %>% mutate(epci = fct_expand(epci, epci_interreg)) %>% complete(epci,date,fill = list(AOM = "FALSE")) diff --git a/data-raw/chargement_combustible_principal_rp.R b/data-raw/chargement_combustible_principal_rp.R index d4e514f7015b9db2c58e60350e8725705fd497d5..56ca5b813d6bfd7a910b4bcf9c7bf22863567f04 100644 --- a/data-raw/chargement_combustible_principal_rp.R +++ b/data-raw/chargement_combustible_principal_rp.R @@ -20,6 +20,9 @@ # https://www.insee.fr/fr/statistiques/fichier/7631446/TD_PRINC30M_2020_csv.zip # paru le 27/06/2023 +# 2021 --> https://www.insee.fr/fr/statistiques/8202355?sommaire=8202874 +# https://www.insee.fr/fr/statistiques/fichier/8202355/TD_PRINC30M_2021_csv.zip +# paru le 27/06/2024 # librairies ---------- library(tidyverse) @@ -32,19 +35,19 @@ rm(list = ls()) # chargement data et calcul ------- -download.file(url = "https://www.insee.fr/fr/statistiques/fichier/7631446/TD_PRINC30M_2020_csv.zip", - destfile = "extdata/BTT_TD_PRINC30M_2020.zip") -unzip("extdata/BTT_TD_PRINC30M_2020.zip", overwrite = TRUE, exdir = "extdata") -BTT_TD_PRINC30M_2020 <- read.csv2("extdata/TD_PRINC30M_2020.csv", +download.file(url = "https://www.insee.fr/fr/statistiques/fichier/8202355/TD_PRINC30M_2021_csv.zip", + destfile = "extdata/BTT_TD_PRINC30M_2021.zip") +unzip("extdata/BTT_TD_PRINC30M_2021.zip", overwrite = TRUE, exdir = "extdata") +BTT_TD_PRINC30M_2021 <- read.csv2("extdata/TD_PRINC30M_2021.csv", dec='.', header = TRUE, sep=";", stringsAsFactors = FALSE, encoding = "UTF-8") -date = 2020 +date = 2021 -combustible_2020 <- BTT_TD_PRINC30M_2020 %>% +combustible_2021 <- BTT_TD_PRINC30M_2021 %>% filter(NIVGEO == "COM") %>% select (-NIVGEO , -LIBGEO) %>% group_by(CODGEO, CMBL, TYPLR) %>% @@ -81,7 +84,7 @@ combustible_old <- importer_data(db = "datamart", schema = "portrait_territoires", table = "source_combustible_principal_rp") # 2017 -combustible <- bind_rows(combustible_old, combustible) +combustible <- bind_rows(combustible_old, combustible_2021) # versement dans le sgbd/datamart.portrait_territoires et metadonnées ------------- diff --git a/data-raw/chargement_copro_fragiles.R b/data-raw/chargement_copro_fragiles.R index f9d57f23e53c7bdda66d7ce757734ad64f15942e..e457f339566381dd414363e277fc710cd3ea77be 100644 --- a/data-raw/chargement_copro_fragiles.R +++ b/data-raw/chargement_copro_fragiles.R @@ -1,5 +1,7 @@ # chargement_copro_fragiles +# mis à jour dans le sgbd par administrateur de données jusque été 2024. Projet arrété ensuite +# données pouvant être récupérées auprès de SIAL/dph # librairies -------- library(dplyr) @@ -17,8 +19,8 @@ X = 5 # mise à jour dans le SGBD 2e trimestre 2022 # date = 2022 -# mise à jour dans le SGBD 2e trimestre 2023 -date = 2023 +# mise à jour dans le SGBD 2e trimestre 2024 +date = 2024 # liste des communes de la région et des EPCI limitrophes source("R/levels_facteurs_com.R") diff --git a/data-raw/chargement_etat_civil.R b/data-raw/chargement_etat_civil.R index 4ce57d6b8777e145cc3fd2bf9af2ff743f200347..f8cc495b8b2c46a7cbb3f6e80f7b7a6a985d4fbe 100644 --- a/data-raw/chargement_etat_civil.R +++ b/data-raw/chargement_etat_civil.R @@ -15,37 +15,36 @@ rm(list=ls()) #données Etat Civil issues du site de l'INSEE -# fichiers : naissances 2014 à 2021 : https://insee.fr/fr/statistiques/1893255 +# fichiers : naissances 2014 à 2023 : https://insee.fr/fr/statistiques/1893255 # décés 2014 à 2022 : https://insee.fr/fr/statistiques/1893253 # sélection des fichiers sur https://insee.fr/fr/statistiques ??? # paramètres ---------- -mil <- 2022 +mil <- 2023 # chargement -------------- -etat_civil_naissances <- read_excel(paste0("extdata/base_naissances_",mil,".xlsx"),sheet=1, skip=5) %>% +etat_civil_naissances <- read_excel(paste0("extdata/base_naissances_",mil,".xlsx"),sheet=2, skip=3) %>% set_standard_names() -etat_civil_deces <- read_excel(paste0("extdata/base_deces_",mil,".xlsx"),sheet=1, skip=5) %>% +etat_civil_deces <- read_excel(paste0("extdata/base_deces_",mil,".xlsx"),sheet=2, skip=3) %>% set_standard_names() # calcul --------- etat_civil_naissances <- etat_civil_naissances %>% - gather(date,valeur,5:ncol(etat_civil_naissances))%>% + rename(depcom=1) %>% + gather(date,valeur,3:ncol(etat_civil_naissances))%>% mutate(variable="nb_naissances") %>% - select(c(depcom=codgeo,date,variable,valeur)) -etat_civil_naissances$date <- str_replace(etat_civil_naissances$date,"naisd","20") -etat_civil_naissances <- etat_civil_naissances %>% - mutate_if(is.character, as.factor) + select(c(depcom,date,variable,valeur)) +etat_civil_naissances$date <- str_replace(etat_civil_naissances$date,"var_","") etat_civil_deces <- etat_civil_deces %>% - gather(date,valeur,5:ncol(etat_civil_deces))%>% + rename(depcom=1) %>% + gather(date,valeur,3:ncol(etat_civil_deces))%>% mutate(variable="nb_deces") %>% - select(c(depcom=codgeo,date,variable,valeur)) -etat_civil_deces$date <- str_replace(etat_civil_deces$date,"decesd","20") -etat_civil_deces <- etat_civil_deces + select(c(depcom,date,variable,valeur)) +etat_civil_deces$date <- str_replace(etat_civil_deces$date,"var_","") etat_civil<- bind_rows(etat_civil_naissances,etat_civil_deces)%>% complete(depcom,date,variable,fill = list(valeur =0)) %>% @@ -53,6 +52,14 @@ etat_civil<- bind_rows(etat_civil_naissances,etat_civil_deces)%>% mutate_if(is.character, as.factor) %>% pivot_wider(names_from = variable,values_from = valeur) +# suppression des lignes de metadonnees +etat_civil<- etat_civil %>% + mutate(depcom = as.character(depcom)) %>% + mutate(meta = nchar(depcom)) %>% + filter (meta < 6) %>% + select(-meta) %>% + mutate_if(is.character, as.factor) + # # versement dans le sgbd/datamart.portrait_territoires ------------- # drv <- dbDriver("PostgreSQL") diff --git a/data-raw/chargement_mode_transport_dom_travail.R b/data-raw/chargement_mode_transport_dom_travail.R index 82979fccc1375b60618f507d178dceb8c831f1fa..aec8253e64125e937b814ba1d69c9aa2a0430e98 100644 --- a/data-raw/chargement_mode_transport_dom_travail.R +++ b/data-raw/chargement_mode_transport_dom_travail.R @@ -12,18 +12,18 @@ rm(list = ls()) # paramètre --------- -date = 2020 +date = 2021 # chargement data ------------ -# chargement des données : https://www.insee.fr/fr/statistiques/7632973?sommaire=7632977 +# chargement des données : https://www.insee.fr/fr/statistiques/8200836?sommaire=8205947&q=D%C3%A9placement+domicile%2Ftravail+en+2021 # fichier BTT_TD_NAV2B # NAV2 – Population active de 15 ans ou plus ayant un emploi par sexe, lieu de travail (géographie urbaine) # et moyen de transport (Paru le : 27/06/2023) racine_nom_fich <- paste0("extdata/TD_NAV2B_", date) -download.file(url = "https://www.insee.fr/fr/statistiques/fichier/7632973/TD_NAV2B_2020_csv.zip", +download.file(url = "https://www.insee.fr/fr/statistiques/fichier/8200836/TD_NAV2B_2021_csv.zip", destfile = paste0(racine_nom_fich, ".zip")) unzip(paste0(racine_nom_fich, ".zip"), overwrite = TRUE, exdir = "extdata") diff --git a/data-raw/chargement_ptz.R b/data-raw/chargement_ptz.R index ecfb27eaaa192712bc263f9cc5c05501849701af..f67798a21390dade95502e1df34543e0b916a84f 100644 --- a/data-raw/chargement_ptz.R +++ b/data-raw/chargement_ptz.R @@ -36,10 +36,7 @@ ptz<-rbind( cbind(aggregate(valeur~depcom+date,ptz[ptz$variable>100 & ptz$variable<200,],sum),variable="nb_ptz.individuel"), cbind(aggregate(valeur~depcom+date,ptz[ptz$variable>200,],sum),variable="nb_ptz.collectif"), cbind(aggregate(valeur~depcom+date,ptz[substr(ptz$variable,2,2)==1,],sum),variable="nb_ptz.ancien"), - cbind(aggregate(valeur~depcom+date,ptz[substr(ptz$variable,2,2)==2,],sum),variable="nb_ptz.neuf"), - cbind(aggregate(valeur~depcom+date,ptz[substr(ptz$variable,3,3)==2,],sum),variable="nb_ptz.locataire_autre"), - cbind(aggregate(valeur~depcom+date,ptz[substr(ptz$variable,3,3)==3,],sum),variable="nb_ptz.proprietaire_ou_autre"), - cbind(aggregate(valeur~depcom+date,ptz[substr(ptz$variable,3,3)==1,],sum),variable="nb_ptz.locataire_hlm")) %>% + cbind(aggregate(valeur~depcom+date,ptz[substr(ptz$variable,2,2)==2,],sum),variable="nb_ptz.neuf")) %>% # filter(date>=2008)%>% mutate(date=make_date(date,12,31))%>% mutate_if(is.character,as.factor) %>% diff --git a/data-raw/chargement_statut_occupation_des_rp.R b/data-raw/chargement_statut_occupation_des_rp.R index 55565e0e24eaa39a4737cc70d0f65f9d4db74a0a..215dff58ca0ffe4234415735e42cede138ed0438 100644 --- a/data-raw/chargement_statut_occupation_des_rp.R +++ b/data-raw/chargement_statut_occupation_des_rp.R @@ -1,8 +1,8 @@ # chargement_lgt_rp_insee -# 2020 --> https://www.insee.fr/fr/statistiques/7631446?sommaire=7631713 -# https://www.insee.fr/fr/statistiques/fichier/7631446/TD_PRINC2_2020_csv.zip -# paru le 27/06/2023 +# 2021 --> https://www.insee.fr/fr/statistiques/8202355?sommaire=8202874 +# https://www.insee.fr/fr/statistiques/fichier/8202355/TD_PRINC2_2021_csv.zip +# paru le 27/06/2024 # librairies ---------- @@ -15,22 +15,22 @@ library(dplyr) rm(list = ls()) # chargement data ------- -download.file(url = "https://www.insee.fr/fr/statistiques/fichier/7631446/TD_PRINC2_2020_csv.zip", - destfile = "extdata/TD_PRINC2_2020_csv.zip") -unzip("extdata/TD_PRINC2_2020_csv.zip", overwrite = TRUE, exdir = "extdata") +download.file(url = "https://www.insee.fr/fr/statistiques/fichier/8202355/TD_PRINC2_2021_csv.zip", + destfile = "extdata/TD_PRINC2_2021_csv.zip") +unzip("extdata/TD_PRINC2_2021_csv.zip", overwrite = TRUE, exdir = "extdata") # chargement data annees precedentes ------- -load("extdata/statut_occupation_des_rp.RData") -# statut_occupation_des_rp <- importer_data(db = "datamart", -# schema = "portrait_territoires", -# table = "source_statut_occupation_des_rp") +# load("extdata/statut_occupation_des_rp.RData") +statut_occupation_des_rp <- importer_data(db = "datamart", + schema = "portrait_territoires", + table = "source_statut_occupation_des_rp") statut_occupation_des_rp_old <- statut_occupation_des_rp rm(statut_occupation_des_rp) # chargement du nouveau millésime -millesime = 2020 +millesime = 2021 # path <- paste0("extdata/BTT_TD_PRINC2_",millesime,".txt") #pour les années jusque 2016 # path <- paste0("extdata/BTT_TD_PRINC2_",millesime,".csv") #pour les années 2017 à 2019