From f9c29ea955cde6ef4509cbe7ee20655ee3dce17e Mon Sep 17 00:00:00 2001 From: "Franck.Gaspard" <franck.gaspard@developpement-durable.gouv.fr> Date: Wed, 15 May 2024 10:21:18 +0000 Subject: [PATCH] fusion de la branche rpls_cog2024_FG --- .gitignore | 2 + data-raw/chargement_rpls.R | 115 +++++++------------------------------ 2 files changed, 24 insertions(+), 93 deletions(-) diff --git a/.gitignore b/.gitignore index 70fa1bb..a3092c7 100644 --- a/.gitignore +++ b/.gitignore @@ -11,3 +11,5 @@ _targets lib_var_RGE.csv metadata/*.RData sysdata/*.RData +*.RData +R/cog.R \ No newline at end of file diff --git a/data-raw/chargement_rpls.R b/data-raw/chargement_rpls.R index 8116dae..f734009 100644 --- a/data-raw/chargement_rpls.R +++ b/data-raw/chargement_rpls.R @@ -1,107 +1,36 @@ # chargement_rpls -# librairies ------- -library(propre.rpls) -library(tidyr) -library(tidyverse) -library(COGiter) -library(lubridate) -library(readr) -library(datalibaba) -library(googlesheets4) - rm(list = ls()) +library(magrittr) # pour le %>% + source(file = "R/dataprep_all.R") rpls_prep <- dataprep_all() %>% - filter(!is.na(millesime)) + dplyr::filter(!is.na(millesime)) -# #liste des communes des EPCI de la région Pays de la Loire -# communes_region52 <- communes %>% -# filter(grepl("52", REGIONS_DE_L_EPCI)) %>% -# mutate(DEPCOM = as.character(DEPCOM)) %>% -# pull(DEPCOM) +# # liste des communes des EPCI de la région Pays de la Loire +# communes_region52 <- COGiter::communes %>% +# dplyr::filter(grepl("52", REGIONS_DE_L_EPCI)) %>% +# dplyr::mutate(DEPCOM = as.character(DEPCOM)) %>% +# dplyr::pull(DEPCOM) rpls <- rpls_prep %>% - # filter(TypeZone %in% c("Départements", "Régions", "Epci", "France") | CodeZone %in% communes_region52 ) %>% - mutate(date = make_date(as.character(millesime), 01, 01), - across(where(is.character), as.factor)) %>% - select(-millesime) %>% - mutate_if(is.factor, as.character) - - -# dictionnaire de données rpls et rp du package propre.rpls ------------ - -# https://gitlab.com/rdes_dreal/propre.rpls/-/blob/master/inst/rstudio/templates/project/ressources/extdata/ -# dico_var.csv, dico_var_compl.csv et dico_var_rp.csv téléchargés dans exdata du projet sgbd_datamart - -url_dicos <- "https://gitlab.com/rdes_dreal/propre.rpls/-/raw/master/inst/rstudio/templates/project/ressources/extdata/" - -dico_var <- read_csv2(paste0(url_dicos, "dico_var.csv")) %>% - dplyr::bind_rows(read_csv2(paste0(url_dicos, "dico_var_compl.csv"))) %>% - dplyr::bind_rows(read_csv2(paste0(url_dicos, "dico_var_rp.csv"))) %>% - select(-c(Chapitre, usage)) - -dico_var <- semi_join(dico_var, tibble(nom_court = names(rpls))) %>% - # ajout des libellés pour TypeZone CodeZone Zone et date - bind_rows( - tribble( - ~nom_court, ~libelles, - "TypeZone", "Type de zone" , - "Zone" , "Nom de la zone", - "CodeZone" , "Code INSEE de la zone", - "date", "Millesime" - ) + # dplyr::filter(TypeZone %in% c("Départements", "Régions", "Epci", "France") | CodeZone %in% communes_region52 ) %>% + dplyr::mutate( + date = lubridate::make_date(as.character(millesime), 01, 01), + dplyr::across(tidyselect::where(is.character), as.factor) + ) %>% + dplyr::select(-millesime) %>% + dplyr::mutate_if(is.factor, as.character) + +# versement et documentation dans le sgbd/datamart.portrait_territoires ------ +source("R/poster_documenter_ind.R", encoding = "UTF-8") +poster_documenter_ind( + df = rpls, + nom_table_sgbd = "cogifiee_rpls", + comm_source_en_plus = "Chargement des donn\u00e9es sur le package propre.rpls" ) - -# # versement dans le sgbd/datamart.portrait_territoires et métadonnées ------------- -poster_data(data = rpls, - table = "cogifiee_rpls", - schema = "portrait_territoires", - db = "datamart", - user = "does", - pk = c("TypeZone", "CodeZone", "date"), - post_row_name = FALSE, - droits_schema = TRUE, - overwrite = TRUE) - -post_dico_attr(dico = dico_var, - table = "cogifiee_rpls", - schema = "portrait_territoires", - db = "datamart", - user = "does") - -## récupération du nom du présent script source -nom_script_sce <- rstudioapi::getActiveDocumentContext()$path %>% # utilisation de rstudioapi pour récupérer le nom du présent script - basename() %>% # on enlève le chemin d'accès pour ne garder que le nom du fichier - gsub(pattern = ".R$", "", .) # on enlève l'extension '.R' - - -## Récupération des métadonnées de la source -nom_sce <- str_replace(nom_script_sce, "chargement_|ref_|specifique_", "") %>% - str_replace("indicateur_", "") %>% - str_replace("_cogiter|_cog$", "") - -## authentification google sheet grâce au .Renviron -googlesheets4::gs4_auth_configure(api_key = Sys.getenv("google_api_key")) -googlesheets4::gs4_deauth() - -metadata_source <- read_sheet("https://docs.google.com/spreadsheets/d/1n-dhtrJM3JwFVz5WSEGOQzQ8A0G7VT_VcxDe5gh6zSo/edit#gid=60292277", - sheet = "sources") %>% - filter(source == nom_sce) %>% - mutate(com_table = paste0(source_lib, " - ", producteur, ".\n", descriptif_sources)) %>% - pull(com_table) %>% - # ajout de complement sur la généalogie - paste0(".\n", "Chargement des donn\u00e9es sur le package propre.rpls") - -## commentaires de la table -commenter_table(comment = metadata_source, - db = "datamart", - schema = "portrait_territoires", - table = "cogifiee_rpls", - user = "does") - rm(list = ls()) -- GitLab