Title: | Conjunto de funciones para el procesamiento de datos en la DNMyE |
---|---|
Description: | Caja de herramientas para el procesamiento de datos en la Dirección Nacional de Mercados y Estadísticas del Ministerio de Turismo y Deportes de la Nación. |
Authors: | Pablo Tiscornia [aut], Juan Juara [aut, cre], Juan Urricariet [aut], Elián Soutullo [aut], Juan Pablo Ruiz Nicolini [aut] , Dirección Nacional de Mercados y Estadísticas Ministerio de Turismo y Deportes [cph] |
Maintainer: | Juan Juara <[email protected]> |
License: | GPL (>= 3) |
Version: | 0.0.0.9013 |
Built: | 2024-09-18 04:24:29 UTC |
Source: | https://github.com/dnme-minturdep/herramientas |
elementos no contenidos dentro de un conjunto
a %out% b
a %out% b
a |
vector con conjunto de datos |
b |
vetor con conjunto de datos 2 |
Hace una llamada getUrl a la ruta indicada dentro de /srv/DataDNMYE/. Usarlo con read_csv o read_csv2 u otros.
archivo_plano_srv(ruta)
archivo_plano_srv(ruta)
ruta |
Texto con la ruta específica del archivo a leer (ej.: "aerocomercial/anac/tabla_final.txt") |
arma estructura de carpetas para proyecto
crear_carpetas()
crear_carpetas()
Crear esqueleto de un nuevo proyecto de R
crear_proyecto(ruta = NULL)
crear_proyecto(ruta = NULL)
ruta |
nombre de la carpeta y proyecto que se quiere crear |
directorio base para un nuevo proyecto
Genera una columna con el nombre oficial de la provincia y otra columna, denominada "provincia_codigo", con su código numérico INDEC (dos posiciones)
etiquetar_provincia(base, id_col, new_name = "provincia_nombre", add_codes = T)
etiquetar_provincia(base, id_col, new_name = "provincia_nombre", add_codes = T)
base |
Dataframe con una variable que refiere a las provincias |
id_col |
Columna con el nombre de la provincia o su código INDEC |
new_name |
Define el nuevo nombre de la columna con las etiquetas de provincia. Por default es "provincia_nombre" |
add_codes |
Indica si se desea agregar la columna con el código de la provincia. Por default es TRUE |
herramientas
packagePaquete de R con utilidades para "domar los datos" de la DNMYE See the README on Github
Aplica tolower(), str_replace_all() para quitar caracteres especiales y remover_tildes(). También aplica opcionalmente str_replace_all() convertir "ñ" en "n" (por default se aplica). Ej.:
limpiar_texto(texto, enie = TRUE)
limpiar_texto(texto, enie = TRUE)
texto |
variable de clase 'character' a la que se le quiere aplicar la función |
enie |
valor lógico (TRUE o FALSE) indicando si reemplazar "ñ" por "n" |
limpiar_texto("TéxTÔ con una Ñ?!") #"texto con una n" limpiar_texto("TéxTÔ con una Ñ?!", enie = FALSE) #"texto con una ñ"
limpiar_texto("TéxTÔ con una Ñ?!") #"texto con una n" limpiar_texto("TéxTÔ con una Ñ?!", enie = FALSE) #"texto con una ñ"
Devuelve un vector con las ubicaciones en la ruta indicada dentro de /srv/DataDNMYE/.
ls_srv(ruta = NULL, full_names = F)
ls_srv(ruta = NULL, full_names = F)
ruta |
Texto con la ruta específica (ej.: "evyth/microdatos/"). |
full_names |
Lógico Indica si devolver la ruta entera del archivo o directorio o solo el nombre del elemento. |
Transforma digitos del 0 al 100 en palabras. Ej.: "1" en "uno", "25" en "veinticinco".
numeros_en_palabras(texto, intervalo = 0:100)
numeros_en_palabras(texto, intervalo = 0:100)
texto |
variable de clase 'character' a la que se le quiere aplicar la función |
intervalo |
rango entre 0 y 100 con los numeros que se desean reemplazar. Ej. intervalo = 37:50 |
numeros_en_palabras("25 de mayo") #"veinticinco de mayo" numeros_en_palabras("6 de abril del 98") #"seis de abril del noventa y ocho"
numeros_en_palabras("25 de mayo") #"veinticinco de mayo" numeros_en_palabras("6 de abril del 98") #"seis de abril del noventa y ocho"
Hace una conexión a la ruta indicada dentro de /srv/DataDNMYE/ y lee el archivo con una función acorde a la extensión del mismo.
read_file_srv(ruta, ...)
read_file_srv(ruta, ...)
ruta |
Texto con la ruta específica del archivo a leer con su extensión (acepta los siguientes formatos: "rds", "csv", "sav", "txt", ".parquet", "xlsx", "xls", "gpkg", "geojson" y "kml") . Ej.: "aerocomercial/anac/base_anac_agrupada.rds". |
... |
Parámetros para pasarle a la función de lectura subyacente:
|
Hace una conexión a la ruta indicada dentro de /srv/DataDNMYE/ y lee el archivo RDS con readRDS().
read_rds_srv(ruta)
read_rds_srv(ruta)
ruta |
Texto con la ruta específica del archivo a leer (ej.: "aerocomercial/anac/base_anac_agrupada.rds") |
Hace una conexión a la ruta indicada dentro de /srv/DataDNMYE/ y lee el archivo .sav con haven::read_sav().
read_sav_srv(ruta)
read_sav_srv(ruta)
ruta |
Texto con la ruta específica del archivo a leer (ej.: "evyth/microdatos/evyth_microdatos.sav") |
Elimina tildes y dieresis de las vocales y la letra "y". Ej.: "ÿÚòâ" en "yUoa".
remover_tildes(texto)
remover_tildes(texto)
texto |
variable de clase 'character' a la que se le quiere aplicar la función |
remover_tildes("ÿÚòâ") #"yuoa"
remover_tildes("ÿÚòâ") #"yuoa"
Guia para que el usuario configure sus credenciales en .Renviron".
set_user_srv()
set_user_srv()
Vincula proyecto de R local con repositorio de organización en Github.
sync_proyecto_git(repo = "d4t4tur", privado = TRUE, protocolo = "ssh")
sync_proyecto_git(repo = "d4t4tur", privado = TRUE, protocolo = "ssh")
repo |
Por defecto estos se crean en repositorio DEP ('d4t4tur'). Se puede pasar 'repo = "dnme-minturdep"' como argumento alternativo para vincular con repositorio PROD |
privado |
Por defecto el repositorio será privado. Se puede pasar como argumento 'privado = FALSE' para que sea público' |
protocolo |
Por defecto el repositorio usa protocolo de conexión 'ssh'. Se puede pasar como argumento 'protocolo = "https"' como alternativa |
Vínculo origin/remote para un repositorio .git sincronizado con Organización en Github
Calcula la tasa de variación con respecto al período previo según se defina, aplicando dplyr::lag()
tasa_variacion( variable, periodo = "anual", porcentaje = FALSE, presentacion = FALSE )
tasa_variacion( variable, periodo = "anual", porcentaje = FALSE, presentacion = FALSE )
variable |
variable numérica para calcular la variación |
periodo |
indicar cuántos períodos para atrás se calcula. Por defecto es anual (1 período), puede elegirse "mensual" o "trimestral" o directamente el número (12 para mensual por ej.) |
porcentaje |
variación en términos porcentuales (multiplica por 100) |
presentacion |
resultado en formato character con separador de decimales y miles usuales tasa_varaicion(c(10,10,10,10)) tasa_variacion(c(10,10,10,10),periodo = trimestral) |
Devuelve un gráfico interactivo con los directorios y archivos en /srv/DataDNMYE/. El último nodo contiene la ruta completa de la carpeta o archivo para poder copiar y pegar.
view_tree_srv()
view_tree_srv()
Hace una conexión a la ruta indicada dentro de /srv/DataDNMYE/ y escribe un archivo CSV, RDS, XLSX, TXT, PARQUET o SAV.
write_file_srv(x, ruta, ...)
write_file_srv(x, ruta, ...)
x |
Objeto a escribir (ej: data.frame) |
ruta |
Texto con la ruta del archivo, incluyendo nombre y extensión del mismo (acepta ".csv", ".rds", ".xlsx", ".txt", ".parquet", ".sav", "gpkg", "geojson" y "kml"). Ej: "aerocomercial/anac/base_final.csv") |
... |
Parametros para pasarle a la funcion de escritura subyacente:
|