tidymodels
Universidad de Miami
Universidad de Miami
Este workshop es posible gracias a la colaboración de la Fundación Universitaria Konrad Lorenz, la Universidad de Miami, a través del Frost Institute for Data Science and Computing y el Department of Public Health Sciences, y la Corporación Nuevos Rumbos.
No hay una variable de resultado
Hay una variable de resultado
¿Cuál es el inicio y el final del análisis de datos?
Se inicia con importar los datos, seguido por la organización-limpieza de los datos, la exploración, la creación de modelos y finalmente la comunicación de los resultados.
imagen de R4DS
imagen de Tidymodels
ggplot2
- para visualización de gráficos dplyr
- para el procesamiento de datos tidyr
- para la transformación de datos en formato “tidy” (ordenado) readr
- para la lectura de datos en diferentes formatos (CSV, TSV, etc.) purrr
- para la programación funcional tibble
- para la creación de data frames en formato “tidy” stringr
- para la manipulación de cadenas de texto forcats
- para la manipulación de factores más
parsnip
- para la especificación de modelos recipes
- para la preparación de datos rsample
- para la validación de modelos tune
- para la sintonización de hiperparámetros workflows
- para la creación de flujos de trabajo dials
- para la selección de hiperparámetros yardstick
- para la evaluación de modelos más
En este workshop vamos a utilizar tidymodels
para desarrollar los models.
Utilizaremos una base de datos que contiene información sobre factores de riesgo asociados al consumo de drogas en adolescentes. Vamos a desarrollar en primer lugar un modelo descriptivo que nos permita entender la relación entre las variables. Luego vamos a desarrollar un modelo predictivo que nos permita predecir el consumo de drogas en adolescentes basados en los factores de riesgo.
Machine Learning