Bienvenidos a LatinR 2025
Le damos la bienvenida a este taller que se presentará en la conferencia LatinR 2025 el 1 de diciembre. Construiremos, paso a paso, un flujo completo de machine learning con tidymodels: vamos a generar y explorar datos, estimar, comparar y regularizar modelos. Todo el material de apoyo (scripts .qmd, diapositivas y datos) se encuentra agregado en esta página para que puedas replicar cada demostración.
Trabajaremos principalmente con datos simulados para ilustrar los conceptos. A partir de ellos, enfatizaremos tres ideas clave:
- Cómo estimar el error de generalización con resampling.
- Cómo separar y visualizar el error en términos de sesgo, varianza y ruido.
- Cómo aplicar regularización (Lasso) para reducir la complejidad y seleccionar predictores.
Instrucciones
Preparación antes de LatinR
Para poder reproducir los ejemplos durante la charla:
- Cuenta en Posit Cloud: si aún no la tienes, crea una cuenta gratuita en Posit Cloud.
- Revisa los paquetes:
tidymodels,vip,treemisc,usemodelsy dependencias actualizadas.
Ante cualquier duda previa al evento puedes escribirnos.
Agenda en LatinR
- Introducción a Machine Learning con tidymodels
- Estimación de modelos de regresión lineal
- Árboles de decisión
- Regularización (Lasso)
Facilitadores
- Francisco Cardozo (focardozom@gmail.com)
- Edgar Ruiz ()
Diapositivas
Agenda y materiales
- 1. Introducción a
tidymodels– Panorama general y flujo de trabajo. - 2. Por qué
tidymodels– Motivación y ventajas frente a otros enfoques. - 3. Generar los datos – Simulación de datos y preparación para demos.
- 4. Modelos – Regresión logística, métricas y desafíos guiados.
- 5. Árboles – Árboles de decisión y visualización de reglas.
- 6. Tunning – Resampling, tuning y Random Forest.
- 7. Regularización – Regresión lineal, regularización y VIP.
Código de Comportamiento
Este es nuestro Código de Comportamiento. En resumen, los asistentes al taller se comprometen a generar y respetar un entorno inclusivo y seguro para todos los participantes. No se esperan comportamientos inaceptables como la discriminación y el acoso. Cualquier violación a estas normas puede resultar en medidas que van desde advertencias hasta la expulsión del evento.
Otros talleres
- Taller R/medicine 2024
- Taller de intrudcción a Machine Learning. Fundación Universitaria Konrad Lorenz - febrero 2024
- Taller para crear tablas en R. Universidad Nacional, octubre 2023
- Taller en el Seminario Internacional de Educación Noviembre 2023
- Imbalanced data in Machine Learning Modeling, 2023
- Taller en la Universidad Nacional octubre, 2023
- Taller en la Universidad de los Andes febrero, 2023
Agradecimiento
Este taller es posible gracias a la Organización de LatinR. Si encuentras algún aspecto que pueda ser mejorado, por favor envíe un issue en nuestro repositorio de GitHub.
Licencia
Estos materiales han sido desarrollados bajo la siguiente licencia CC BY-SA 4.0 DEED.