Modelización estadística aplicada en R
Datos y analítica
Cursos y talleres
- Límite de inscripción: 08/11/2018 00:00
- Fechas: 08/11/2018 00:00 - 11/11/2018 00:00
- Duración: horas
- Modalidad:
Datos de interés
- Precio: Gratuito
El objetivo fundamental de cualquier data scientist (o estadístico) es modelar correctamente un fenómeno. Casi siempre para predecir su comportamiento futuro, pero también para comprender y analizar este. Con todo tipo de aplicaciones desde tráfico aéreo, hasta genética pasando por comportamientos sociológicos la estadística y en concreto el modelado estadístico es un conocimiento básico y muy relevante para cualquier data scientist.
Objetivo del curso: Conocer los fundamentos del modelado estadístico y conocer las familias de modelos más utilizados. Comparar correctamente modelos candidatos para resolver un problema. Saber qué criterios se deben utilizar para elegir un modelo u otro y tener experiencia práctica resolviendo problemas con datasets reales.
Dirigido a: El curso de modelización estadística aplicada en R está orientado a alumnos con conocimientos previos en R y en manipulación de datos. Se recomienda realizar el módulo previo o conocimiento similar equivalente.
Debe conocer librerías de manpulación de datos como dplyr y graficación básica con ggplot2. Además de manejar con soltura las estructuras de datos y la programación en R. Los alumnos aprenderán los fundamentos necesarios de estadística en el curso por tanto no se requieren conocimientos previos de estadística El alumno necesita un portátil (Windows/Max/Linux) con RStudio Desktop y R instalado previamente.
– Rstudio se puede descargar en:
https://cran.r-project.org/bin/windows/
https://cran.r-project.org/bin/linux/
https://cran.r-project.org/bin/macosx/
– R se puede descargar en: https://cran.r-project.org/bin/windows/base/
Lugar: Sala Global. Edificio INCUBE. Recinto Ferial de Canarias (INFECAR). Avda. de la Feria nº1. Las Palmas de Gran Canaria.
Fecha y Horario: 8 al 11 de noviembre 2018. 4 sesiones de 5 horas c/u.. 20 horas lectivas en total.
Jueves, 8 de noviembre 2018, de 16:00 a 21:00 h.
Viernes, 9 de noviembre 2018, de 16:00 a 21:00 h.
Sábado, 10 de noviembre 2018, de 9:00 a 14:00 h.
Domingo, 11 de noviembre 2018, de 9:00 a 14:00 h.
Programa:
- Bloque I
- Introducción
- Conceptos básicos: error y estimación
- Modelo lineal simple y multivariado
- Ejemplo I de Kaggle
- Errores típicos de interpretación
- Bloque II
- Modelos lineales generalizados
- Ejemplo II de Kaggle
- Errores típicos de interpretación
- Comparación de modelos
- Bloque III
- Modelos de árbol
- Support vector machines
- Ejemplo III de Kaggle
- Bloque IV
- Modelos no supervisados clustering
- Reducción de dimensionalidad
- Ejemplo IV de Kaggle
- No todo es estadística: diseño experimental
- ¿Cómo continuar? ¿Qué más aprender?
Ponente: Alejandro Vidal
Data Scientist y diseñador en BBVA Data Analytics. Actualmente imparte formación en múltiples escuelas sobre visualización de datos, diseño de productos analíticos, programación y estadística. Previamente desarrolló sus investigaciones en psicometría y modelado del
comportamiento humano.
Precio: 100 € (impuestos incluidos)
Bonificaciones:
- En caso de ocupar un espacio dentro de las instalaciones destinadas a emprendedores y empresas gestionadas por la SPEGC o por la Fundación Parque Científico Tecnológico de la ULPGC (debe indicar nº tarjeta acceso al realizar la inscripción), tiene un descuento del 50% en la cuota de ingreso para cada curso / taller ofertado.
- Desempleados que acrediten su situación con DARDE actualizado-vigente (adjuntar documento al realizar la inscripción), tiene un descuento del 50% en la cuota de ingreso para cada curso / taller ofertado.
- Los descuentos no son acumulables.