Modelización estadística aplicada en R

Datos y analítica

Cursos y talleres

  • Límite de inscripción: 08/11/2018 00:00
  • Fechas: 08/11/2018 00:00 - 11/11/2018 00:00
  • Duración: horas
  • Modalidad:

Datos de interés

  • Precio: Gratuito

El objetivo fundamental de cualquier data scientist (o estadístico) es modelar correctamente un fenómeno. Casi siempre para predecir su comportamiento futuro, pero también para comprender y analizar este. Con todo tipo de aplicaciones desde tráfico aéreo, hasta genética pasando por comportamientos sociológicos la estadística y en concreto el modelado estadístico es un conocimiento básico y muy relevante para cualquier data scientist.

Objetivo del curso: Conocer los fundamentos del modelado estadístico y conocer las familias de modelos más utilizados. Comparar correctamente modelos candidatos para resolver un problema. Saber qué criterios se deben utilizar para elegir un modelo u otro y tener experiencia práctica resolviendo problemas con datasets reales.

Dirigido a: El curso de modelización estadística aplicada en R está orientado a alumnos con conocimientos previos en R y en manipulación de datos. Se recomienda realizar el módulo previo o conocimiento similar equivalente.

Debe conocer librerías de manpulación de datos como dplyr y graficación básica con ggplot2. Además de manejar con soltura las estructuras de datos y la programación en R. Los alumnos aprenderán los fundamentos necesarios de estadística en el curso por tanto no se requieren conocimientos previos de estadística El alumno necesita un portátil (Windows/Max/Linux) con RStudio Desktop y R instalado previamente.

– Rstudio se puede descargar en:

https://cran.r-project.org/bin/windows/

https://cran.r-project.org/bin/linux/

https://cran.r-project.org/bin/macosx/

– R se puede descargar en: https://cran.r-project.org/bin/windows/base/

Lugar: Sala Global. Edificio INCUBE. Recinto Ferial de Canarias (INFECAR). Avda. de la Feria nº1. Las Palmas de Gran Canaria.

Fecha y Horario: 8 al 11 de noviembre 2018. 4 sesiones de 5 horas c/u..  20 horas lectivas en total.

Jueves, 8 de noviembre 2018, de 16:00 a 21:00 h.

Viernes, 9 de noviembre 2018, de 16:00 a 21:00 h.

Sábado, 10 de noviembre 2018, de 9:00 a 14:00 h.

Domingo, 11 de noviembre 2018, de 9:00 a 14:00 h.

Programa:

  • Bloque I
    • Introducción
    • Conceptos básicos: error y estimación
    • Modelo lineal simple y multivariado
    • Ejemplo I de Kaggle
    • Errores típicos de interpretación
  • Bloque II
    • Modelos lineales generalizados
    • Ejemplo II de Kaggle
    • Errores típicos de interpretación
    • Comparación de modelos
  • Bloque III
    • Modelos de árbol
    • Support vector machines
    • Ejemplo III de Kaggle
  • Bloque IV
    • Modelos no supervisados clustering
    • Reducción de dimensionalidad
    • Ejemplo IV de Kaggle
    • No todo es estadística: diseño experimental
    • ¿Cómo continuar? ¿Qué más aprender?

Ponente: Alejandro Vidal

Data Scientist y diseñador en BBVA Data Analytics. Actualmente imparte formación en múltiples escuelas sobre visualización de datos, diseño de productos analíticos, programación y estadística. Previamente desarrolló sus investigaciones en psicometría y modelado del

comportamiento humano.

Precio: 100 € (impuestos incluidos)

Bonificaciones:

  • En caso de ocupar un espacio dentro de las instalaciones destinadas a emprendedores y empresas gestionadas por la SPEGC o por la Fundación Parque Científico Tecnológico de la ULPGC (debe indicar nº tarjeta acceso al realizar la inscripción), tiene un descuento del 50% en la cuota de ingreso para cada curso / taller ofertado.
  • Desempleados que acrediten su situación con DARDE actualizado-vigente (adjuntar documento al realizar la inscripción), tiene un descuento del 50% en la cuota de ingreso para cada curso / taller ofertado.
  • Los descuentos no son acumulables.