Análisis y tratamiento de datos en R

Datos y analítica

Cursos y talleres

  • Límite de inscripción: 28/10/2018 00:00
  • Fechas: 28/10/2018 00:00 - 04/11/2018 00:00
  • Duración: horas
  • Modalidad:

Datos de interés

  • Precio: Gratuito

Hay un dicho en ciencia de datos que dice que le 80% del esfuerzo se emplea en la limpieza y procesamiento de los datos. Cualquier científico de datos con suficiente experiencia sabe que esto es quedarse corto. Dominar el procesamiento y el tratamiento de datos es muy importante, aunque normalmente se relega en un segundo plano. Estudiaremos las utilidades más importantes para procesar datos estructurados y no estructurados en R. Un dataset correcto, límpio y correctamente tratado es tan importante como el mejor de los modelos. Generar este dataset es el paso previo necesario para cualquier trabajo de ciencia de datos de calidad.

Objetivo del curso: Manejar correctamente las utilidades de manipulación de datos. Conocer las fuentes de información estructuradas y no estructuradas disponibles públicamente. Elegir correctamente qué procesos deben realizarse en un conjunto de datos para determinadas tareas posteriores. Aprender a leer documentación de otros paquetes y de otras fuentes de información para aprender de forma autónoma.

Dirigido a: El curso está orientado a alumnos con conocimientos previos en R. Se recomienda realizar el módulo previo o conocimiento similar equivalente. El alumno necesita un portátil (Windows/Max/Linux) con RStudio Desktop y R instalado previamente.

– Rstudio se puede descargar en:

https://cran.r-project.org/bin/windows/

https://cran.r-project.org/bin/linux/

https://cran.r-project.org/bin/macosx/

– R se puede descargar en: https://cran.r-project.org/bin/windows/base/

Lugar: Sala Formación. Centro Demostrador TIC Innovación Turística. Recinto Ferial de Canarias (INFECAR). Avda. de la Feria nº1. Las Palmas de Gran Canaria.

Fecha y Horario: 28 de octubre al 4 de noviembre 2018. 4 sesiones de 5 horas c/u.  20 horas lectivas en total.

Domingo, 28 del octubre 2018, de 9:00 a 14:00 h.

Viernes, 2 de noviembre 2018, de 16:00 a 21:00 h.

Sábado, 3 de noviembre 2018, de 9:00 a 14:00 h.

Domingo, 4 de noviembre 2018, de 9:00 a 14:00 h.

Programa:

  • Bloque I
    • Repaso a las estructuras de datos en R
    • Manipulación básica de data frames
    • Ejercicio con dataset de vuelos
  • Bloque II
    • Manipulación con dplyr
    • Ejercicio con dataset Kaggle
  • Bloque III
    • Lectura y escritura de datos tabulados
    • Lectura y escritura de datos no estructurados
    • Ejemplo de Youtube API
    • Lectura de imágenes y otras señales
  • Bloque IV
    • Ejemplo de fuentes en streaming: Twitter
    • Datos no estructurados y documentos
    • Tratamiento de series temporales

Ponente: Alejandro Vidal

Data Scientist y diseñador en BBVA Data Analytics. Actualmente imparte formación en múltiples escuelas sobre visualización de datos, diseño de productos analíticos, programación y estadística. Previamente desarrolló sus investigaciones en psicometría y modelado del

comportamiento humano.

Precio: 100 € (impuestos incluidos)

Bonificaciones:

  • En caso de ocupar un espacio dentro de las instalaciones destinadas a emprendedores y empresas gestionadas por la SPEGC o por la Fundación Parque Científico Tecnológico de la ULPGC (debe indicar nº tarjeta acceso al realizar la inscripción), tiene un descuento del 50% en la cuota de ingreso para cada curso / taller ofertado.
  • Desempleados que acrediten su situación con DARDE actualizado-vigente (adjuntar documento al realizar la inscripción), tiene un descuento del 50% en la cuota de ingreso para cada curso / taller ofertado.
  • Los descuentos no son acumulables.