Cloudera para Spark y Hadoop

Bigdata e inteligencia del negocio

Cursos para profesionales

Límite de inscripción: 02/11/2018
Fechas: 05/11/2018 hasta 08/11/2018

Objetivo del curso: Conocer como se distribuyen, almacenan y procesan los datos en un Cluster Hadoop. Conocer cómo se utiliza Sqoop y carga real-time de datos con Flume. Aprender a procesar los datos y como presentar los datos en cluster con Apache Spark.  Conocer como presentar datos estructurados como tablas en Impala y Hive. Saber buenas prácticas en almacenamiento de datos.

Dirigido a: El curso esta dirigido a desarrolladores e ingenieros con experiencia en programación. Es necesario conocimiento en Python y/o Scala. No se requiere conocimiento previo en Hadoop. Es necesario que el alumno aporte un portátil tipo PC.

Lugar: Sala Formación. Centro Demostrador TIC Innovación Turística. Recinto Ferial de Canarias (INFECAR). Avda. de la Feria nº1. Las Palmas de Gran Canaria.

Fecha y Horario: 5 al 8 de noviembre 2018.   28 horas lectivas en total.

Lunes, 5 de noviembre 2018, de 14:00 a 21:00 h.
Martes, 6 de noviembre 2018, de 14:00 a 21:00 h.
Miércoles, 7 de noviembre 2018, de 14:00 a 21:00 h.
Jueves, 8 de noviembre 2018, de 14:00 a 21:00 h.

Programa del curso:

  • Introducción a Apache Hadoop y el ecosistema
  • Archivos de almacenamiento Apache Hadoop
  • Proceso de datos en un cluster de Apache Hadoop
  • Fundamentos de Apache Spark
  • Trabajar con Dataframes y Schemas
  • Análisis de datos con consultas DataFrame
  • RDDs
  • Transformación de datos con RDDs
  • Agregación de datos con Pais RDDs
  • Consulta y vistas de tablas con Spark SQL
  • Creación, configuración y ejecución de aplicaciones Spark
  • Procesamiento distribuido
  • Persistencia de datos distribuidos
  • Spark Streaming: Introducción a DStream
  • Spark Streaming: procesamiento de múltiples lotes
  • Apache Spark Streaming: Data Source
  • Conclusión

Ponente: Tech Train Solutions

Precio: 150 € (impuestos incluidos)

Bonificaciones:

  • En caso de ocupar un espacio dentro de las instalaciones destinadas a emprendedores y empresas gestionadas por la SPEGC o por la Fundación Parque Científico Tecnológico de la ULPGC (debe indicar nº tarjeta acceso al realizar la inscripción), tiene un descuento del 50% en la cuota de ingreso para cada curso / taller ofertado.
  • Desempleados que acrediten su situación con DARDE actualizado-vigente (adjuntar documento al realizar la inscripción), tiene un descuento del 50% en la cuota de ingreso para cada curso / taller ofertado.
  • Los descuentos no son acumulables.
Cloudera para Spark y Hadoop
5 (100%) 12 votes