Apache Spark: procesamiento de datos a escala (2ªEdición)

Datos y analítica

Cursos y talleres

  • Límite de inscripción: 19/10/2018 00:00
  • Fechas: 19/10/2018 00:00 - 00:00
  • Duración: horas
  • Modalidad:

Datos de interés

  • Precio: Gratuito

Gracias al auge de los ecosistemas digitales las organizaciones cuentan con un ingente volumen de datos. Al mismo tiempo, las técnicas clásicas de almacenamiento y procesamiento de datos ya no son válidas para los casos de uso actuales, que requieren una gran capacidad de escalado horizontal (scale out). En este contexto aparecen los sistemas Big Data, que se basan, entre otros componentes, en clústeres de computadores que forman sistemas distribuidos capaces de almacenar y procesar grandes volúmenes de datos. A estos sistemas se les suele denominar data lakes (lagos de datos). El estándar de facto en la industria para construir un lago de datos es el ecosistema Hadoop, siendo sus principales distribuciones Cloudera, Hortonworks y MapR.

En este curso se pondrá el foco en la capacidad de almacenamiento con HDFS y el procesamiento para analítica de datos usando un sistema de clúster basado en memoria como es Apache Spark. Concretamente, se proporcionará una introducción a Spark Core (API RDD), Spark SQL (API Dataframe) y Spark Streaming (API DStream y Structured Streaming) funcionando sobre un sistema de ficheros distribuido en clúster y desplegado en nube.

Objetivo: Ser capaz de acceder y explotar la gran capacidad de almacenamiento y procesamiento de un sistema Big Data, familiarizándose con el uso de uno de los entornos de procesamiento en clúster más extendido (Apache Spark).

Dirigido a: Profesionales de cualquier sector interesados en trabajar con sistemas Big Data Analytics para la realización de proyectos de análisis de datos y analítica avanzada. Se requiere portátil con acceso a Internet. Se utilizará un sistema en nube para los talleres. Los ejemplos de código se realizarán en SQL y Python, con lo que se recomienda el conocimiento previo de dichos lenguajes. Es necesario que el alumno aporte un ordenador portátil tipo PC o Mac.

Lugar: Sala Formación. Pabellón B Coworking SPEGC. Recinto Ferial de Canarias (INFECAR). Avda. de la Feria nº1. Las Palmas de Gran Canaria.

Fecha y Horario: 19 y 20 de octubre de 2018. 2 sesiones. 10 horas totales lectivas.

Viernes, 19 de octubre 2018, de 16:00 a 21:00 h.

Sábado, 20 de octubre 2018, de 9:00 a 14:00 h.

Programa:

  • Introducción a las arquitecturas Big Data.
  • Arquitecturas lambda y arquitecturas kappa.
  • Introducción a los ecosistemas Hadoop.
  • Principales distribuciones Hadoop.
  • Introducción al procesamiento In-Memory.
  • Introducción a Apache Spark.
  • Trabajando con un sistema distribuido.
  • Importación y recolección de datos en Spark.
  • Spark Core.
  • Spark SQL.
  • Spark Streaming.

Ponente: Raúl Arrabales Moreno

Psicólogo, ingeniero en informática, MBA y doctor en Inteligencia Artificial. Arrabales cuenta con una experiencia profesional de 18

años trabajando en diversos ámbitos: en el académico como docente e investigador y en la empresa como gerente, jefe de proyecto, consultor

tecnológico y estratégico. Arrabales ha trabajado principalmente en el sector de los contenidos digitales para varias compañías  internacionales como IBM, Arris, Orange, Altran y Accenture. Actualmente es Co-Fundador en Serendeepia y Director de Inteligencia Artificial / Neurociencia Cognitiva en Psicobótica.

Precio: 50 € (impuestos incluidos)

Bonificaciones:

  • En caso de ocupar un espacio dentro de las instalaciones destinadas a emprendedores y empresas gestionadas por la SPEGC o por la Fundación Parque Científico Tecnológico de la ULPGC (debe indicar nº tarjeta acceso al realizar la inscripción), tiene un descuento del 50% en la cuota de ingreso para cada curso / taller ofertado.
  • Desempleados que acrediten su situación con DARDE actualizado-vigente (adjuntar documento al realizar la inscripción), tiene un descuento del 50% en la cuota de ingreso para cada curso / taller ofertado.
  • Los descuentos no son acumulables.