Especialista en Big Data

Competencias digitales avanzadas

Cursos y talleres

  • Límite de inscripción: 07/06/2022 00:00
  • Fechas: 14/06/2022 00:00 - 13/09/2022 00:00
  • Duración: 230 horas
  • Modalidad: Online

Datos de interés

  • Precio: Gratuito

Objetivos:

Desarrollar tareas relacionadas con el Big Data, tratamiento y gestión de grandes volúmenes de datos por medio del manejo de software específico.

Dirigido a:

Personas, preferentemente desempleadas, con nivel académico o de conocimientos generales y que cumplan al menos alguno de los siguientes requisitos:

  • Título de Técnico Superior (FP Grado Superior) o equivalente.
  • Haber superado la prueba de acceso a Ciclos Formativos de Grado Superior.
  • Haber superado cualquier prueba oficial de acceso a la universidad.
  • Certificado de profesionalidad de nivel 3.
  • Título de Grado o equivalente.
  • Título de Postgrado (Máster) o equivalente.
  • Conocimientos previos en programación orientada a objetos utilizando el lenguaje de programación Java.
  • Nivel alto de inglés.

No requiere experiencia profesional previa

Personas PREFERENTEMENTE residentes en Gran Canaria

Una vez finalizado el plazo de presentación de solicitudes, se valorarán todas las recibidas y se seleccionará a los alumnos siguiendo el estricto orden de inscripción de los mismos, teniendo en cuenta, prioritariamente, a los desempleados. 

*A los alumnos se les proporcionará los medios didácticos y el material necesario para el desarrollo del curso.

Programa:

MÓDULO 1. Infraestructura de sistemas

  • Configuración de máquinas virtuales.
  • Modelos y tipología de redes y principales comandos de utilidad para la gestión de red.
  • VPN. Establecimiento de una red privada segura sobre una red pública no segura.
  • Principales comandos y herramientas para trabajar con redes: Ping, NetStat, Telnet, NSLookup

MÓDULO 2. Seguridad y Monitorización

  • Identificación de los diferentes conceptos en criptografía.
  • Identificación de las infraestructuras de clave pública (PKI).
  • Inmersión en los conceptos clave de la seguridad de la información.
  • Distinción y aplicación de los diferentes métodos de autenticación.
  • Distinción y aplicación de los distintos métodos de autorización.
  • Identificación, aplicación y creación de log distribuido.
  • Identificación y aplicación de las opciones de trazabilidad distribuida
  • Monitorización de los datos.

MÓDULO 3. Bases de datos distribuidas

  • Formatos de ficheros soportados por Hadoop: Text, SequenceFiles, Avro, y columnar.
  • Flujo de los datos desde el momento en el que son captados hasta que su almacenamiento, e identificación de las acciones a realizar en cada momento.
  • Ejemplo de análisis detallado del ciclo de vida de dato.
  • Introducción al gobierno del dato (data Governance) o como encontrar respuesta a las preguntas que nos interesa responder sobre un dato.
  • Indroducción Big data, La necesidad de procesamiento distribuido.
  • Almacenamiento local. Los ficheros y su almacenamiento en disco.
  • Almacenamiento distribuido. El almacenamiento de ficheros en el dispositivo, en la red (NAS, SAN) y en la nube.
  • Otros tipos de almacenamiento: Object storage y Block Storage.
  • HDFS – Hadoop Distributed File System.
  • Introducción a las Colas.
  • Bases de datos relacionales vs BBDD NoSql(tipos:Clave-valor, orientadas a columnas, de grafos, orientadas a documentos).
  • MongoDB. Características, arquitectura. (Colecciones, documentos y tipos de datos.
  • Operaciones básicas y escalado. MongoDB en la nube con Atlas.
  • Práctica del uso de BBDD de grafos con Neo4j. Pros y contras de esta tipología, comprender los componentes de modelo de grafos y principales casos de uso. Prácticar.
  • Indexadores. Entender la tencnología que sustenta los buscadores como Google. Tipos de búsquedas y tecnologías adecuadas para cada tipología: Full text search – índice invertido, Enterprise search – SOLR, Lucene – api para reucperación de información, Elastic Search – Indexador de contenidos y azure search.

MÓDULO 4. Procesamiento distribuido

  • Uso de Spark como framewok de procesamiento de la información en sistemas distribuidos.
  • Inmersión en la estructura de datos principal de Spark: RDD – Resilient Distributed Data set.
  • Iniciación a Spark en cluster.
  • Conceptos de programación paralela en Spark.
  • Optimización de rendimiento en Spark.
  • Iniciación al procesamiento de datos en Spark mediante el uso del módulo SparkSQL.
  • Introducción a la programación en Scala.

MÓDULO 5. Visualización

  • Asimilación del concepto y sentido del Business Intelligence en la visualización de datos.
  • Instalación de Power BI en la propia máquina.
  • Carga de datos
  • Aplicación práctica. Creación y diseño de una dashboard propio

MÓDULO 6. Caso práctico con Microsoft Azure

  • Infraestructura.
  • Procesamiento.
  • Visualización.
  • Almacenamiento.
  • Realtime.
  • Gobierno del dato.

MÓDULO 7. Softskills – píldoras informativas

  • Iniciación en el desarrollo ágil de proyectos mediante el uso de la metodología Scrum.
  • Introducción a Design Thinking como herramienta para encontrar soluciones innovadoras a través de la creatividad e innovación.
  • El arte de contar historias (storytelling) como medio para transmitir un mensaje con éxito

Actuación financiada con cargo al Plan Integral de Empleo de Canarias 2020

Cofinanciado por el Cabildo de Gran Canaria con cargo al Programa de formación y empleabilidad en nuevos sectores productivos COVID19.