Curso Hadoop-Spark

20 horas

Presencial / Virtual Class

935 €/asistente

Precio de grupo: consultar

Requisitos:

Conocimientos de Sistema Operativo Linux

Conocimientos de Java o Scala

Conocimientos básicos de Hadoop.

Dirigido a:

Personas que necesiten administrar un Spark en un entorno Hadoop

 

 

Objetivos:

  • Aprender los componentes de Spark y su integración con Hadoop
  • Aprender a instalar y configurar Spark
  • Configuración adecuada.
  • Introducción a Spark
    • Características
    • Componentes
  • Conceptos de Spark.
    • Lenguajes usados: Java, Scala, R, Python
    • Spark Shell
    • ¿Qué es RDD?
  • Procesamiento de datos con RDDs
    • Operaciones RDD
    • Key-Value pairs
    • Integración con mapReduce
  • HDFS
    • Repaso de HDFs y su arquitectura
  • Instalación y configuración
    • Montar un cluster standalone
    • Acceso a la consola
    • Otras configuraciones
  • Programación paralela
    • Particiones RDD
    • Trabajar con particiones
    • Realizar operaciones en paralelo
  • Caché y persistencia de datos
    • Introducción a la caché con Spark
    • Persistencia del dato en un ámbito distribuido
  • Aplicaciones con Spark
    • Aplicaciones Spark. Diferencias con spark Shell
    • Spark context
    • Propiedades
    • Construir y ejecutar una aplicación Spark
    • Gestión de logs
  • Spark Streaming
    • Introducción a Spark Streaming
    • Operaciones con Streaming
    • Como desarrollar aplicaciones con Spark Streaming

Descarga este curso:

Catálogo 2021

Conoce nuestra oferta formativa para este año:

Solicítanos más información y/o como subvencionarte este curso con el siguiente formulario:

Curso: Hadoop-Spark

Política de privacidad:

Comunicaciones:

15 + 11 =