Curso Hadoop-Spark
25 horas
Presencial / Virtual Class
1045 €/asistente
Precio de grupo: consultar
Requisitos:
Conocimientos de Sistema Operativo Linux
Conocimientos de Java o Scala
Conocimientos básicos de Hadoop.
Dirigido a:
Personas que necesiten administrar un Spark en un entorno Hadoop
Objetivos:
- Aprender los componentes de Spark y su integración con Hadoop
- Aprender a instalar y configurar Spark
- Configuración adecuada.
- Introducción a Spark
- Características
- Componentes
- Conceptos de Spark.
- Lenguajes usados: Java, Scala, R, Python
- Spark Shell
- ¿Qué es RDD?
- Procesamiento de datos con RDDs
- Operaciones RDD
- Key-Value pairs
- Integración con mapReduce
- HDFS
- Repaso de HDFs y su arquitectura
- Instalación y configuración
- Montar un cluster standalone
- Acceso a la consola
- Otras configuraciones
- Programación paralela
- Particiones RDD
- Trabajar con particiones
- Realizar operaciones en paralelo
- Caché y persistencia de datos
- Introducción a la caché con Spark
- Persistencia del dato en un ámbito distribuido
- Aplicaciones con Spark
- Aplicaciones Spark. Diferencias con spark Shell
- Spark context
- Propiedades
- Construir y ejecutar una aplicación Spark
- Gestión de logs
- Spark Streaming
- Introducción a Spark Streaming
- Operaciones con Streaming
- Como desarrollar aplicaciones con Spark Streaming
Descarga este curso:
Catálogo de cursos
Conoce nuestra oferta formativa para este año:
Solicítanos más información y/o como subvencionarte este curso con el siguiente formulario: