Curso Cloudera. Administración
25 horas
Presencial / Virtual Class
1.045 €/asistente
Precio de grupo: consultar
Requisitos:
Conocimientos de Sistema Operativo Linux
Conocimientos básicos de Java
Dirigido a:
Personas que necesiten administrar un entorno Hadoop
Objetivos:
- Aprender los conceptos de Hadoop y Map/Reduce
- Aprender a instalar y configurar Hadoop
- Instalar y configurar un entorno Hadoop con distribución Cloudera
- Consideraciones a tener en cuenta para construir tu clúster
- Big Data
- Introducción
- Un poco de historia
- ¿Qué es Big Data?
- Tecnologías Big Data
- Entornos noSQL
- Introducción a Hadoop y HDFS
- Conceptos de Hadoop
- Conceptos de HDFS
- Introducción a Map/Reduce
- Otras herramientas asociadas: Hive, Pig, HBase, etc…
- Clúster Hadoop. Requisitos
- Como se debería montar un cluster hadoop
- Hardware y software necesario
- Características de la red
- Distribuciones
- Introducción a las distribuciones Hadoop
- Cloudera
- HortonWorks
- OTras
- Instalación y configuración de Hadoop básico
- Tipos de instalaciones
- Versión Clásica
- Versión YARN
- Diferencias
- Instalación y configuración de HDFS
- Instalación de Hadoop con YARN
- Tipos de instalaciones
- HDFS
- Creación de sistema de ficheros HDFS
- Configuración y parámetros más importantes
- Arranque y parada
- Subida y gestión de ficheros
- YARN
- Configuración del cluster con YARN
- Arranque y parada
- Gestión de nodos
- Adición y eliminación de nodos
- Cloudera
- Introducción y conceptos
- Descarga y uso de la distribución
- Componentes incluidos
- Herramienta de administración Cloudera Manager
- Introducción y caraterísticas
- Versiones
- Topologia
- Instalación de un cluster hadoop con Cloudera Manager
- Tareas de aministración
- Jobs
- ¿Qué son los Jobs
- Lanzamientos de Jobs
- Control de Jobs
- Tipos de planificador
- FairScheduler
- Mantenimiento del clúster
- Como podemos comprobar el estado del cluster
- Copiar datos entre clústeres
- Añadir y quitar nodos del clúster
- Como hacer un rebalancing del cluster
- Copias de seguridad de los metadatos
- Actualización un clúster
- Monitorización y rendimiento
- Como monitorizar un cluster hadoop
- Ficheros de Log
- Herramientas web disponibles
- Problemáticas más habituales
- Posibilidades para hacer un benchmarking
- Instalación y configuración de otros productos adicionales
- Hive
- Impala
- Pig
- Sqoop
- Flume
- Kafka
Descarga este curso:
Catálogo 2023
Conoce nuestra oferta formativa para este año:
Solicítanos más información y/o como subvencionarte este curso con el siguiente formulario: