Curso Cloudera. Administración

25 horas

Presencial / Virtual Class

1.045 €/asistente

Precio de grupo: consultar

Requisitos:

Conocimientos de Sistema Operativo Linux

Conocimientos básicos de Java

Dirigido a:

Personas que necesiten administrar un entorno Hadoop

 

 

Objetivos:

  • Aprender los conceptos de Hadoop y Map/Reduce
  • Aprender a instalar y configurar Hadoop
  • Instalar y configurar un entorno Hadoop con distribución Cloudera
  • Consideraciones a tener en cuenta para construir tu clúster
  1. Big Data
    • Introducción
    • Un poco de historia
    • ¿Qué es Big Data?
    • Tecnologías Big Data
    • Entornos noSQL
  2. Introducción a Hadoop y HDFS
    • Conceptos de Hadoop
    • Conceptos de HDFS
    • Introducción a Map/Reduce
    • Otras herramientas asociadas: Hive, Pig, HBase, etc…
  3. Clúster Hadoop. Requisitos
    • Como se debería montar un cluster hadoop
    • Hardware y software necesario
    • Características de la red
  4. Distribuciones
    • Introducción a las distribuciones Hadoop
    • Cloudera
    • HortonWorks
    • OTras
  5. Instalación y configuración de Hadoop básico
    • Tipos de instalaciones
      • Versión Clásica
      • Versión YARN
      • Diferencias
    • Instalación y configuración de HDFS
    • Instalación de Hadoop con YARN
  6. HDFS
    • Creación de sistema de ficheros HDFS
    • Configuración y parámetros más importantes
    • Arranque y parada
    • Subida y gestión de ficheros
  7. YARN
    • Configuración del cluster con YARN
    • Arranque y parada
    • Gestión de nodos
    • Adición y eliminación de nodos
  8. Cloudera
    • Introducción y conceptos
    • Descarga y uso de la distribución
    • Componentes incluidos
  9. Herramienta de administración Cloudera Manager
    • Introducción y caraterísticas
    • Versiones
    • Topologia
    • Instalación de un cluster hadoop con Cloudera Manager
    • Tareas de aministración
  10. Jobs
    • ¿Qué son los Jobs
    • Lanzamientos de Jobs
    • Control de Jobs
    • Tipos de planificador
    • FairScheduler
  11. Mantenimiento del clúster
    • Como podemos comprobar el estado del cluster
    • Copiar datos entre clústeres
    • Añadir y quitar nodos del clúster
    • Como hacer un rebalancing del cluster
    • Copias de seguridad de los metadatos
    • Actualización un clúster
  12. Monitorización y rendimiento
    • Como monitorizar un cluster hadoop
    • Ficheros de Log
    • Herramientas web disponibles
    • Problemáticas más habituales
    • Posibilidades para hacer un benchmarking
  13. Instalación y configuración de otros productos adicionales
    • Hive
    • Impala
    • Pig
    • Sqoop
    • Flume
    • Kafka

Descarga este curso:

Catálogo 2021

Conoce nuestra oferta formativa para este año:

Solicítanos más información y/o como subvencionarte este curso con el siguiente formulario:

Curso: Cloudera. Administración

Política de privacidad:

Comunicaciones:

13 + 13 =