Curso THANOS – Escalabilidad, alta disponibilidad y retención de métricas con Prometheus
15 horas
Presencial / Virtual Class
Precio por alumno: consultar
Precio de grupo: consultar
Requisitos:
Experiencia administración de servidores, sistemas de documentación y búsquedas.
Conocimientos de elastic search recomendados.
Dirigido a:
Programadores, Analistas y Administradores de sistemas.
Objetivos:
Comprender por qué surge Thanos y qué problemas reales resuelve frente a Prometheus standalone.
Entender la arquitectura distribuida de Thanos y su modelo de funcionamiento global.
Conocer en detalle cada componente y su papel dentro de la arquitectura.
Integrar correctamente Thanos con Prometheus en escenarios reales de producción.
Diseñar una estrategia de almacenamiento y retención eficiente y escalable.
Aplicar los conocimientos adquiridos en un escenario real.
Operar Thanos en entornos empresariales y multi-clúster.
Contenidos
1. Introducción y motivación de Thanos (1,5 horas)
1.1. Prometheus en producción: fortalezas y limitaciones.
1.2. Retención limitada de métricas.
1.3. Dificultades de alta disponibilidad.
1.4. Escalado horizontal y fragmentación de datos.
1.5. Problemas de visibilidad en entornos multi-clúster.
1.6. Qué es Thanos y qué no es.
1.7. Principios de diseño de Thanos.
2. Arquitectura general de Thanos (2 horas)
2.1. Arquitectura distribuida y desacoplada.
2.2. Concepto de sharding.
2.3. Alta disponibilidad y eliminación de duplicados.
2.4. Separación entre ingesta, consulta y almacenamiento.
2.5. Topologías habituales:
2.6. Single cluster
2.7. Multi-cluster
2.8. Multi-región
3. Componentes del proyecto Thanos (3 horas)
3.1. Thanos Sidecar.
3.2. Thanos Query.
3.3. Thanos Store.
3.4. Thanos Compact.
3.5. Thanos Ruler.
3.6. Relación y dependencias entre componentes.
3.7. Patrones de despliegue habituales.
3.8. Errores comunes de diseño.
4. Integración de Thanos con Prometheus (2 horas)
4.1. Dependencia de Thanos respecto a Prometheus.
4.2. Configuración de external labels.
4.3. Replicación completa y parcial.
4.4. Gestión de duplicados.
4.5. Resolución de problemas habituales.
4.6. Buenas prácticas de configuración.
5. Almacenamiento de métricas en object storage (3 horas)
5.1. Justificación del uso de object storage.
5.2. Configuración de objstore.
5.3. Amazon S3:
5.4. Arquitectura
5.5. Políticas básicas
5.6. Seguridad
5.7. Azure Blob Storage.
5.8. Ciclo de vida de los bloques.
5.9. Retención de métricas a largo plazo.
5.10. Impacto en costes de almacenamiento.
6. caso práctico completo con Kubernetes (2 horas)
6.1. Arquitectura de monitorización para clústeres grandes.
6.2. Métricas de:
6.3. Kubelet
6.4. cAdvisor
6.5. kube-state-metrics
6.6. node-exporter
6.7. Flujo completo de métricas con Thanos.
6.8. Validación de alta disponibilidad y escalabilidad.
7. Monitorización multi-clúster y operación (1,5 horas)
7.1. Monitorización multi-clúster.
7.2. Integración con Grafana:
7.3. Configuración de datasources
7.4. Dashboards
7.5. Alertmanager con Thanos.
7.6. Mutual TLS.
7.7. Remote write.
7.8. Buenas prácticas operativas.
Catálogo de cursos
Conoce nuestra oferta formativa para este año:
