Observabilidad
La observabilidad es la capacidad de comprender la condición o el estado interno de un sistema mediante el examen de sus salidas externas especialmente sus datos.
¿Por qué es importante la observabilidad? ¿Por qué la necesitamos?
La observabilidad es importante porque permite a los equipos evaluar, monitorizar y mejorar el rendimiento de sistemas de IT distribuidos. Cuanto más observable es un sistema, más rápido y con mayor precisión pueden los equipos de TI pasar de un problema de rendimiento identificado a su causa raíz sin necesidad de realizar pruebas o codificaciones adicionales.
¿Que necesitamos?
La observabilidad requiere de herramientas de software que agreguen, correlacionen y analicen un flujo constante de datos de rendimiento de las aplicaciones, el hardware y las redes en las que se ejecutan.
Los equipos pueden utilizar estos datos para supervisar, solucionar problemas y depurar aplicaciones, redes e infraestructuras, y en última instancia, optimizar la experiencia del cliente y cumplir los acuerdos de nivel de servicio (SLA) y otros requisitos empresariales.
¿Cómo funcionan las herramientas de observabilidad?
Log's:
Los logs ofrecen registros con marcas de tiempo de los eventos de aplicaciones. Una organización grande puede producir miles de millones de logs en un día.
Métricas:
Las métricas son datos temporales que miden el estado del sistema y las aplicaciones, y el rendimiento en el tiempo.
Rastreo distribuido:
El rastreo distribuido brinda un registro del nivel del código integral de cada solicitud de usuario a través de la arquitectura distribuida completa.
Mapeo de dependencias:
Los mapas de dependencias muestran cómo se conectan las aplicaciones, los servicios y los componentes de la infraestructura.
Detección de anomalías:
La detección de anomalías usa puntos de referencia, análisis estadístico o machine learning para proporcionar una advertencia temprana de comportamiento anormal en un sistema.
Una plataforma de observabilidad correlaciona grandes cantidades de datos de telemetría en tiempo real, lo que brinda a los equipos de DevOps, SRE e IT un panorama contextual completo de cualquier evento o problema.
Recopilación de datos
Monitorización





