fundamentos de monitoreo
DESCRIPTION
La mayoría de las áreas de TI sólo monitorean infraestructura, y por eso nuestros usuarios y clientes no tienen buena percepción de la calidad de servicio de TI, ¿que tipo de monitoreo tienes?, ¿es suficiente?TRANSCRIPT
Fundamentos del monitoreo de TI alineado con el negocio
www.mainsoft.cl 22www.mainsoft.cl
Jueves 8 de Octubre, 9:45 am, en el Banco la operación de la plataformade atención a personas se desarrolla de forma normal, la oferta decrédito hipotecarios ha logrado atraer una afluencia de clientesconsiderable.Jueves 8 de Octubre, 9:50 am, un importante cliente esta cotizando unacrédito hipotecario y solicita una simulación para tomar su decisión, laejecutiva nota una incidencia en el servicio aplicativo de atención apersonas…
Gestionar TI, es gestionar el negocio?.
El valor de entender el negocio.
www.mainsoft.cl 3
Ejemplo de Servicio de Negocio
• 4 pasos clave que reportaningresos a la compañía
• Cada paso es dependiente deservicios de TI
• Descomposición del servicioTop-down
– De cuales sistemas depende?
– Se puede cuantificar la utilidaddel servicio?
– Ejemplos de métricas:
• Cuantas aplicaciones decrédito?
• Tasa de fallas/éxitos?
• Cual es el estatus delservicio?
Solicitud
de
Crédito
1 Servicio de
Negocio
4 experiencias
transaccionale
s de usuario
Evaluaci
ón de
Riesgo
Simulació
n del
crédito
Ingresar
Solicitud
Aceptació
n del
Crédito
20
Interacciones
entre el cliente
y servidores
DBQuery
HTTPGet
HTTPGet
SOAPRequest
200
Paquetes
de datos
www.mainsoft.cl 4
Enfoques tradicionales solo identifican 1 de cada 3 incidentes
Verdad 2: La mayoría de
los usuarios no se
queja
2,0
00
,00
0 c
usto
me
rs
Experiencia
pobre 22%
Buena
Experiencia
78%
Quejas
2%
No reportan
98%
440,000
customers
Source: Gartner, “How to Approach Customer Experience Management”
Verdad 1: La mayoría de las veces los
incidentes son primero detectados por
los usuarios
73%Source: Forrester Consulting
Porque los usuarios se conformansiempre?
www.mainsoft.cl 5
Cual es el impacto de un incidente y suproceso de troubleshooting?
Verdad 4. Es complejo el proceso de
“troubleshooting”
Promedio de profesionales involucrados en
identificar y tratar de resolver la incidencia,
pero no su causa
Sólo 1 profesional
10 profesionales o
más
Entre 6 y 9
profesionales
Entre 2 y 5
profesionales
4%
57%
14%
24%
Verdad 3. Cuando se produce un
incidente, no se puede medir su
impacto en el negocio
Source: Forrester Consulting
72%No se puede medir el impacto en el
negocio
www.mainsoft.cl 6
Porque el esquema tradicional demonitoreo no es suficiente ?
Perspectiva del usuario
Network
Web
Middleware
App server
Mainframe
Database
Aplicación
de Crédito
8:00 9:00 10:00
Situación #1
• El tiempo de respuesta lento “normal” de la aplicación se produce por
tiempos de carga. No es un problema real de tiempo de respuesta
según el punto de vista de TI
• El sistema no está disponible según la perspectiva del usuario.
• Esta es la dificultad que tiene TI para aislar la causa raíz del problema.
Es ancho de banda? Capacidad de los servidores? Problema de diseño
aplicativo? Algún componente Java corriendo en una Java Virtual
Machine?
Perspectiva TI
www.mainsoft.cl 7
Network
Web
Middleware
App server
Mainframe
Database
8:00 9:00 10:00 11:00 12:00
Situación #2
• Un problema ocurre en un determinado componente que
está monitoreado por TI.
• TI detecta el problema a través de las herramientas que
posee o en la mayoría de las veces a través de la mesa de
ayuda.
• TI reporta el sistema como “downtime” de acuerdo a los
SLAs.
• El usuario percibe esto como una indisponibilidad hasta que
el problema se resuelve.
Perspectiva del Usuario
Aplicación
de Crédito
Perspectiva de TI
Porque el esquema tradicional demonitoreo no es suficiente ?
www.mainsoft.cl 8
Network
Web
Middleware
App server
Mainframe
Database
8:00 9:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00
Situación #3
• Un problema ocurre, pero no es
detectado por ninguna herramienta a
nivel de componentes.
• TI desconoce el problema hasta que el
usuario lo reporta.
• TI necesita confirmar el problema y
aislar la causa raíz.
• La mayoría de las veces los problemas
son intermitentes, lo que dificulta
reproducirlos. Lo que contribuye a la
frustración o molestia de los usuarios.Perspectiva del Usuario
Loan
Application
Perspectiva de TI
Porque el esquema tradicional demonitoreo no es suficiente ?
www.mainsoft.cl 9
Network
Web
Middleware
App server
Mainframe
Database
“Sólo hay
luces verdes
en mi
consola”
“El sistema
es muy
lento o está
indisponible
”
8:00 9:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00
En la perspectiva
de TI, los
eventuales
problemas en
algunos de los
componentes son
normales
La perspectiva del
usuario es muy
diferente.
Perspectiva del usuario
Loan
Application
Perspectiva de TI
Porque el esquema tradicional demonitoreo no es suficiente ?
www.mainsoft.cl 10
Source: Forrester Consulting
Troubleshooting de problemas
85%
63%
60%
60%
44%
Aislar la causa
Definir el alcance y
la severidad
Definir al
responsable
Identificar el
dominio
Entender las inter
dependencias
Donde se desperdicia el tiempo?
www.mainsoft.cl 11
Formalización procesos TI
Gestión Servicios
Adopción , automatización, control y gestión desempeño del
proceso
Modelo de control de
resultado de procesos
Gobernabilidad de TI.
Valor para el negocio
ITIL CMMI, PMBOK ISO
27001
Relación procesos/
personas/tecnología
Control operativo
procesos
Aplicación de buenas
prácticas COBIT
Integración con el
negocio
Evolución TI - Gobernabilidad
Ciclo
Mejora
Continua
Planificar ¿Qué hacer? ¿Cómo hacerlo?
HacerloHacer lo planificado
Verificar ¿Las cosas se están haciendo según los planificado?
Actuar ¿Cómo mejoramos?
www.mainsoft.cl 12
Proceso de negocio
Servicio de negocio
Aplicaciones
Infraestructura y Redes
SW Básicos
Business
BSC
IT BSC
KGI
KPI
KPI
KPI
KPI
KPI
KPI
KPI
KPI KPI
IT
Governance
COBIT
Relación y Revisión
Arquitecturas Modelo Gestión Buenas
Prácticas
Modelo Integrado Gestión
Servicio TI
Niveles
CMMI
ITIL
ISO27001
PMI
www.mainsoft.cl 13
Niveles de madurez del servicio de TI
www.mainsoft.cl 14
Monitoreo de Infraestructura
Monitoreo de la Experiencia del Usuario
Application Performance Management
Nivel 1Conciente
Nivel 2Comprometido
Nivel 3Proactivo
Nivel 5Socio delNegocio
Nivel 4Orientado al
Servicio
Service Level ManagementBusiness Service Management
Niveles de madurez del servicio de TI
Donde Estamos? Donde queremos estar?
www.mainsoft.cl 16
Infraestructura AplicativaRed
Usuario Final
snmp
Monitoreo de Infraestructura Monitoreo End-user
Experience Monitoring
Executive Service Visualizations Operations Service Visualizations
Service
Model
Captura de datos con herramientas VantageThird-party Data
Conociendo el impacto al Negocio
www.mainsoft.cl 1717www.mainsoft.cl
El valor de entender el negocio.
?La respuesta es…
SI, es posible.
Era posible anteponerse al
problema?
Era posible determinar el
impacto al negocio?
Era posible determinar la
causa?, En cuanto tiempo?
Era posible solucionar la
incidencia? En cuanto tiempo?
Los involucrados hubiesen
entendido que sucedió?
www.mainsoft.cl 18
La piedra angular: El usuario final
18www.mainsoft.cl
Determinar dependencias de servicios
Correlacionar de eventos
Identificar del dominio de falla
Apoyar la resolución de problemas
Definir transacciones críticas de negocio
Usabilidad de todos los usuarios
Criticidad de ubicación geográfica
Indicadores claves de performance
Gestión de niveles de servicio
Determinar el impacto en el negocio
Comunicación y mejora continua
www.mainsoft.cl 19
Impact Details
- Affected Users: 65
Sales
Router
InternetEmail
Marketing
Mobile
Company
Sales
POP CPU
POP Server Router
Root Causes
- POP CPU
- Router
Fault Tree
Router
Internet
Marketing
Mobile
Company
POP CPU
POP Server
Sales
Router
InternetEmail
Impact Tree
Sales
Adopción del modelo de servicios
• Árbol de dependencias
• Dominio de Impacto
• Visualización en tiempo real.
• Correlación de eventos
• Árbol de impacto
19www.mainsoft.cl
www.mainsoft.cl 20
Beneficios de la solución
20www.mainsoft.cl
Resolución de problemas Actitud proactiva ante problemas
Rápida focalización
Reducir el tiempo de resolución
Menos personal involucrado
Mejora continua Reportes de tendencias
Complemento de Six Sigma
Cuadros de gestión de acuerdos de serviciosde negocio
Visibilidad Cuadros de mando gerenciales
Dashboard operativos
Centralización de la información
Entendimiento de la calidad de los servicios denegocio
Impacto y Priorización La importancia esta en el negocio
Modelo de servicios que soportan los procesosde negocio
Definición de componentes y dependencias deservicios
Correlación de eventos
Análisis de impacto
Reutilización de inversión TI Integración con sistemas de monitoreo ya
existentes dentro de la infraestructura.
Reutilización de indicadores definidos
www.mainsoft.cl 21
Diagrama lógico EUE
21www.mainsoft.cl
www.mainsoft.cl 22
Agentes Activos
• TransaccionesSintéticas ejecutadasdesde un cliente“robot”
• Monitor detransacciones críticasdel negocio
• Provee pro actividada través de alertas
Monitoreo Real de Usuarios
• Utiliza probes pasivos en la red instalados en puntosclaves de la infraestructura
• Monitorea a todos los usuarios, todas lastransacciones, todo el tiempo
• Permite a TI ver exactamente lo que ocurre en cada etapade cada transacción
Estas dos formas
de medir
son complementarias
Evaluación de la Calidad de los Servicios
www.mainsoft.cl 23
Vantage11 - Arquitectura
23www.mainsoft.cl
Vantage Analysis Server
Vantage Management Server
Event
Handling
Mgmt
Dashboards
Service
Model
Data
Integration
Analysis and
Reporting Views
Active & Agentless EUE
Network Monitoring
EUE
Active
EUE
Agentless
Network
AMD / Probe
Server
Agent
Java / .Net
Agent
Server
Monitoring
J2EE &
.NET
Monitoring
Transaction
Profiling
Service
Management
Legacy
Reporting
www.mainsoft.cl 24
Business Service Delivery
24www.mainsoft.cl
www.mainsoft.cl 2525www.mainsoft.cl
Vantage 11 !