plan de recuperacion de desastres

13
Plan de Recuperación de Desastres Bravo González Julio Cesar García Uribe Alejandra Ramírez Marisol ZaldívarGarcíaAlejandro Agencia Milenio Motors Chevrolet 29 de Noviembre 2010

Upload: rikrdo-revolver

Post on 26-Jun-2015

728 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Plan de Recuperacion de Desastres

Plan de Recuperación de Desastres

B r a v o G o n z á l e z J u l i o C e s a r G a r c í a U r i b e A l e j a n d r a

R a m í r e z M a r i s o l Z a l d í v a r G a r c í a A l e j a n d r o

Agencia Milenio Motors Chevrolet 29 de Noviembre 2010

Page 2: Plan de Recuperacion de Desastres

AGENCIA DE AUTOS CHEVROLET MILENIO MOTORS, S.A. DE C.V.

PLAN DE RECUPERACION DE DESASTRES

Ubicación Periférico Poniente No. 2001 Col. Indígena San Juan de Ocotán C.P: 45019 Zapopan, Jalisco México Contacto (33) 38 - 32 - 28 -00 www.chevroletmilenio.com.mx

Objetivo Proporcionar a la Agencia Milenio Motors un Plan de Contingencia Informático, que contenga los procedimientos e instructivos necesarios para poder continuar con las operaciones, procesos y servicios informáticos críticos, en caso de que se llegara a presentar algún siniestro o contingencia. Así como minimizar el impacto que dichos daños pudieran causar. Para asegurar su correcto funcionamiento, Agencia Milenio Motors, deberá efectuar las pruebas necesarias de las actividades que así lo requieran, y establecer un proceso continuo para darle un correcto mantenimiento. Ante el incremento de la cultura informática derivada del creciente empleo de la Tecnología de la Información, surge la necesidad y responsabilidad de la protección de la misma, de sus medios de almacenamiento y de su ambiente de operación. La información que se maneja en Agencia Milenio Motors, por ser materia prima para la propia gestión y toma de decisiones, es considerada como un activo importante y como tal, debe ser sujeta de custodia y protección para asegurar su integridad, confidencialidad y disponibilidad.

Page 3: Plan de Recuperacion de Desastres

PLAN DE ACCION 1. Realizar un levantamiento de los servicios informáticos. Llevar a cabo un Inventario de equipo de cómputo, software y mobiliario, para determinar cuál es la información crítica que se tiene que resguardar, adicionalmente levantar un inventario de los servicios de cómputo, telecomunicaciones, Internet, etc., que son requeridos para que los usuarios estén en posibilidad de llevar a cabo sus actividades normales. 2. Identificar un conjunto de amenazas. Identificar los tipos de siniestros a los cuales está propenso cada uno de los procesos críticos, tales como falla eléctrica prolongada, incendio, terremoto, etc. Identificar el conjunto de amenazas que pudieran afectar a los procesos informáticos, ya sea por causa accidental o intencional. 3. Revisar la seguridad, controles físicos y ambientales existentes, evaluando si son adecuados respecto a las amenazas posibles. Se debe estar preparado para cualquier percance, verificando que dentro de la Red Central de Informática se cuente con los elementos necesarios para salvaguardar sus activos. 4. Identificar los servicios fundamentales de la Agencia Milenio Motors (Factores Críticos).

ESTABLECER UN GRUPO DE TRABAJO A través de la realización de una junta de trabajo, establecer formalmente el Comité del Plan de Recuperación de Desastres con la siguiente estructura: Presidente del Grupo de Trabajo

Coordinador General Coordinador de Redes y Comunicaciones

Coordinador de Soporte Técnico Coordinador de Sistemas

Personal Clave Presidente del Grupo de Trabajo.- Es el responsable de aprobar la realización del Plan de Contingencia Informático, dirigir los comunicados de concientización y solicitud de apoyo a los jefes y/o gerentes de las diferentes áreas involucradas y aprobar su terminación. Una vez concluida la realización del Plan de Contingencia, el Presidente tendrá como función principal, verificar que se realicen reuniones periódicas, cuando menos cada seis meses, en donde

Page 4: Plan de Recuperacion de Desastres

se informe de los posibles cambios que se deban efectuar al plan original y de que se efectúen pruebas del correcto funcionamiento del Plan de Contingencia Informático, cuando menos dos veces al año o antes si se presentan circunstancias de cambio que así lo ameriten. Coordinador General.- Tendrá como función principal asegurar que se lleven a cabo todas las fases para la realización del Plan de Contingencia, registrará las reuniones que se realicen, a manera de minutas, aprobará los procesos críticos y tipo de evento que abarcará el Plan de Contingencia y aprobará junto con el Presidente del Comité la terminación de cada una de las fases y la conclusión del proyecto. Coordinador de Redes y Comunicaciones.- Es el responsable de determinar los procedimientos a seguir en caso de que se presente una contingencia que afecte las comunicaciones, Servicios de Internet, Intranet, correo electrónico y red de Agencia Milenio Motors, mantener actualizados dichos procedimientos en el Plan de Contingencia, determinar los requerimientos mínimos necesarios, tanto de equipo como de software, servicios, líneas telefónicas, cuentas de acceso a Internet, enlaces dedicados, dispositivos de comunicación (ruteadores, switchs, antenas etc). Asimismo, deberá mantener actualizado el inventario de equipo de telecomunicaciones y redes, efectuar los respaldos correspondientes y llevar a cabo las pruebas de operatividad necesarias, para asegurar la continuidad del servicio, en caso de que se llegara a presentar alguna contingencia, ya sea parcial, grave o crítica. Coordinador de Soporte Técnico.- Es el responsable de llevar a cabo el inventario de equipo, software y equipos periféricos, como impresoras, CD Writer, escáners, faxes, copiadoras, etc.; mantener los equipos en óptimas condiciones de funcionamiento; determinar la cantidad mínima necesaria de equipo y sus características para dar continuidad a las operaciones de la Agencia Milenio Motors; es responsable de elaborar o coordinar con los usuarios los respaldos de información. Coordinador de Sistemas.- Será el responsable de determinar los sistemas críticos de la Agencia Milenio Motors que en caso de presentarse alguna contingencia como corte de energía eléctrica prolongada, temblor, incendio, falla del sistema de cómputo, pérdida de documentación, o alguna otra causa determinada, se llegara a afectar sensiblemente la continuidad de las operaciones en las áreas que utilicen dichos sistemas críticos. En caso de cambiar a otras instalaciones alternas, el Coordinador de Programación deberá definir cuáles serían las actividades que se deberán seguir para la configuración o instalación de los sistemas desarrollados, optimizando los recursos con los que se cuente, realizando las pruebas necesarias hasta su correcto funcionamiento en las terminales destinadas para su operación. Deberá mantener actualizados los Manuales Técnicos y de Usuario, resguardándolos fuera de las instalaciones para su consulta y utilización al momento de requerirse. Personal Clave.- Es el responsable de la aplicación de los procedimientos que describa el Plan de Contingencia para cada una de las diferentes circunstancias o contingencias previstas y de reportar con la periodicidad que se indique en el plan, al Coordinador de su área y al Coordinador General, los resultados de la aplicación de alguna de las fases del plan.

Page 5: Plan de Recuperacion de Desastres

Personal de Agencia Milenio Motors involucrado (usuarios).- El personal usuario en general, al verse afectado por una situación de contingencia, deberá en primera instancia apoyar para salvaguardar las vidas propias y de sus compañeros de trabajo, cuando la situación que se estuviera presentado sea grave (incendio, temblor, etc.); posteriormente, y en la medida en que la situación lo permita, deberá coadyuvar a salvaguardar los bienes de Agencia Milenio Motors (el propio inmueble, equipos, documentación importante, etc.).

DETERMINAR EVENTOS QUE PUEDEN AFECTARNOS Los desastres y crisis son eventos que pueden inhabilitar la Agencia Milenio Motors de proveer normalmente sus servicios a los usuarios internos y la atención al público en general, por lo que deben identificarse, analizar su nivel de riesgo y tomarse las medidas necesarias de prevención. Identificación de Amenazas:

Terremoto

Incendio

Inundación y humedad

Corte de Energía

Falla de la red de voz y datos

Fallas en Hardware o Software

Sabotaje o daño accidental

Vandalismo y manifestaciones

a) TERREMOTO

SIN PÉRDIDA O DAÑOS MENORES DEL EDIFICIO: El siniestro puede afectar únicamente parte de la estructura del edificio, en cuyo caso no se verían afectados los datos, sin embargo, podría ser necesario evacuar las instalaciones trasladando al personal fuera del edificio; el impacto que provocaría en la Agencia Milenio Motors es menor, puesto que las actividades se interrumpirían por unas horas o a hasta por un día completo. CON PÉRDIDA DEL EDIFICIO: La pérdida de las instalaciones afectaría gravemente a las operaciones de la Agencia Milenio Motors y los datos pueden verse dañados seriamente. En esta parte de la contingencia es donde se requiere que todas las medidas de emergencia y de recuperación funcionen adecuada y oportunamente. Ejemplos de riesgo:

Amenza Activo Vulnerabilidad Probabilidad Impacto

Terremoto: negacion de servicio

Centro de cómputo

El centro de cómputo se encuentra en una region de moderada actividad sismica.

Media Alto

Terremoto: negacion de servicio

Ruteadores, switches y firewalls

Funcionan con energía eléctrica.

Baja Alto

Page 6: Plan de Recuperacion de Desastres

b) INCENDIO ÁREA DE SISTEMAS (SITE DE CÓMPUTO): Se tiene gran impacto en la información ya que los sistemas utilizados residen en los Servidores y dispositivos de comunicación localizados en el Site de Cómputo y en caso de sufrir algún daño, se requerirá adquirir un nuevo equipo, así como de instalar nuevamente el sistema, configurar el Servidor y restaurar los respaldos para continuar trabajando. ÁREAS DISTINTAS AL SITE DE CÓMPUTO: Un incendio dependiendo de su magnitud, puede afectar desde las estaciones de trabajo o periféricos y dispositivos de comunicación localizados en el Centro de Cómputo. En el caso de las primeras el impacto que tendría en la Agencia Milenio Motors es menor, puesto que la información o tiempo de operación que se pierde no tiene gran repercusión en las operaciones generales, ya que puede restablecerse en un tiempo relativamente corto. Ejemplos de riesgo:

Amenza Activo Vulnerabilidad Probabilidad Impacto

Incendio: negacion de servicio

Centro de cómputo

No hay extintores dentro del centro de cómputo.

Baja

Alto

Incendio: daño de equipo.

Centro de cómputo

No hay extintores dentro del centro de cómputo.

Baja

Alto

c) INUNDACIÓN Y HUMEDAD Puesto que es equipo electrónico el que se maneja dentro de la institución, una inundación severa dañaría los dispositivos irremediablemente deteniendo las operaciones de la misma totalmente. Un daño grave correspondería a una inundación en el Centro de Cómputo, en tanto que una inundación parcial o limitada a parte de las instalaciones (no al Centro de Cómputo) podría sólo ocasionar un daño medio sí no va seguido de corto circuito. Ejemplo de riesgo:

Amenza Activo Vulnerabilidad Probabilidad Impacto

Inundanción: condensación agua

Centro de cómputo

No hay indicadores de temperatura y humedad.

Baja

Alto

d) CORTE DE ENERGÍA

Las operaciones informáticas de Agencia Milenio Motors se detendrían, puesto que los dispositivos en los que se trabaja dependen de la corriente eléctrica para su desempeño. Si el corte eléctrico dura poco tiempo las operaciones no se ven afectadas gravemente, pero si el corte se prolongara por tiempo indefinido se provocaría un trastorno en las operaciones del día, sin afectar los datos.

Page 7: Plan de Recuperacion de Desastres

Actualmente la Agencia Milenio Motors cuenta con una planta de energía con capacidad para restablecer la energía inmediatamente después de la perdida de luz. Todos los usuarios cuentan con NO BREAK, así como con reguladores y los servidores se encuentran conectados a un NOBREAK, para entrar inmediatamente después del corte de energía y evitar daños en los equipos. Ejemplos de riesgo:

Amenza Activo Vulnerabilidad Probabilidad Impacto

Falla eléctrica: negacion servicio

Servidores Funcionan con energía eléctrica.

Media

Alto

Personal: descargas electrostáticas.

PC Funcionan con energía eléctrica.

Baja Bajo

Falla eléctrica: negacion servicio

Ruteadores, switches.

Funcionan con energía eléctrica.

Media

Alto

e) FALLAS DE LA RED DE VOZ Y DATOS RED: Representa la columna vertebral de las operaciones de la Agencia Milenio Motors, si la red falla en su totalidad, las operaciones se detienen con la consecuente falta del servicio informático. APLICACIONES: La falla en los sistemas utilizados, representa un impacto medio en las operaciones totales de la Agencia Milenio Motors, ya que pueden ser reinstalados casi de inmediato. Ejemplos de riesgo:

Amenza Activo Vulnerabilidad Probabilidad Impacto

Personal: fallas de mantenimiento.

Centro de cómputo

El cableado no está debidamente ordenado

Media

Alto

Hacker: cambios en la configuracíon.

Access Points Cualquier computadora se conecta a la red.

Alta Alto

Código malicioso: negacion de servicio.

Sistemas Operativos

Todos los puertos estan disponibles internamente.

Alta

Alto

Page 8: Plan de Recuperacion de Desastres

f) FALLAS EN HARDWARE O SOFTWARE Las alteraciones que sufran los servidores tanto en Hardware y Software pueden ser corregidas en la mayoría de los casos, sin embargo si las alteraciones llegan a ser tan grandes que el tiempo requerido para el inicio de las operaciones normales puede extenderse hasta por días. Ejemplos de riesgo:

Amenza Activo Vulnerabilidad Probabilidad Impacto

Personal: descargas electrostáticas.

Centro de cómputo

No se cuenta con piso antiestático.

Media

Alto

Polvo: daño de equipo Centro de cómputo

No está definido periodo de limpieza de equipo.

Alta

Alto

Bugs en el sistema Configuración de red.

No se actualiza del kernel del sistema.

Media

Medio

Bugs en el sistema Motor de Base de Datos

No se ha actualizado la version de base de datos

Baja

Medio

g) SABOTAJE O DAÑO ACCIDENTAL La alteración de la información requiere de la restauración de los respaldos y de pruebas posteriores para contar con la integridad de los datos. Es posible que se requieran reprocesos de captura de datos, dependiendo de las fechas de los respaldos que se tengan disponibles. Ejemplos de riesgo:

Amenza Activo Vulnerabilidad Probabilidad Impacto

Personal: descargas electrostáticas.

Servidores Suceptibles a variaciones en voltaje.

Baja

Alto

Hacker: sabotaje Centro de cómputo

Se debe contar con una infraestructura que brinde seguridad al edificio.

Baja

Alto

Personal: descargas electrostáticas.

Ruteadores, switch.

Suceptibles a variaciones en voltaje.

Baja

Medio

h) VANDALISMO Y MANIFESTACIONES Un intento de vandalismo ya sea menor o mayor, podría afectar a las PC’s, periféricos y servidores así como las comunicaciones. Si el intento de vandalismo es mayor, se presenta un grave riesgo dentro del área del Centro de Cómputo ya que puede dañar los dispositivos perdiendo toda la información y por consecuencia las actividades se verían afectadas en su totalidad, así como el servicio proporcionado a los clientes.

Page 9: Plan de Recuperacion de Desastres

A continuación se menciona una serie de medidas preventivas:

Establecer vigilancia mediante cámaras de seguridad en el Site, el cual registre todos los movimientos de entrada del personal.

Instalar identificadores mediante tarjetas de acceso.

Determinar lugares especiales, fuera del centro de datos, para almacenar los medios magnéticos de respaldo y copia de la documentación de referencia y procedimientos de respaldo y recuperación (se puede contratar una caja de seguridad bancaria donde se custodiaran los datos e información crítica).

Contar, ya sea bajo contrato o mediante convenio, con un centro de cómputo alterno de características físicas y equipo de cómputo adecuado para darle continuidad a las operaciones críticas de la Agencia Milenio Motors, aún en forma limitada de cobertura y de comunicaciones.

El paro total de las operaciones dentro de la Agencia Milenio Motors afectaría principalmente a los servicios que son brindados a los clientes, no se podría llevar a cabo el mantenimiento y monitoreo del equipo informático, ya que los manifestantes bloquearían las entradas e impediría el acceso para realizar cualquier operación. Los principales conflictos que pudieran presentarse son: En cuanto a la red, si el sistema llegará a presentar una falla no habría personal que atendiera la problemática y por consecuencia se detendrían las operaciones a falta del monitoreo a los distintos sistemas. Respecto a los dispositivos de almacenamiento, si se mantienen los respaldos únicamente dentro de la Agencia Milenio Motors, sería imposible reanudar las actividades que un momento dado fueran críticas, como la nómina, contabilidad, etc; en un sitio alterno, ya que no contarían con copia de la información. A continuación se menciona una serie de medidas preventivas en caso de presentarse un paro total de las operaciones.

Determinar lugares especiales, fuera del centro de datos, para almacenar los respaldos y copia de la documentación de referencia.

El personal clave del Plan de Contingencia Informático, debe de dar la alerta del paro total y sacar los respaldos de información fuera del edificio dentro de un tiempo límite antes de ser declarada la huelga.

Page 10: Plan de Recuperacion de Desastres

Ejemplos de riesgo:

Amenza Activo Vulnerabilidad Probabilidad Impacto

Manifestaciones: falta de personal.

Pesonal de los diferentes servicios que se brindan en la agencia.

Ausentismo laboral Medio

Alto

PROCEDIMIENTO DE ACTIVACION DE LOS DISPOSITIVOS DE SEGURIDAD EXTINGUIDORES Los extinguidores tienen la intención de usarse en un tipo en particular de riesgo, así que se debe de poner especial atención en colocarlo cerca del las posibles áreas de riesgo que deben proteger. Los letreros y símbolos que se detallan a continuación deberán revisarse con todo el personal que se espera pueda llegar a usar el extinguidor. A continuación se describe gráficamente el procedimiento para el uso de extinguidores en caso de incendio:

1.- Quite el seguro.

2.- Sujete la manguera y oprima las manijas.

3.- Dirija la descarga hacia la base del fuego.

PROCEDIMIENTOS DE RESPALDO Y RECUPERACION Establecer normas de seguridad como son:

Definir los procedimientos que indiquen los datos, programas, etc., que es importante respaldar; por servidor, sistema y ubicación.

Identificar cada uno de los métodos que se utilizan, para llevar a cabo los respaldos de información, así como los procedimientos para su ejecución y restauración.

Especificar el lugar donde se encuentran custodiados los respaldos de información o copia de los respaldos, ya sea en un lugar fuera de las instalaciones o en alguna otra Institución.

Page 11: Plan de Recuperacion de Desastres

En esta parte, debe incluirse los procedimientos de respaldo y recuperación de la información de los sistemas, así como de los programas o aplicaciones y de los sistemas operativos. Establecer los procesos informáticos críticos y las prioridades de recuperación de los sistemas, de forma tal que el tiempo de recuperación sea alcanzado. Realizar una lista de servicios críticos para la organización: Lista de Servicios Críticos: - Servicio de Comunicaciones (Router´s y Enlaces). - Servicio de Correo Electrónico. - Servicio de impresión y archivos. - Servicio de Publicación de Páginas Web. - Servicio de Respaldos. - Servicio de Internet. DETERMINAR LOS TIEMPOS DE RECUPERACION. Para cada una de las fases críticas que se cubrirán con el Plan de Contingencia Informático, se deben determinar los tiempos mínimos requeridos para el establecimiento del plan, esto es, cuánto tiempo debe transcurrir desde el momento en que se inicia o activa el plan, hasta que las actividades, funciones o sistemas se encuentren en operación total o parcialmente. Es conveniente definir un tiempo aceptable y viable para que la red y la aplicación principal estén nuevamente activas. Para situaciones críticas: • Incluir el traslado de los medios de almacenamiento magnético que se encuentren fuera de las instalaciones. • La copia de los datos a los nuevos medios de almacenamiento magnético y la habilitación de las comunicaciones, servicios de Internet y correo electrónico. • El personal mínimo requerido para continuar operando. • Tiempo de restauración de cada uno de los servicios de Red, Comunicaciones, Internet y Correo Electrónico. • El tiempo determinado debe ser conocido y aceptado por todos los usuarios principales que operan los sistemas o cuentan con un equipo crítico. Para situaciones de bajo riesgo: • Tiempo de reparación o reposición de una estación de trabajo (PC) • Tiempo de configuración de las PC • Tiempo de respuesta del proveedor para la reparación de los servidores (verificar contratos y garantías). • Tiempos de reparación de fallas eléctricas. • Tiempo de restauración de cada uno de los servidores y sus aplicaciones.

Page 12: Plan de Recuperacion de Desastres

SITUACIONES CRÍTICAS QUE INUTILIZARÍAN EL CENTRO DE CÓMPUTO Y LAS INSTALACIONES. Establecer un centro de cómputo alterno en 48 hrs. Mínimo en red con cableado estructurado bajo protocolo de comunicación TCP/IP. Se deberá contar con 2 líneas telefónicas y acceso a Internet. Para sustituir el servicio de correo electrónico, cuando menos en una primera fase, se abrirán correos electrónicos gratuitos (hotmail, yahoo, etc.) para usuarios operativos y Directores, con el objeto de no perder el medio de comunicación. Todo el personal que realizara las operaciones críticas de la organización deberá contar con un correo electrónico, como el antes mencionado para poder establecer contacto frecuente y transferencia de información bajo este medio. Es recomendable tener un contrato para poder contar con un servicio de Hot Site, en el momento en que sea necesario, o de lo contrario contar con un convenio con alguna institución que pudiera ofrecer este servicio. FALLAS DE PC’S, SERVIDORES O ESTACIONES DE TRABAJO. Una PC o Servidores deberán sustituirse o reconfigurarse en máximo 3 hrs. Es conveniente, tener algunos equipos en stock para estos casos y contar con una póliza que cubra el servicio de mantenimiento preventivo y correctivo de dichos equipos, Pc’s, Servidores, etc. Es importante contar con una póliza o contrato de Mantenimiento preventivo y correctivo de algún proveedor, que proporciones el servicio adecuado para las PC’s, Servidores y equipo de Almacenamiento. FALLAS DE INTERNET. Cuando se trate de fallas de acceso en Internet causadas por el proveedor del servicio, se deberá tener comunicación con el ejecutivo de cuenta para realizar el reporte del daño y para establecer el tiempo en el que se estará sin servicio.

Page 13: Plan de Recuperacion de Desastres

SELECCIONAR LOS SITIOS ALTERNATIVOS Y EL ALMACENAJE FUERA DEL LUGAR HABITUAL. Es un factor importante prepararse para algo que probablemente pueda ocurrir, especialmente cuando se involucra a los sistemas de cómputo. Cuando se depende de los anteriormente mencionados, un desastre puede o no dejar continuar las operaciones. En el momento que se presentan situaciones de desastre, el regresar a la normalidad va más allá de mantener los sistemas de información en orden y consistentes. Por lo anterior, es importante saber qué se va a recuperar y quién puede hacerlo en caso de pérdidas humanas. Las instituciones se enfrentan a una amplia gama de desastres: desde los locales, que ocurren en el interior de la empresa, en un espacio determinado del edificio, hasta los que afectan todas las instalaciones de la misma o aquellos que abarcan una región entera. Los primeros consisten en incendios, sabotajes o fallas en el suministro de la energía eléctrica, entre otras cosas; los segundos, conocidos como desastres en el sitio, afectan a todo el edificio. Los provocan explosiones por bomba, inundaciones o desórdenes en la tensión del flujo eléctrico, etc. Los desastres pueden agruparse en dos grandes tipos: por un lado los que tienen su origen en la naturaleza, como ciclones, temblores, inundaciones, tormentas y huracanes. Por otro lado, existen los que son provocados por el hombre, como virus computacionales, suspensiones o sobrecarga de energía, errores de hardware y software, interrupciones de las redes, errores humanos, sabotaje, etc. Es importante considerar al seleccionar un sitio alterno los costos tangibles que estos provocan y no siempre pueden cuantificarse: incumplimiento de contratos, pérdida de activos y la necesidad de reemplazarlos, el tiempo improductivo de personal, etc. Los desastres mayores pocas veces ocurren con frecuencia. Sin embargo, las consecuencias negativas que ocasionan pueden ser tan graves que la mayoría de las instituciones han establecido como una política indispensable el contar con un plan de recuperación ante contingencias. Y no sólo hay que tener dos sitios alternativos, sino tres o cuatro para ser más prevenidos.