El término “Recuperación de Desastres” nos trae a la mente una destrucción catastrófica, pero en realidad, una simple falla en la energía eléctrica puede causar un pequeño desastre en la empresa. Sin un Plan de Recuperación de Desastres (Disaster Recovery Plan) en forma, la pérdida de hasta un simple switch de red puede convertirse en un problema mayor, consumiendo tiempo valioso para la organización.
Fundamentos Para un Plan de Recuperación de Desastres
Los Administradores del área de T.I. deben comenzar por hacer un inventario completo y donde se encuentra localizado cada uno de los equipos al momento de hacer el Plan de Recuperación de Desastres. Este inventario debe incluir switches, controladores WLAN, Access Points, otros dispositivos de red que se encuentren conectados a esta.
Un inventario adecuado ayudará al administrador determinar cuales son las partes de repuesto que debemos tener a la mano en caso de problemas de hardware, o en eventos como caída de rayos o tuberías reventadas de agua sobre los racks.
Si el presupuesto lo permite, es conveniente, para el administrador de T.I., tener algunos equipos de comunicación de respaldo, como switches, ruteadores, etc. o cualquier otro equipo critico que pueda fallar.
Una vez que se tiene todo el inventario de equipo, los administradores deberán capturar los datos de configuración de cada uno de los equipos y resguardarlos en una locación alterna segura y de rápido acceso. Una NCCM (Network Change and Configuration Management) es una herramienta que nos permite automatizar el proceso de captura de datos.
Lista de Verificación Para Un Plan de Recuperación de Desastres
Cuando hablamos de ejecutar una Recuperación de Desastres de nuestra red o de la Continuidad del Negocio, el tiempo y la precisión son de alta importancia. Las metas de una recuperación de desastres y la continuidad del negocio son sensitivos en el tiempo y bastante críticos, por lo que el uso de una Lista de Verificación se convierte en una herramienta ideal cuando nos afrontamos a una situación en donde esos planes requeridos.
Las siguientes actividades definen una seria de acciones o actividades que deben entrar en juego cuando se requiere ejecutar una recuperación de desastres:
- Detectar Una falla y efectos de desastres lo más rápido posible
- Notificar a los responsables que deben tomar acción
- Aislar los sistemas afectados para limitar el alcance de las fallas y daños
- Reparar o reemplazar sistemas críticos, y trabajar hacia una continuidad en las operaciones normales, si es que las circunstancias lo permiten.
Que Incluir En Una Lista de Verificación de Un DRP
Cada Lista de Verificación comienza con el inventario de equipos de red y de sistemas, servicios y aplicaciones, en donde existe una lista de verificación separada para cada objeto. Cuando es para equipo de red, es muy importante incluir elementos clave de infraestructura, como ruteadores, switches y dispositivos de optimización de la WAN.
Es también muy importante modelar diferentes tipos de fallas para asegurarnos que los planes y listas de verificación se direccionen adecuadamente. Esto incluye accesos, equipos, medias y fallas de los sistemas.
En general, debes crear una receta paso por paso para cada tipo de falla por cada objeto del inventario. Las fallas mas obvias en los dispositivos deberán pasar por los siguientes pasos:
- Ejecutar diagnósticos para establecer el estado del dispositivo. Esto incluye una serie de paso por paso de comandos y acciones GUI documentadas para soportar las operaciones necesarias.
- Para las fallas mas obvias, crea un perfil de configuración de importación para repuestos. Muestra información de donde puedes encontrar repuestos, como revisar uno, que debes desconectar del dispositivo viejo y como conectar el nuevo.
- Ejecutar diagnósticos en la unidad de reemplazo para asegurarnos que funciona adecuadamente. Esta es una serie de comandos paso por paso o acciones GUI como primer paso.
- Quitar la unidad con el fallo y reemplazarla con la unidad nueva probada.
- Probar la unidad nueva para asegurarnos que los servicios de prueba funcionen adecuadamente. Define una serie detallada de revisión de las operaciones, lo más ideal para esto es que sea por medio de scripts de prueba automatizados.
- Si la unidad pasa las pruebas, repórtalo como reemplazo y restauración exitosa, si las pruebas fallan, regresa al primer paso.
Conforme todo el staff trabaje con estos planes de contingencia, estarán interactuando y compartiendo preguntas y dudas que te podrán ayudar para futuras auditorias, o para ajustar algunos pasos o listas de verificación que ya existan para ir mejorándolas, o para hacerlas relevantes y utilizables continuamente. Debemos encaminar a que el personal involucrado entienda la importancia de esta actividad.
Tags: contigencia y calidad total, continuidad de negocio bcp, continuidad de negocios, continuidad del negocio, continuidad negocio, drp, pasos para hacer un plan de recuperacion de desastres, plan continuidad de negocio, plan continuidad negocio, plan de contingencia, plan de recuperación ante desastres, plan de recuperacion de desastres informaticos, plan recuperacion desastres, planes de continuidad de negocios, planes de continuidad del negocio, que es un drp, recuperación ante desastres, recuperacion de desastres, recuperacion de desastres informaticos, recuperacion desastres, sistemas, sistemas de informacion, sistemas y calidad total, tecnologia de informacion