Pruebas de recuperación tras desastre

Una vez que disponga de un plan de recuperación en caso de catástrofe(DR), pruébelo periódicamente. Puede evitar encontrar fallos cuando se enfrente a una catástrofe real. Las pruebas ayudan a garantizar que el plan funcione y consiga el resultado deseado. Si el plan no funciona durante las pruebas, puedes hacer los cambios necesarios. Las pruebas periódicas ayudan a captar cualquier cambio en el entorno de la carga de trabajo y a realizar los ajustes necesarios.

Para verificar su plan, utilice distintos tipos de pruebas de recuperación en caso de catástrofe:

  • Simulacro de DR
  • Simulación de DR
  • Cambio

Simulacro de DR

Una prueba en seco es una práctica en papel de su plan de RD. Cuando se realiza una prueba en seco, no se lleva a cabo ninguna recuperación, pero se comprueba que no haya agujeros evidentes en el plan. Por ejemplo, la prueba en seco ayuda a garantizar que:

  • cuenta con el personal adecuado
  • las copias de seguridad están presentes y disponibles
  • los canales de comunicación entre el personal funcionan
  • no faltan pasos en los libros de ejecución de RD
  • los traspasos entre equipos funcionan eficazmente

Una prueba seca de RD requiere el mismo esfuerzo en cuanto a competencias y personas que cualquier otra prueba. Dado que no se realizan acciones de recuperación reales, este tipo de pruebas es más rápido, por lo que normalmente se ejecuta con mayor frecuencia en comparación con los otros tipos de pruebas. Puede elegir entre ejecutar el plan en su totalidad o probar partes y servicios individuales dentro del mismo.

Simulación de DR

La simulación de RD es una forma de verificar o auditar los libros de ejecución de emergencia y comprobar los objetivos de tiempo de recuperaciónEn la planificación de la recuperación en caso de catástrofe, el tiempo que tarda en restablecerse un proceso empresarial tras una catástrofe. (RTO) y los objetivos de punto de recuperaciónEn la planificación de la recuperación de desastres, el momento en el que se restauran los datos medido en tiempo (segundos, minutos, horas) empezando en la instancia recuperada y terminando en el punto del desastre. (RPO) proporcionados por la solución simulando las condiciones de una emergencia real y restaurando los datos.

Una simulación de DR requiere una planificación cuidadosa, ya que se están introduciendo posibles interrupciones en la replicación de datos desde la región primaria, al tiempo que se evita el impacto en las cargas de trabajo de producción. Mientras está probando el entorno de recuperación ante desastres, es posible que no esté disponible temporalmente para fines reales de recuperación ante desastres. Este riesgo depende de los servicios en nube específicos y de cómo se desplieguen. Algunos servicios pueden permitir pruebas y disponibilidad simultáneas, mientras que otros no.

Una simulación de DR crea una copia temporal de su entorno de producción en la región de DR designada para pruebas y validación. Una vez finalizada la simulación, el entorno de prueba se elimina o se restablece, y cualquier cambio realizado durante la prueba se descarta, ya que el entorno de producción primario sigue funcionando con normalidad.

Cambio

La conmutación consiste en cambiar el entorno de producción de una región a otra. Este método ayuda a verificar y auditar la capacidad de realizar y mantener operaciones de producción durante un largo periodo en una región alternativa. Las operaciones de producción se detienen en la primera región, se trasladan a la segunda y se reinician tras la restauración de los datos que sea necesaria.

Después de verificar que la segunda región funciona como se espera, puede reanudar las actividades de producción y configurar la replicación de datos para que la región original sea la nueva región secundaria. Tu entorno de producción seguirá funcionando desde este sitio hasta que decidas volver a cambiarlo.

Frecuencia de las pruebas DR

La frecuencia con la que ponga a prueba su plan de RD depende de muchos factores, entre ellos lo que exijan las normas de cumplimiento reglamentario. Si el cumplimiento no es un problema, intente realizar una prueba de RD completa al menos una vez al año y documente los resultados para que los revise el auditor. Es una buena práctica realizar pruebas a menor escala a lo largo del año para ayudar a garantizar la preparación.

Tenga en cuenta las siguientes preguntas y ajuste la frecuencia de sus pruebas:

¿Cuál es el dinamismo de mi carga de trabajo?
Cuanto más cambie su carga de trabajo, más a menudo tendrá que realizar algún tipo de prueba de RD. Así podrás comprobar que los cambios no afectan a tu capacidad de recuperación. Los cambios pueden incluir nuevas dependencias, otros servicios en la nube, cambios en la infraestructura, etc. Los conjuntos de datos en crecimiento tardan más en recuperarse, lo que puede afectar a su capacidad para cumplir un RTO específico.
¿Cuál es el dinamismo de mi plantilla?
También puede tener en cuenta la rotación de personal en la frecuencia de las pruebas. Si cambia el personal que realiza la recuperación, asegúrese de que los nuevos miembros del equipo entienden cómo funciona la RD y su papel en el plan de RD. Si tiene varios miembros nuevos en el equipo que no están seguros o que no están familiarizados con las pruebas de RD, añade riesgo a su plan de recuperación.

¿En qué más deben centrarse mis pruebas?

El objetivo principal de cualquier prueba de recuperación ante desastres es confirmar que puede recuperar con éxito las cargas de trabajo. Sin embargo, asegúrese de que los siguientes también funcionan bien:

  • Personal clave: El plan de RD debe describir el personal necesario para una recuperación satisfactoria y cuáles son sus funciones. Considere si necesita más personas o funciones durante las pruebas, o si algunas sobraban, y hasta qué punto las personas eran capaces de desempeñar su función.
  • Comunicación: El plan de RD debe definir claramente cómo comunicarse en caso de catástrofe. Considere si la comunicación entre los participantes, incluidos los canales de comunicación utilizados, funcionó bien durante las pruebas.
  • Dependencias documentadas: Es probable que su plan de DR describa las dependencias. Compruebe que son válidos y no obstaculizan el proceso de recuperación. Al mismo tiempo, asegúrese de que se registra cualquier nueva dependencia.
  • Otra documentación: Es posible que se utilicen libros de ejecución para aplicar la recuperación, por lo que es importante conocer su precisión y eficacia. No documentar suficientemente los pasos puede provocar retrasos, mientras que dar demasiados detalles o detalles que no son relevantes puede tener el mismo efecto. Pida a alguien que no sea el autor que compruebe los pasos para asegurarse de que son claros. De este modo, el proceso es utilizable incluso si el autor no está disponible durante una catástrofe.

Tras las pruebas

Una vez finalizada cualquier prueba, registre los resultados como referencia para la siguiente prueba. Si más adelante se cambia el procedimiento de prueba, es fácil comparar los resultados.

Después de cada prueba de recuperación en caso de catástrofe, actualice el plan y la documentación relacionada en función de los resultados. Un plan de RD es un documento vivo que necesita ajustes periódicos para seguir siendo eficaz. Utilice los comentarios de los participantes para identificar lo que funcionó bien y lo que no, e incorpore esas ideas a futuras pruebas. Asimismo, considere la posibilidad de ofrecer más formación si es necesario, ya sea para aclarar funciones, mejorar la comunicación o potenciar los conocimientos técnicos.