Blog Nubity
May 2019
M T W T F S S
« Apr    
 12345
6789101112
13141516171819
20212223242526
2728293031  

Categorías


Blog Nubity

[Guía ejecutiva] Manejo de crisis informáticas – Parte 1

¡Detecta las crisis antes de que sucedan!

Josué BeltránJosué Beltrán

Digamos que tienes una empresa mediana, tu infraestructura está alojada con algún proveedor de nube, los proveedores normalmente cuentan con un SLA de 99.99% de uptime, lo cual es genial, pero ¿qué pasa con ese 0.01%? Es decir que si tu empresa no cuenta con redundancia geográfica, es muy probable que por lo menos algunas horas al año tu sitio experimente caídas, y ¿qué pasa si entras en downtime justo durante una venta especial o si lo único afectado es el correo electrónico?

Relacionado: ¿No tienes un Disaster Recovery Plan? Estás a tiempo de evitar un desastre

Los casos anteriores suenan mal, pero existen registros de desastres informáticos como los del sistema bancario de Chile hace unos años donde tuvieron que detener todas las transacciones debido a un terremoto, eso no sólo afectó a la empresa, también a una larga cadena de inversionistas, socios de negocios y usuarios finales, además de costarle a los bancos varios millones de dólares.

Posiblemente tu empresa no sea un banco, ni un e-commerce, quizás no dependas tanto de los procesos informáticos, pero recuerda que cuando menos todos necesitan facturar ¿Qué pasa si los sistemas de facturación no funcionan?

Es decir, hoy nadie se salva de un dolor de cabeza porque tal o cual servicio presenta una caída, pero es también gracias al avance tecnológico que se han desarrollado nuevas soluciones que nos permiten reducir al mínimo la pérdida de datos, la caída de servicios o la fuga de capital, todo depende de cómo manejes la situación con tu equipo. En el presente artículo te mostraremos el panorama histórico de las crisis informáticas, las fases de una crisis, cómo detectar crisis antes de que sucedan y posibles soluciones ante algunos de los peores escenarios de crisis informáticas.

Los desastres informáticos en la historia

Desde que comienza la historia de la computación han existido los errores de software, muchos de los errores del pasado se han corregido con herramientas de nueva tecnología, como los tests automatizados, control de cambios y demás metodologías como el code review, pero no todos lo errores dependen directamente del código. A continuación se mostrarán algunas de las crisis informáticas que han llegado a los anales de la historia, y que pudieron haberse evitado con un poco de precaución.

En el caso de errores de software por parte de la mano humana, ya sea por negligencia o errores de dedo, existen dos casos emblemáticos, uno de los más antiguos fue el caso del Mariner 1.

En 1962 un error de transcripción de un script provocó que el cohete Mariner 1 se desviara de su curso. El error que disparó la crisis fue la simple omisión de un guión en el script, lo que alteró los cálculos en la trayectoria del cohete, mismo que se le envió la señal de autodestrucción 6 segundos antes de liberar la sonda montada.

En 1999 el famoso error Y2K, donde para ahorrar espacio en disco se almacenaban las fechas con el año a dos dígitos en vez de cuatro y por el cual se perdieron más de 500 mil millones de dólares.

Como puedes darte cuenta, esos errores que pudieron resolverse de forma simple, pero escalaron y se convirtieron en crisis.

Aunque ya estamos lejos de esos errores ¿Cierto? Como se mencionó antes, ya existen herramientas que previenen detalles de ese tipo, pero si trabajamos bajo la lógica de que nada malo puede pasar ahora, podríamos caer en el hoyo del exceso de confianza.

No es necesario ir muy lejos en el tiempo, remontemos a principios del año, el descubrimiento de Meltdown y Spectre, una falla mínima en la memoria que permitía entrar a lo más íntimo del sistema operativo. Por fortuna se detectó y se pudo resolver rápidamente, antes de que las vulnerabilidades fueran explotadas por el cibercrimen, pero la solución le costó a las empresas tiempo y dinero, y fue peor para aquellas empresas que no contaban con algún tipo de soporte o servicios administrados, ya que todos los costos de parchado y correctivos corrieron por cuenta de ellos.

El 2018 también ha estado marcado por constantes avistamientos de Ransomware que han provocado incalculables pérdidas de datos. Incluso se tiene ya registros de ransomware dirigido por medio de bots, por lo que el proceso de sofisticación del cibercrimen ha alcanzado un nivel sin precedentes.

Hablando de ciber crimen, ¿Qué pasa con el espionaje? Recientemente se descubrió que China implantó microchips del tamaño de la cabeza de un alfiler en las placas base de servidores, con lo que logró infiltrar a Amazon y Apple. Y no olvidemos todas las noticias que apuntan a que muchas de las elecciones democráticas en diversos países están en juego gracias a la intervención de potencias tecnológicas.

Imagen tomada de Bloomberg (https://www.bloomberg.com/news/features/2018-10-04/the-big-hack-how-china-used-a-tiny-chip-to-infiltrate-america-s-top-companies?srnd=businessweek-v2)

También recordemos que en Marzo pasado uno de los centros de datos de Amazon Web Services sufrió de un corte en el servicio, mismo que afectó a Atlassian, Slack y Twilio. Así mismo, Microsoft Azure sufrió un corte en el servicio el mes pasado, en septiembre, para ser exactos, que si bien no causó pérdida de datos, sí impactó en el corte de servicios por el tiempo fuera de línea.

Y por si no es suficiente, la semana pasada un estudio en el Pentágono reveló que la mayoría de los sistemas de seguridad de la institución aún tenían las contraseñas predeterminadas y, al correr los ensayos de penetración, en unas cuantas horas se tuvo control de las armas a cargo del Pentágono y en tan sólo en 24 horas se tuvo el control total de los sistemas de la misma institución.

Finalmente, pero no menos importante, los desastres naturales son cuestiones que se tienen que afrontar todos los días: terremotos, tsunamis, incendios, huracanes. En los últimos dos años hemos sido testigos de terribles tragedias que traen consigo tanto pérdidas humanas como el corte de servicios básicos, desde no poder obtener dinero de un cajero automático, pasando por el servicio eléctrico e incluso la privación de un bien tan vital como el agua.

En resumen, un error simple puede llevar a una crisis, pero tampoco podemos confiar en que nuestro proveedor mantendrá todo en orden siempre ya que, independientemente de sus SLAs, hay muchos factores externos de los cuales también dependemos, como la geopolítica, la naturaleza, los fallos técnico/tecnológicos, los proveedores e incluso los empleados.

Entonces, quizás creas que todo funciona correctamente, pero no puedes predecir lo que mañana pasará, por lo que conviene hacerte una sencilla pregunta:

¿Sabes qué hacer en caso de una crisis informática?

No hay una respuesta simple para esto, las crisis no pasan todos los días, pero cuando suceden desearíamos haber estado preparados, aunque no podemos saber cómo prepararnos si se desconocen las amenazas a las que una empresa está expuesta día a día, por lo que a continuación profundizaremos en el tema.

¿Qué es una crisis?

Las crisis son situaciones coyunturales, que pueden llegar a cambiar las circunstancias al grado de revolucionar, debido a su alto grado de impacto en las estructuras de empresas, sociedades e incluso a nivel mundial.

Es decir que una crisis te llevará a ti y a tu equipo a evaluar las situaciones venideras, hará que cambien muchos procesos y podrían desencadenar una ola de innovación, lo cual suena muy bien, pero esto sucede si y sólo si la empresa logra salir a flote después de la crisis.

Cabe destacar que las crisis no son sólo informáticas, incluso crisis económicas o sociales podrían poner en riesgo a las empresas, pero el enfoque del presente artículo es orientado a las crisis informáticas.

¿Cómo saber a qué riesgos está expuesta tu empresa?

Señales de crisis

Según Steven Fink, en su libro Crisis Management: Planning for the inevitable (Fink, 1986), define cuatro fases en cualquier crisis: La sintomática, la aguda, la crónica y la de resolución. Puede parecer una determinación sencilla pero a continuación se explica con mejor detalle.

En la fase sintomática (prodromal stage), es aquella en la que se encuentran señales de una crisis pero no aún no se desencadena y, por lo mismo, es mucho más sencillo controlar la situación antes de que llegue a su máxima expresión. Como en cualquier enfermedad, los síntomas nos advierten acerca de un peligro latente, pero en ocasiones no hay advertencias visibles, cuando esto sucede, las crisis pueden golpear de forma inesperada y violenta. En ciertos casos los síntomas pueden ser complejos de detectar, pero si se detectan a tiempo es mucho más sencillo atacar al problema en esta fase. Es decir que aplica el viejo adagio: «más vale curarse en salud».

Si la crisis escala a la fase aguda, no hay vuelta atrás, es necesario responder a la crisis de manera ágil hasta mitigar el problema. Lars H. Esbensen y Tomas Krisciunas en su estudio Crisis Management & Information Technology afirman:

«El manejo de la fase aguda depende de las preparaciones adecuadas durante la fase sintomática» (Esbensen y Krisciunas, 2008).

Esto no quiere decir que si no estás preparado desde la fase anterior, significa que estás muerto, pero de no estar preparado la crisis podría explotar con mayor severidad y podría salirse de las manos. Si esto ocurre, no queda otro camino que trabajar sobre el evento directamente hasta mitigar las afectaciones más graves.

Una vez que la intensidad de la crisis ha bajado, es necesario comenzar con la limpieza, esta fase se le conoce como la fase crónica, en la que se procede a hacer investigación del suceso en concreto, determinar las razones y estudiar el progreso de la crisis en tanto se prepara el restablecimiento del orden. Steve Fink también señala que aquellas empresas que no cuentan con un plan de manejo de crisis tardan hasta dos veces y media más en superar la fase crónica que aquellas que sí están preparadas.

Finalmente, la fase de resolución, se logra a partir del paso por las otras tres fases y una vez llegado a este punto, es mucho más sencillo convertir los problemas en oportunidades, es decir, aquella crisis que puso en juego a tu empresa se convertirá en una señal de que las cosas tienen que cambiar y a partir de ahora estarás preparado para sucesos similares.

Eso es todo por hoy, no te pierdas la segunda parte donde hablaremos acerca de diversos casos de crisis, los síntomas que llegan a presentar y sus posibles soluciones, además de algunos pasos a seguir para prepararse ante una posible crisis.

¿Necesitas más ayuda?

Nubity cuenta con un robusto equipo de profesionales certificados que pueden ayudarte a prevenir crisis, o lidiar con ellas,

¿Quieres conocer más? Crea una cuenta gratuita y prueba nuestra plataforma web, con la que podrás monitorear gratis un servidor, no importa dónde esté alojado, AWS, Azure, IBM o si es on premise.

¡Comienza a monitorear tus servidores!

Comments 0
There are currently no comments.

Deja un comentario