La culpa no fue sólo de Amazon, también de sus clientes

 Amazon originó la caída de servicios, pero sus clientes tampoco tomaron las debidas precauciones. - AWS

Amazon ha vuelto a ser noticia esta semana por el anuncio de unos 14.000 despidos, pese a sus ingresos multimillonarios. Al parecer, la base para estos despidos es una reducción de sus niveles de administración y una mayor automatización gracias a la incorporación de la Inteligencia Artificial (IA). El tema daría de que hablar, pero como precisamente la automatización fue la que provocó la masiva caída informática de hace algo más de una semana, merece la pena repasar qué está sucediendo.

La filial Amazon Web Services (AWS) sufrió una interrupción global de su servicio, afectando a más de 2.000 empresas y servicios que habían confiado en esta nube (cloud) para su operativa diaria. No sólo cayeron la propia Amazon, Reddit, Ring, Snapchat, Fortnite, Roblox… sino también la banca online impidiendo los pagos con tarjeta. Downdetector, que realiza informes de interrupciones, registró más de 9,8 millones de reportes, de los cuales 2,7 millones provenían de EEUU y más de 1,1 millones de Reino Unido. El resto se repartía entre países como Australia, Japón, los Países Bajos, Alemania, Francia o España.

Afectó, pues, a una gran disparidad geográfica, a pesar de que el problema que originó la caída estaba localizado en lo que AWS denomina la región US-EAST-1, situada en Virginia del Norte. Si entrar en tecnicismos, cada región alberga los centros de datos y la infraestructura necesaria para prestar servicios, separándose entre sí para mejorar la latencia y no depender unas de otras pero, en este caso, las consecuencias se hicieron notar en el resto del mundo.

Lo cierto es que la incidencia, que no fue obra de ningún ciberataque, se extendió a múltiples servicios que presta AWS a las empresas, muchas de ellas confiadas en que este proveedor era infalible. No lo es, como ha quedado demostrado, pues en las explicaciones posteriores se reveló que fallaron algunas automatizaciones que debieran haber evitado el que se ha convertido en el mayor colapso después de que otro error de la compañía CrowdStrike dejara el año pasado a millones de dispositivos Microsoft fuera de servicio.

Amazon se las prometía muy felices cuando a la media hora de identificar le problema (sobre las 2 de la noche, hora del Pacífico) comenzó a aplicar las primeras medidas de mitigación. A las 3:35 horas la compañía pensó que todo funcionaba con normalidad, pero después de las ocho de la mañana todo se precipitó. En total, la incidencia se prolongó durante cerca de 15 horas.

Podría ahondarse en la existencia de un monopolio de facto de unas pocas tecnológicas, lo que la experta de la Universidad de Stanford Marietje Schaake denomina una suerte de “golpe tecnológico a la democracia”, y no es un tema baladí, pero tampoco lo es conocer qué están haciendo las empresas clientes de Amazon para evitar situaciones como las vividas recientemente. No en vano, el hecho de que se caiga durante horas una plataforma de videojuegos o un portal de entradas de conciertos es algo menor comparado con la banca online, por ejemplo.

¿Por qué estos clientes de AWS vieron interrumpido su servicio con la caída de Amazon? ¿Acaso no cuentan con medidas de respaldo para garantizar la continuidad de negocio? ¿Han dejado todos sus huevos en la cesta de Amazon? A la vista de los resultados, no parece complicado responder a estas cuestiones.

Las empresas que prestan servicios de nube pública, como AWS, son denominados en la jerga del sector “hiperescaladores”. AWS es el líder de este mercado, seguido principalmente de Microsoft con su oferta Azure y de Google con su propuesta Google Cloud Platform. Para que lo entienda un lector o lectora poco familiarizado con la tecnología, las empresas tienen varias opciones para operar sus sistemas informáticos. De modo resumido, diremos que pueden ejecutarlos exclusivamente en sus propias instalaciones, lo cual requiere de una fuerte inversión; confiarlo a un tercero, como es el caso de estos hiperescaladores o, lo que suele ser más común, una mezcla de ambos.

En el caso de confiar en la nube pública, algunas organizaciones apuestan por disponer de más de un proveedor, pero esto tiene repercusiones a la hora afrontar los costes (que se disparan) o la integración de aplicaciones y procesos (que se complica). En esencia, no es tan sencillo como pudiera parecer, lo que para los departamentos de sistemas genera quebraderos de cabeza. En cambio, disfrutar de un único proveedor trae consigo una mayor eficiencia; su lado oscuro es que también se generan dependencias con las que se puede quedar al descubierto, como sucedió en octubre.

Así las cosas, si una empresa apuesta por un único proveedor cloud, ¿está vendida ante un incidente de este tipo? No, de hecho, la mayoría de los hiperescaladores ofrecer opciones de respaldo con centros de datos de diferentes regiones que, si bien pueden arrojar ciertos problemas de latencia en su sincronización derivados de la distancia, son una opción viable. AWS ofrece esa posibilidad de contar con diferentes regiones y zonas de disponibilidad, pero hay que pagarla, claro. Con todo, esa alternativa suele ser más barata y sencilla que recurrir a una estrategia multiproveedor sólo para asuntos de resiliencia informática.

Dicho esto, una cosa bien distinta es contar con respaldos o copias de seguridad de los datos y otra muy diferente redundar absolutamente todos los sistemas y procesos. Esto último es inviable para cualquier empresa. ¿Qué suelen hacer las empresas? Sopesar niveles de riesgo y repercusiones, de modo que no se invierte con la misma intensidad en todas las áreas. El razonamiento se podría resumir en que si la caída de los sistemas únicamente molesta o genera ruido entre sus clientes, la compañía se puede permitir el lujo de confiar en la supuesta infalibilidad de su proveedor, en este caso Amazon.

Tras el colapso del mes pasado, Amazon afirma haber redoblado sus mecanismos de control y protección para tratar de anticiparse a una caída como la sufrida. La gran incógnita es, ¿qué habrán hecho sus clientes, los mismos que a usted, sin ir más lejos, le dejaron sin servicio? Probablemente, seguir confiando en la infalibilidad de AWS tanto como en que, en caso de nueva caída, usted crea que sólo es responsabilidad de Amazon y no suya. Sin embargo, en ese caso, usted ya sabrá que no es así, que la responsabilidad es compartida.

(Artículo en Público

Next Post Previous Post

Sin comentarios