El pasado lunes fue un lunes muy lunes en España, ya que no sólo tuvimos que lidiar con la caída de los servicios en la nube de Amazon, sino que además durante unas horas de esa mañana fallaron los pagos a través de RedSys, que da servicio a cosa de un millón y medio de establecimientos. Así que era un poco inevitable hablar de eso en Cruce de cables, el programa sobre tecnología de RNE en el que colaboramos todas las semanas.
Puedes escuchar mi intervención aquí:
- La caída de AWS (a partir del minuto 18:45).
El resumen es que:
- Falló el DNS del centro de datos US‑EAST‑1 de Amazon. El DNS es el sistema que le dice a los ordenadores que quieren conectarse a otros «a dónde tienen que llamar» así que aunque las máquinas de Amazon funcionaban, muy pocos ordenadores sabían cómo conectarse con ellas.
- Se supone que los servicios web de Amazon están distribuidos en 120 centros de datos en 38 zonas geográficas distintas. Pero US‑EAST‑1 es la opción por defecto cuando activas ciertos servicios de AWS. Así que soporta más tráfico que otros centros de datos.
- Se supone también que los sistemas de Amazon detectan caídas de forma automática y redirigen el tráfico a otros centros de datos llegado el caso. Pero quizás la capacidad de respuesta no era suficiente frente a las demandas las que se ve sometido US-EAST-1.
- Al parecer también hay ciertos servicios de AWS que, aunque estén replicados en otras zonas y centros de datos, dependen directamente del que tuvo problemas.
- Así que varios miles de servicios y webs se vieron afectadas, desde cosas más o menos triviales como el Wordle hasta el equivalente británico de la Agencia tributaria.
- Con el mercado mundial de este tipo de servicios, que por mucho que «estén en la nube» no dejan de ser utilizar un ordenador en remoto, en manos básicamente de Amazon, Google y Microsoft, es complicado que podamos escapar de ahí.
- Pero quizás lo del pasado lunes sirva de toque de atención para que los departamentos de informática –y los usuarios de a pie– revisemos la configuración de las cosas y las garantías que nos dan esos servicios en la nube. Aunque no parece muy probable.
Aunque si quieres leer la versión de Amazon hay un resumen técnico detallado publicado por Amazon bajo el título Summary of the Amazon DynamoDB Service Disruption in the Northern Virginia (US-EAST-1) Region. Pero como dirían los joveznos, «demasiado texto».
Lo de la caída de RedSys fue una coincidencia debido, al parecer, a problemas de comunicación en su red, pero toda una faena.





