Por @Alvy — 7 de Agosto de 2011

Amazon EC2Debido a algún problema relacionado con el suministro eléctrico, el servicio «en nube» EC2 de Amazon (Amazon Elastic Compute Cloud) ha mordido el polvo hacia las 20.00 hora española, provocando una caída total de los sistemas y arrastrando con ello a miles de servicios y páginas web allí alojadas. También han quedado afectadas las tiendas de Amazon en Reino Unido y Alemania, a las que sencillamente no se podía acceder, además de algunos servicios relacionados de la compañía, como CloudWatch y el servicio de bases de datos.

La última información es que se está recuperando el suministro eléctrico y se restaurará el servicio en 30-60 minutos, es decir hacia las 22.00-22.30 hora española. Se puede seguir la información sobre el status de Amazon EC2 en status.aws.amazon.com.

Como vuelven a demostrar los hechos, los «servicios en nube» no están exentos de problemas temas de seguridad aparte, por muy grande que sea el gigante que los gestione.

Actualización: El servicio BPOS de Microsoft (Business Productivity Online Services) incluyendo Exchange Online, SharePoint, Office Communications Online, etcétera también está alojando en la zona de Dublín (Irlanda) y también ha sufrido el mismo problema: está caído hace unas dos horas.

Actualización (22.30 GMT+2): La conectividad vuelve y Amazon.co.uk y Amazon.de funcionan de nuevo, otros de los servicios allí alojados en cambio no. Al parecer el fallo general de suministro en Dublín se ha debido a una explosión en una subestación eléctrica, según fuentes que están trabajando en el seguimiento y resolución técnica del problema.

Actualización (22.35 GMT+2): Según publica Amazon en su página de alertas de servicio, aunque parte de los sistemas se han recuperado están teniendo problemas con un generador, lo que impide que toda la zona afectada (EC2 EU-West) pueda volver a estar en línea. Las malas noticias: No hay una estimación sobre cuándo puede resolverse el problema. Esto supone que alrededor de mil sitios web europeos, que es la cifra que se calcula de forma aproximada están allí alojados, van a seguir caídos y completamente desconectados hasta que se resuelva el problema.

Actualización (22.50 GMT+2): Aunque los generadores de emergencia de Amazon Ec2 han entrado en funcionamiento ha sucedido como en otros casos similares: no han podido mantener la refrigeración en los servidores, lo que ha provocado la caída general. (Salvando las distancias, el problema es bastante similar al ocurrido con los generadores y sistemas de emergencia de la central nuclear de Fukushima.)

Actualización (23.10 GMT+2): Amazon ha anunciado que ha reinciado EC2 y que algunas de las instancias ya funcionan y están accesibles, mientras trabajan en el resto.

Actualización (8 de agosto de 2011, 00.50 GMT +2): Amazon confirma que la explosión (y posterior incendio) en la subestación eléctrica fue causada por el impacto de un rayo; normalmente eso no sería problema porque los generadores de emergencia habrían actuado, pero el impacto fue tan fuerte que se propagó hasta la zona de control «que sincroniza la planta generadora», inutilizándola. La caída total duró unas tres horas, mientras se sincronizaban los generadores manualmente. Desde las 22.47 GMT+2 se están recuperando las diversas instancias que dependen del servicio EC2, pero todavía hay problemas sin resolver con la alimentación eléctrica, de modo que puede que se necesite más tiempo de lo habitual en recuperarlo todo al completo.

Actualización (09.30 GMT +2): Amazon ha confirmado que gran parte de los servicios e instancias ya están funcionando, pero que debido a complejos problemas técnicos algunos otros podrían requerir entre 24 y 48 horas para estar funcionando como anteriormente. Microsoft por su parte ha recuperado todos sus servicios BPOS tras las primeras dos o tres horas del incidente.

Compartir en Flipboard Publicar / Tuitear