Para algunos de nosotros, el 28 de febrero de 2017 será recordado como el día que se sentía como la mitad de la Internet falló debido a un apagón enrome de AWS. Se sentía vagamente familiar al Día del juicio DNS (DNS Doomsday) en octubre de 2016. Incluso aquellos que no utilizan AWS sintieron los efectos como scripts, dependencias y recursos de CDN comenzaron a agotarse en la web, con lo que miles de sitios, APIs y aplicaciones se paralizaron. Este es un recordatorio muy importante de por qué la web necesita más proveedores de cloud computing (computación en la nube) para almacenamiento y entrega. Las grandes empresas ni siquiera están aprovechando la replicación entre regiones. La competencia sana en este espacio siempre es una buena cosa, ya que reduce los costos para las empresas y los consumidores, y significa una mayor distribución de servicios y soluciones a través de múltiples proveedores.

Interrupción de AWS

En la mañana del 28 de febrero de 2017, los servicios de Amazon S3, parte de Amazon Web Services, comenzaron a fallar. BuiltWith muestra que más de 600,000 sitios web actualmente dependen de AWS para potenciar sus sitios, almacenamiento o servicios. Amazon Cloud también ha reportado tener más de 1 millón de clientes. Mientras que puede que ni siquiera parezcan muchos en el ámbito de todo el Internet, tuvo un enorme efecto de rizo en toda la web debido al hecho de que muchos servicios que todos usamos a diario dependen de Amazon S3.

Actualizado el 3 de marzo de 2017 – Amazon ha publicado un resumen acerca de la interrupción, causada por error humano.

Utilizamos muchos productos SaaS en Kinsta y lo pudimos notar por primera vez aquí ya que Intercom, nuestro sistema de soporte al cliente y de tickets comenzó a experimentar problemas con su conectividad API, de la cual pronto tuvieron un anuncio en su página de estado. Esto significa que ya no podemos contestar entradas para nuestros clientes. Para poner esto en perspectiva, Intercom dispone de más de 15,000 empresas con más de 100,000 usuarios, y luego sus clientes. ¡Para Intercom de repente dejar de cargar es un problema importante!

intercom-sistema-estado

Lo irónico de esto es que su página de estado también estaba agotando algunos elementos/ scripts, debido al hecho de que están usando StatusPage, que se basa en Amazon CloudFront. Muchas empresas tienen exactamente la misma configuración. Trello es otro que tuvo problemas con AWS y también su página de estado sin conexión. Creemos que esta es una buena lección para no utilizar los mismos proveedores de cloud computing para su API o servicios, así como su página de estado. Tener a ambos fuera de servicio repentinamente derrota el propósito de tener una página de estado.

amazon-servicios-web-460x200

Amazon poco después de que publicó un mensaje en su página de estado :

Continuamos experimentando altas tasas de error con S3 en US-EAST-1, que está afectando a varios servicios de AWS. Estamos trabajando arduamente en la reparación de S3, creemos entender la causa raíz, y estamos trabajando en la aplicación de lo que creemos que va a remediar el problema.

La parte irónica aquí es que aparte del pequeño mensaje de error por encima de lo que publicaron, el resto de los indicadores de servicio mostraron que todo funcionaba normalmente.

amazon-s3-estado-activo

Lo que ocurrió fue que la página de estado realmente dependía de que AWS S3 funcionara correctamente. Es decir técnicamente AWS rompió AWS, si es que usted puede llegar a entenderlo.

La interrupción de AWS S3 afectó a miles de sitios web, servicios, aplicaciones y APIs en la web. Muchos de nuestros clientes aquí en Kinsta utilizan CloudFront o tienen plugins que están cargando recursos de Amazon S3. Hemos notado que los sitios de WordPress comenzaron a agotarse debido a que los recursos externos no podían cargarse, lo que aparecía para algunos como errores de 502 puerta de enlace no válida. Utilizamos Google Cloud Platform y no pasaba nada malo en nuestros servidores, y sin embargo la interrupción de AWS realmente afectó a nuestros clientes. Esto es algo que debe tener en cuenta cuando elige un proveedor de CDN y almacenamiento de objetos de terceros. ¡Las integraciones externas pueden dejar a su sitio fuera de servicio!

amazon-s3-script-archivo

También usamos Trello aquí en Kinsta y para aquellos de nosotros en los Estados Unidos, no podíamos acceder a nuestras tablas, pero recibimos un mensaje diciendo que los servidores de Trello están recibiendo un TLC. E irónicamente, la imagen Sleep Taco se rompe debido a que intenta cargar desde CloudFront. Lectura sugerida: Trello vs Asana.trello-inactividad

Algunos otros sitios populares que estuvieron de baja o tuvieron problemas fueron Quora, Business Insider, Giphy, Hacker News, BaseCamp, Buffer, Imgur, Netlix, Docker, Github, Twitch, Adobe, HipChat, Flippa, Expedia, New Relic, PagerDuty, Pantheon , Sprout Social, Elástico, Citrix, Zendesk, Brightcloud, IFTTT, Heroku, Slack (intercambio de archivos y GIFs), Typeform, y muchos otros. Quizás la más irónica de todas es “Is It Down Right Now?” también tenía problemas para mantenerse online. Por supuesto, siempre que esto suceda, usted tiene gente dirigiéndose a Twitter para expresar sus comentarios.

Y hay miles más de donde vino. Mientras que los memes y Tweets pueden ser divertidos, la parte que da miedo aquí es realmente cuánto del mercado cloud computing que posee Amazon y cuánto efecto tiene cuando se cae. Realmente tiene sólo algunos luchando por la cuota de mercado. Según un estudio realizado en 2017 por Synergy Research GroupAWS tiene un poco más del 40% del espacio del proveedor de cloud computing. Después tiene, Microsoft Azure, Google e IBM compitiendo en alrededor del 20%. Y por supuesto, hay miles de otros pequeños proveedores que luchan por el resto.

cuota de mercado proveedores de cloud computing

A pesar de que Google Cloud Platform tiene sólo alrededor de la mitad de la cuota de mercado que Amazon, estamos muy contentos de ver su crecimiento de más del 5%. Y nos encantaría ver a más proveedores entrar en el espacio, ya que es una victoria para todos los involucrados. La difusión de los servicios entre los proveedores múltiples podría resolver algunos de estos días, donde se siente como si toda la web se hubiese caído.

Hay Alternativas de Proveedores de Cloud Computing

A continuación, se presentan algunos proveedores alternativos de cloud computing que deseará consultar para la entrega de archivos, las API y las aplicaciones. No estamos diciendo que Amazon es malo, de hecho, ellos normalmente tienen muy buen tiempo de actividad. Pero muchas empresas y clientes van con AWS porque todo el mundo parece utilizarlos, lo cual no es una buena razón para elegir un proveedor de cloud. Después de ver lo que pasó hoy, podría ser sabio en distribuirlos. Por ejemplo, alojar los activos de su sitio web frente a un proveedor y utilizar otro para su API. De esta manera usted puede por lo menos construir alguna redundancia simple para que todo no se desconecte.

Muchos proveedores también tienen soporte multiregional o replicación entre regiones, en la que debe alojar sus aplicaciones críticas. Sin embargo, parece que muchas empresas no están utilizando estas características. Esto puede ser más de una configuración compleja, que podría ser una razón por la que no están aprovechando esta configuración. O debido al costo adicional. Pero más proveedores de cloud en el mercado sería simplemente una manera fácil de forzar una distribución más amplia de servicios a través de múltiples proveedores.

Google Cloud

Por supuesto somos grandes fans de la Google Cloud Platform, tanto para su Compute Engine como para el almacenamiento cloud, ya que los utilizamos para potenciar todos nuestros sitios de WordPress. De hecho, SADA Systems recientemente encuestó a más de 200 gerentes de TI sobre su uso de los servicios de cloud públicos, y encontró que el 49% prefiere Google Cloud sobre Amazon.

it-managers-usan-google-cloud

Eche un vistazo a nuestro post en profundidad sobre las principales 7 ventajas de Google Cloud Platform. Usted, por supuesto, también tiene otros proveedores que también ofrecen capacidades de computación junto con soluciones de almacenamiento:

Actualizaciones Adicionales de Amazon S3

Los servicios de Amazon S3 han sido restaurados y todo vuelve a funcionar. Vea las actualizaciones de estado adicionales:

  • Actualización a las 2:08 PM PST: A partir de 1:49 PM PST, estamos totalmente recuperados para las operaciones de añadir nuevos objetos a S3, que fue nuestra última operación mostrando una alta tasa de error. El servicio Amazon S3 está funcionando normalmente.
  • Actualización a las 1:12 PM PST: Recuperación de objetos S3, listado y eliminación ahora se han recuperado totalmente. Todavía estamos trabajando para recuperar operaciones normales para añadir nuevos objetos a S3.
  • Actualización a las 12:52 PM PST: Se ha registrado recuperación para recuperaciones de objetos S3, listado y eliminaciones. Continuamos trabajando en la recuperación para añadir nuevos objetos a S3 y esperamos comenzar a ver tasas de error mejoradas dentro de la hora.

Resumen

Creemos que todo el mundo puede sacar algunas lecciones de lo que pasó con AWS. No hay un proveedor de cloud que sea perfecto, y eso es más una razón por la que esperamos ver más competencia en este espacio. Sería increíble ver un día a 10 o más proveedores compartiendo igualmente la cuota de mercado, ya que esto significaría más servicios distribuidos a través de la web. Si uno se cae, no nos sentiríamos como un efecto de rizo como lo hicimos hoy. ¿Cuáles son sus pensamientos? ¿Cree que necesitamos más proveedores de cloud computing en el espacio?

Brian Jackson

Brian tiene una gran pasión por WordPress, lo ha estado utilizando durante más de 10 años e incluso ha desarrollado un par de plugins premium. Brian disfruta de los blogs, las películas y el senderismo. Conéctese con Brian en Twitter.