Pour certains d’entre nous, le 28 février 2017 restera gravé dans nos mémoires comme le jour où la moitié de l’Internet s’est effondrée en raison d’une panne majeure des services Web d’Amazon (AWS). Cela semblait ressemblait vaguement au DNS Doomsday en octobre 2016. Même ceux qui n’utilisent pas AWS en ont ressenti les effets lorsque les scripts, les dépendances et les ressources CDN ont commencé à s’écouler sur le Web, paralysant des milliers de sites, d’API et d’applications. C’est un rappel très important de la raison pour laquelle le Web a besoin de plus de fournisseurs de cloud computing pour le stockage et la livraison. Les grandes entreprises ne profitent même pas de la réplication interrégionale. Une saine concurrence dans ce domaine est toujours une bonne chose, car elle fait baisser les coûts pour les entreprises et les consommateurs, et signifie une distribution plus large des services et des solutions entre plusieurs fournisseurs.

Panne AWS

Le matin du 28 février 2017, les services d’Amazon S3, partie intégrante d’Amazon Web Services, ont commencé à s’écrouler. BuiltWith montre que plus de 600 000 sites Web comptent actuellement sur AWS pour alimenter leurs sites, leur stockage ou leurs services. Amazon Cloud a également été signalé comme ayant plus de 1 million de clients. Bien que cela puisse ne pas sembler très répandu dans l’ensemble de l’Internet, cela a eu un énorme effet d’entraînement sur le Web du fait que de nombreux services que nous utilisons tous au quotidien s’appuient sur Amazon S3.

Mise à jour du 3 mars 2017 – Amazon a publié un résumé au sujet de cette perturbation, qui était due à une erreur humaine.

Nous utilisons beaucoup de Saas chez Kinsta et nous l’avons remarqué pour la première fois lorsque Intercom, notre système d’assistance à la clientèle et de tickets a commencé à avoir des problèmes avec sa connectivité API, dont ils ont bientôt eu une annonce sur leur page d’état. Cela signifie que nous ne pouvions plus répondre aux demandes de nos clients. Pour mettre cela en perspective, Intercom alimente plus de 15 000 entreprises avec plus de 100 000 utilisateurs, puis leurs clients. Arrêter soudainement le chargement d’Intercom, c’est très important !

Pannes AWS S3
Pannes AWS S3

Ce qui est ironique ici, c’est que leur page d’état était aussi en retard sur quelques éléments/scripts, du fait qu’ils utilisaient StatusPage, qui s’appuie sur Amazon CloudFront. De nombreuses entreprises ont exactement la même configuration. Trello est un autre de ceux qui ont eu des problèmes avec AWS et aussi avec leur page de statut hors ligne. Nous pensons que c’est une bonne leçon que de ne pas utiliser les mêmes fournisseurs de cloud computing pour votre API ou vos services ainsi que pour votre page d’état. Avoir les deux qui s’effondrent soudainement va à l’encontre de l’objectif d’avoir une page d’état.

amazon web services

Peu de temps après cela, Amazon a publié un message sur la page d’état :

Nous continuons d’enregistrer des taux d’erreur élevés avec S3 dans la région US-EAST-1, ce qui a une incidence sur divers services AWS. Nous travaillons d’arrache-pied pour réparer S3, nous croyons comprendre la cause profonde et nous travaillons à la mise en œuvre de ce qui, à notre avis, remédiera au problème.

Ce qui est ironique ici, c’est qu’à part le petit message d’erreur qu’ils ont affiché ci-dessus, les autres indicateurs de service affichaient tous que tout fonctionnait normalement.

États Amazon S3
États Amazon S3

Ce qui s’est passé, c’est que la page d’état s’appuyait en fait sur le bon fonctionnement de l’AWS S3. Donc techniquement, AWS a cassé AWS, si vous pouvez le comprendre.

La panne de l’AWS S3 a touché des milliers de sites Web, de services, d’applications et d’API sur le Web. Beaucoup de nos clients ici chez Kinsta utilisent CloudFront ou ont des extensions qui chargent des ressources depuis Amazon S3. Nous avons remarqué que les sites WordPress commençaient à ne plus répondre en raison de ressources externes ne pouvant pas se charger, ce qui s’est traduit pour certains par des erreurs de passerelle 502. Nous utilisons Google Cloud Platform et nos serveurs étaient en parfait état, et pourtant la panne AWS a effectivement affecté nos clients. C’est quelque chose à garder à l’esprit pendant le choix d’un fournisseur CDN et du stockage d’objets tiers. Des intégrations externes peuvent faire tomber votre site et vous pouvez rencontrer les fameuses erreurs 502 Bad Gateway !

502 Bad Gateway
502 Bad Gateway
Temps d'arrêt de Trello
Temps d’arrêt de Trello

Nous utilisons également Trello ici à Kinsta et pour ceux d’entre nous aux Etats-Unis, nous ne pouvions plus accéder à nos cartes mais nous avons reçu un message disant que les serveurs Trello étaient en TLC. Et ironiquement, l’image du Taco dormant est cassée parce qu’il essaie de se charger depuis CloudFront. Lectures suggérées : Trello vs Asana.

D’autres sites populaires qui sont tombés en panne ou qui avaient des problèmes étaient Quora, Business Insider, Giphy, Hacker News, BaseCamp, Buffer, Imgur, Netlix, Docker, Github, Twitch, Adobe, HipChat, Flippa, Expedia, New Relic, PagerDuty, Pantheon, Sprout Social, Elastic, Citrix, Zendesk, Brightcloud, IFTTT, Heroku, Slack (partage de fichiers et GIF), Typeform, et beaucoup d’autres. Le plus ironique de tous est sans doute que « Is It Down Right Now ? » avait aussi du mal à rester opérationnel. Bien sûr, lorsque cela se produit, vous avez des gens qui se rendent sur Twitter pour faire part de leurs commentaires.

Et il y a des milliers d’autres commentaires. Bien que les mèmes et les tweets puissent être amusants, ce qui fait peur ici, c’est la part du marché du cloud computing qu’Amazon possède et l’effet qu’il a quand il tombe en panne. Vous n’avez vraiment qu’un couple qui se bat pour la part de marché. Selon une étude réalisée en 2017 par le Synergy Research Group, part de marché AWS détient un peu plus de 40% de l’espace de fournisseur de cloud computing. Microsoft Azure, Google et IBM se font concurrence à environ 20%. Et bien sûr, il y a des milliers d’autres petits fournisseurs qui se battent tous pour le reste.

.

Part de marché des fournisseurs de cloud computing
Part de marché des fournisseurs de cloud computing

Même si Google Cloud Platform ne détient qu’environ la moitié de la part de marché d’Amazon, nous sommes ravis de voir sa croissance de plus de 5%. Et nous aimerions voir plus de fournisseurs entrer dans l’espace car c’est une victoire pour tous ceux qui y participent. Répartir les services entre plusieurs fournisseurs pourrait résoudre certains de ces jours où l’on a l’impression que tout le Web est tombé en panne.

Il existe d’autres fournisseurs de Cloud Computing

Vous trouverez ci-dessous quelques autres fournisseurs de cloud computing que vous pouvez consulter pour la livraison de fichiers, les API et les applications. Nous ne disons pas qu’Amazon est mauvais, en fait ils ont normalement un très bon temps de fonctionnement. Mais beaucoup d’entreprises et de clients optent pour AWS parce que tout le monde semble les utiliser, ce qui n’est pas une bonne raison pour choisir un fournisseur de cloud computing. Après avoir vu ce qui s’est passé aujourd’hui, il serait sage de les distribuer. Par exemple, héberger les assets de votre site Web destiné au public chez un fournisseur et en utiliser un autre pour votre API. De cette façon, vous pouvez au moins intégrer une redondance simple pour que tout ne soit pas hors ligne.

De nombreux fournisseurs disposent également d’un support multi-régional ou d’une réplication interrégionale, dans laquelle vous devriez héberger vos applications critiques. Toutefois, il semble que de nombreuses entreprises n’utilisent pas ces fonctions. Cela peut être une configuration plus complexe, ce qui pourrait être une des raisons pour lesquelles ils ne profitent pas de cette configuration. Ou en raison du coût supplémentaire. Mais un plus grand nombre de fournisseurs de cloud computing sur le marché serait un moyen facile de forcer une distribution plus large des services entre plusieurs fournisseurs.

Google Cloud

Nous sommes bien sûr de grands fans de Google Cloud Platform, à la fois pour leur moteur de calcul et de stockage dans le cloud, car nous les utilisons pour alimenter tous nos sites WordPress. En fait, SADA Systems a récemment a interrogé plus de 200 responsables informatiques sur leur utilisation des services cloud publics, et a constaté que 49% préfèrent Google Cloud à Amazon.

Les responsables informatiques utilisent Google Cloud
Les responsables informatiques utilisent Google Cloud

Consultez notre article détaillé sur le top 7 des avantages de Google Cloud Platform. Bien entendu, vous avez également d’autres fournisseurs qui proposent également des capacités de calcul ainsi que des solutions de stockage :

Mises à jour supplémentaires d’Amazon S3

Les services Amazon S3 ont été restaurés depuis et tout est à nouveau opérationnel.
Voir les mises à jour d’état supplémentaires :

  • Mise à jour à 14h08 PM : A partir de 1:49 PM, nous avons entièrement récupéré les opérations d’ajout de nouveaux objets dans S3, qui était notre dernière opération montrant un taux d’erreur élevé. Le service Amazon S3 fonctionne normalement.
  • Mise à jour à 1h12 PM : La récupération, l’inscription et la suppression des objets S3 sont maintenant entièrement récupérées. Nous travaillons toujours à récupérer les opérations normales pour ajouter de nouveaux objets à S3.
  • Mise à jour à 12h52 PM : Nous constatons une récupération pour l’inscription et la suppression d’objets S3. Nous continuons à travailler sur la récupération pour ajouter de nouveaux objets à S3 et nous nous attendons à voir des taux d’erreur améliorés dans l’heure qui suit.

Résumé

Nous pensons que tout le monde peut tirer quelques leçons de ce qui s’est passé avec AWS. Il n’y a pas de fournisseur de cloud computing qui soit parfait, et c’est une des raisons pour lesquelles nous espérons voir plus de concurrence dans ce domaine. Il serait génial de voir un jour 10 fournisseurs ou plus se partager également la part de marché, car cela signifierait davantage de services distribués sur le Web. Si l’un d’eux tombait, nous n’aurions pas autant d’effet d’entraînement qu’aujourd’hui. Qu’en pensez-vous ? Pensez-vous que nous avons besoin de plus de fournisseurs de cloud computing ?

Brian Jackson

Brian a une grande passion pour WordPress, l'utilise depuis plus de dix ans et développe même quelques plugins de qualité. Brian aime les blogs, les films et les randonnées. Connectez avec Brian sur Twitter.