Für einige von uns wird der 28. Februar 2017 als der Tag in Erinnerung bleiben, an dem gefühlt das halbe Internet wegen eines großen AWS-Ausfalls ausfiel. Es fühlte sich vage vertraut an mit dem DNS Doomsday im Oktober 2016. Selbst diejenigen, die AWS nicht nutzen, bekamen die Auswirkungen zu spüren, als Skripte, Abhängigkeiten und CDN-Ressourcen im gesamten Web ausfielen und Tausende von Webseiten, APIs und Apps zum Stillstand brachten. Dies ist eine sehr wichtige Erinnerung daran, warum das Web mehr Cloud-Computing-Anbieter für die Speicherung und Bereitstellung benötigt. Große Unternehmen nutzen nicht einmal die Vorteile der regionsübergreifenden Replikation. Ein gesunder Wettbewerb in diesem Bereich ist immer eine gute Sache, da es die Kosten für Unternehmen und Verbraucher senkt und eine breitere Verteilung von Services und Lösungen über mehrere Anbieter bedeutet.

AWS-Ausfall

Am Morgen des 28. Februar 2017 fielen Dienste von Amazon S3, einem Teil der Amazon Web Services, aus. BuiltWith zeigt, dass über 600.000 Webseiten derzeit auf AWS vertrauen, um ihre Webseiten, Speicher oder Dienste zu betreiben. Es wurde auch berichtet, dass Amazon Cloud über 1 Million Kunden hat. Während das im Rahmen des gesamten Internets nicht einmal wie so viele erscheinen mag, hatte es einen riesigen Welleneffekt im gesamten Web aufgrund der Tatsache, dass viele Dienste, die wir alle täglich nutzen, auf Amazon S3 angewiesen sind.

Update 3. März 2017 – Amazon hat eine Zusammenfassung über die Störung veröffentlicht, die auf menschliches Versagen zurückzuführen ist.

Wir verwenden viele SaaS-Produkte bei Kinsta und wir haben dies hier zum ersten Mal bemerkt, als Intercom, unser Kunden-Support- und Ticketing-System, anfing, Probleme mit ihrer API-Konnektivität zu haben, wovon sie bald eine Ankündigung auf ihrer Status-Seite hatten. Das bedeutet, dass wir keine Tickets mehr für unsere Kunden beantworten konnten. Um dies in die richtige Perspektive zu rücken: Intercom versorgt über 15.000 Unternehmen mit über 100.000 Nutzern, und dann noch deren Kunden. Dass Intercom plötzlich aufhört zu laden, ist eine sehr große Sache!

intercom system status
AWS S3-Ausfälle

Die Ironie dabei ist, dass ihre Statusseite auch bei einigen Elementen/Skripten ausfiel, was darauf zurückzuführen ist, dass sie StatusPage verwenden, das auf Amazon CloudFront angewiesen ist. Viele Unternehmen haben genau das gleiche Setup. Trello ist ein weiteres Unternehmen, das Probleme mit AWS hatte und dessen Statusseite ebenfalls offline ging. Wir denken, dass dies eine gute Lektion ist, nicht dieselben Cloud Computing-Anbieter sowohl für Ihre API oder Dienste als auch für die Status-Seite zu verwenden. Wenn beide plötzlich ausfallen, wird der Zweck einer Statusseite zunichte gemacht.

amazon web services

Amazon hat kurz darauf eine Nachricht auf seiner Statusseite veröffentlicht:

Wir erleben weiterhin hohe Fehlerraten mit S3 in US-EAST-1, was sich auf verschiedene AWS-Services auswirkt. Wir arbeiten intensiv an der Reparatur von S3, glauben, dass wir die Grundursache verstehen und arbeiten an der Implementierung dessen, was wir glauben, um das Problem zu beheben.

Der ironische Teil hier ist, dass außer der kleinen Fehlermeldung oben, die sie gepostet haben, der Rest der Service-Indikatoren alle zeigten, dass alles normal funktioniert.

amazon s3 status fine
Amazon S3 status fine

Was passiert ist, war, dass die Statusseite sich darauf verlassen hat, dass AWS S3 richtig funktioniert. Technisch gesehen hat AWS also AWS kaputt gemacht, wenn du dir das vorstellen kannst.

Der Ausfall von AWS S3 hat Tausende von Webseiten, Diensten, Apps und APIs im Internet betroffen. Viele unserer Kunden hier bei Kinsta nutzen CloudFront oder haben Plugins, die Ressourcen von Amazon S3 laden. Wir haben festgestellt, dass WordPress Seiten einen Timeout hatten, weil externe Ressourcen nicht geladen werden konnten, was bei einigen als 502 bad gateway error erschien. Wir nutzen die Google Cloud Platform und mit unseren Servern war alles in Ordnung, aber der AWS-Ausfall hat unsere Kunden tatsächlich betroffen. Das ist etwas, was du im Hinterkopf behalten solltest, wenn du einen CDN-Anbieter und Objektspeicher von Drittanbietern wählst. Externe Integrationen können deine Webseite zum Absturz bringen und du kannst den berühmten 502 bad gateway error erhalten!

amazon s3 file script
502 bad gateway
trello downtime
Trello Ausfallzeit

Wir nutzen auch Trello hier bei Kinsta und für diejenigen von uns in den USA konnten wir nicht mehr auf unsere Boards zugreifen, aber wir wurden mit einer Nachricht konfrontiert, die besagt, dass die Trello-Server etwas TLC bekommen. Und ironischerweise ist das Sleep Taco Bild kaputt, weil es versucht, von CloudFront zu laden. Empfohlene Lektüre: Trello vs. Asana.

Einige andere beliebte Webseiten, die entweder ausgefallen sind oder Probleme hatten, waren Quora, Business Insider, Giphy, Hacker News, BaseCamp, Buffer, Imgur, Netlix, Docker, Github, Twitch, Adobe, HipChat, Flippa, Expedia, New Relic, PagerDuty, Pantheon, Sprout Social, Elastic, Citrix, Zendesk, Brightcloud, IFTTT, Heroku, Slack (Filesharing und GIFs), Typeform und viele andere. Das vielleicht ironischste von allen ist, dass „Is It Down Right Now?“ auch Probleme hatte, oben zu bleiben. Wann immer so etwas passiert, stürzen sich die Leute natürlich auf Twitter, um ihr Feedback zu geben.

Und es gibt noch Tausende mehr, wo das herkommt. Während Memes und Tweets lustig sein können, ist der beängstigende Teil hier wirklich, wie viel des Cloud Computing Marktes Amazon kontrolliert und wie viel Einfluss es hat, wenn es ausfällt. Du hast wirklich nur ein paar, die es um den Marktanteil ausfechten. Laut einer Studie der Synergy Research Group aus dem Jahr 2017 macht der Marktanteil von AWS etwas mehr als 40% des Cloud Computing-Anbieters aus. Dann gibt es noch Microsoft Azure, Google und IBM, die um die 20% konkurrieren. Und natürlich gibt es tausende andere kleinere Anbieter, die alle um den Rest kämpfen.

cloud computing providers market-share
Marktanteil der Cloud Computing Anbieter

Auch wenn die Google Cloud Platform nur etwa die Hälfte des Marktanteils von Amazon hat, freuen wir uns über das Wachstum von über 5%. Und wir würden uns freuen, wenn noch mehr Anbieter in diesen Bereich einsteigen würden, da es für alle Beteiligten ein Gewinn ist. Die Verteilung von Diensten auf mehrere Anbieter könnte einige dieser Tage lösen, an denen es sich anfühlt, als ob das gesamte Web zusammengebrochen ist.

Es gibt alternative Cloud Computing-Anbieter

Im Folgenden findest du ein paar alternative Cloud Computing Anbieter, die du dir für die Bereitstellung von Dateien, APIs und Apps anschauen solltest. Wir sagen nicht, dass Amazon schlecht ist, in der Tat haben sie normalerweise eine großartige Betriebszeit. Aber viele Unternehmen und Kunden entscheiden sich für AWS, weil alle anderen sie zu nutzen scheinen, was kein guter Grund ist, einen Cloud-Anbieter zu wählen. Nachdem wir gesehen haben, was passiert ist, könnte es klug sein, sie zu verteilen. Zum Beispiel, indem du die Assets deiner öffentlichen Webseite bei einem Anbieter hostest und einen anderen für deine API verwendest. Auf diese Weise kannst du zumindest eine einfache Redundanz einbauen, damit nicht alles offline geht.

Viele Provider haben auch einen multiregionalen Support oder eine regionsübergreifende Replikation, in der du deine kritischen Anwendungen hosten solltest. Allerdings scheint es, dass viele Unternehmen diese Features nicht nutzen. Dies kann eine komplexere Einrichtung sein, was ein Grund dafür sein könnte, dass sie diese Konfiguration nicht nutzen. Oder es liegt an den zusätzlichen Kosten. Aber mehr Cloud-Anbieter auf dem Markt wären einfach ein einfacher Weg, um eine breitere Verteilung der Dienste über mehrere Anbieter zu erzwingen.

Google Cloud

Wir sind natürlich große Fans der Google Cloud Platform, sowohl für ihre Compute Engine als auch für ihren Cloud-Speicher, da wir sie nutzen, um all unsere Webseiten mit WordPress zu betreiben. Tatsächlich hat SADA Systems kürzlich 200+ IT-Manager zu ihrer Nutzung von Public Cloud Services befragt und herausgefunden, dass 49% Google Cloud gegenüber Amazon bevorzugen.

it managers use google cloud
IT-Manager nutzen Google Cloud

Schau dir unseren ausführlichen Beitrag über die Top 7 Vorteile der Google Cloud Platform an. Natürlich gibt es auch andere Anbieter, die neben Speicherlösungen auch Computing-Funktionen anbieten:

Zusätzliche Updates von Amazon S3

Die Amazon S3 Dienste wurden inzwischen wiederhergestellt und alles ist wieder betriebsbereit. Siehe die zusätzlichen Status-Updates:

  • Update um 14:08 Uhr PST: Mit Stand von 13:49 PM PST sind die Operationen zum Hinzufügen neuer Objekte in S3, die unsere letzte Operation mit einer hohen Fehlerrate war, vollständig wiederhergestellt. Der Amazon S3 Service arbeitet normal.
  • Update um 1:12 PM PST: Das Abrufen, Auflisten und Löschen von S3-Objekten ist nun vollständig wiederhergestellt. Wir arbeiten immer noch daran, den normalen Betrieb für das Hinzufügen neuer Objekte zu S3 wiederherzustellen.
  • Update um 12:52 PM PST: Wir sehen eine Wiederherstellung für S3 Objektabrufe, Auflistungen und Löschungen. Wir arbeiten weiterhin an der Wiederherstellung des Hinzufügens neuer Objekte zu S3 und erwarten, dass sich die Fehlerrate innerhalb einer Stunde verbessert.

Zusammenfassung

Wir denken, dass jeder ein paar Lektionen aus den Ereignissen mit AWS mitnehmen kann. Es gibt keinen Cloud-Anbieter, der perfekt ist, und das ist eher ein Grund, warum wir hoffen, mehr Wettbewerb in diesem Bereich zu sehen. Es wäre toll, wenn wir eines Tages 10 oder mehr Anbieter sehen würden, die sich den Marktanteil gleichmäßig aufteilen, denn das würde mehr verteilte Dienste über das Internet bedeuten. Wenn einer ausfallen würde, würden wir nicht so einen großen Welleneffekt spüren, wie wir es heute tun. Was sind deine Gedanken? Glaubst du, wir brauchen mehr Cloud Computing Anbieter in diesem Bereich?

Brian Jackson

Brian hat eine große Leidenschaft für WordPress, verwendet es seit über einem Jahrzehnt und entwickelt sogar einige Premium-Plugins. Brian liebt Blogging, Filme und Wandern. Verbinde dich mit Brian auf Twitter.