top of page

AWS-Ausfall: Warum eine einzige Störung die Welt lahmlegte

  • Oct 21, 2025
  • 3 min read
AWS Outage
Das zerbrechliche Rückgrat des Internets.

This Article Is Available In

 ENGLISH   -  GERMAN   -  FRENCH   -  ITALIAN   -  SPANISH 



Sie griffen nach Ihrer digitalen Brieftasche, um einen Kaffee zu bezahlen, und sie funktionierte nicht. Sie versuchten, an einem Videoanruf teilzunehmen, aber der Dienst war ausgefallen. Ihre intelligente Türklingel verstummte. Am Montag waren Sie damit für mehrere Stunden nicht allein, es betraf die ganze Welt. Ein massiver AWS-Ausfall breitete sich über den Globus aus, warf Arbeiter von London bis Tokio offline und legte beliebte Apps wie Snapchat, Venmo und sogar wichtige Flugliniensysteme lahm – ein Beweis dafür, wie fragil unser digitales Leben geworden ist.


Das Epizentrum dieses digitalen Erdbebens war ein einziges Rechenzentrum: Amazons Einrichtung US-EAST-1 in Virginia, die älteste und größte des Unternehmens. Es war nicht das erste Mal, dass dieser spezielle Standort weitreichende Probleme verursachte. Das Problem rührte von einem Fehler in dem, was im Grunde das Telefonbuch des Internets ist, dem Domain Name System (DNS). Ein fehlerhaftes Update machte es Anwendungen unmöglich, die Adresse für DynamoDB zu finden, eine kritische Datenbank, in der Benutzerinformationen gespeichert sind, was einen katastrophalen Dominoeffekt auslöste. Dieser einzelne AWS-Ausfall brachte Tausende von Diensten zum Erliegen.


Major Web Services Imapacted
Source: Techradar, Downdetector

Der Vorfall offenbart eine kritische Schwachstelle im Herzen der modernen Wirtschaft: eine tiefgreifende übermäßige Abhängigkeit von einer Handvoll Tech-Giganten. Amazon Web Services (AWS) ist der größte Cloud-Anbieter der Welt und kontrolliert fast ein Drittel des Marktes. Wenn es strauchelt, stolpert es nicht nur; es reißt einen erheblichen Teil des Internets mit sich. Diese Zentralisierung, so effizient sie auch sein mag, schafft einen „Single Point of Failure“. Experten warnen, dass viele Unternehmen in der Eile, online zu gehen, beim Aufbau der notwendigen Backups Abstriche gemacht haben.



Während anfängliche Befürchtungen sich auf Cyberangriffe richten könnten, bestätigte Amazon, dass die Ursache ein interner Fehler war. Der Fehler entstand in einem Subsystem, das für die Überwachung des Zustands seiner Netzwerk-Load-Balancer verantwortlich ist – den Verkehrspolizisten, die den Datenfluss verteilen. Dieser interne Schluckauf innerhalb von Amazons „Elastic Compute Cloud“ (EC2) reichte aus, um die Verbindung zu seiner vitalen Datenbank zu kappen, was 113 verschiedene AWS-Dienste beeinträchtigte und Millionen von Nutzern im Dunkeln ließ.


Largest Cloud Service Providers
Source: Statista, Synergy Research Group

Cybersecurity- und Informatikexperten zeigen nicht nur auf Amazon, sondern auch auf die Entwickler, die dessen Dienste nutzen. „Wenn Leute Kosten senken und Abstriche machen ... und vergessen, dass sie diesen letzten Schritt übersprungen haben ... sind diese Unternehmen diejenigen, die wirklich überprüft werden sollten“, erklärte Ken Birman, Professor an der Cornell University. AWS bietet Werkzeuge für „Fehlertoleranz“ – im Wesentlichen die Erstellung von Backups in verschiedenen Rechenzentren oder sogar bei anderen Cloud-Anbietern. Dieser AWS-Ausfall dient als kostspielige Erinnerung daran, dass der Aufbau von Resilienz kein optionales Extra ist; es ist eine fundamentale Notwendigkeit.


Amazon stellte schließlich den Normalbetrieb wieder her, aber die Erholung erfolgte nicht sofort. Das Unternehmen meldete einen „Rückstau von Nachrichten“, dessen Verarbeitung Stunden dauern würde, was bedeutete, dass einige Dienste noch lange nach der Entwarnung Verzögerungen aufwiesen. Für große Unternehmen bedeuten diese Stunden Ausfallzeit direkt Millionen von Dollar an verloren gegangener Produktivität und Einnahmen – ein hoher Preis für eine einzelne technische Störung.


CRUX

Die tiefe Abhängigkeit der Weltwirtschaft von einigen wenigen zentralisierten Cloud-Anbietern wie AWS hat eine fragile Infrastruktur geschaffen, in der ein einzelner technischer Fehler einen weltweiten digitalen Stillstand auslösen kann.


Wahre digitale Resilienz baut nicht auf einem Fundament, sondern auf vielen.


Source Files

 
 
bottom of page