Nie będę się wdawał w techniczne detale, ponieważ wciąż są dla mnie niejasne. W każdym razie, usługi Amazonu Elastic Compute Cloud i Relational Database Service z odmówiły wczoraj posłuszeństwa na około 7 godzin. Takie wpadki się zdarzają nawet gigantom, czego dowodem były choćby problemy Gmaila. Jednak wczorajsze potknięcie Amazon zakończyło się wielkim hukiem. Razem z EC2 wykrzaczyła się między innymi Quora, Reddit, Foursquare,  Moby i Hootsuite. Pierwszy z serwisów, zadbał nawet o adnotację na stronie-zaślepce: “Wytykalibyśmy winnego palcami, ale nie osiągnęlibyśmy tego wszystkiego co nam się udało do tej pory, gdyby nie EC2″.

Skalowane, elastyczne rozwiązania hostingowe w chmurze  – takie jak EC2 – ułatwiły budowę wspomnianych serwisów, ale teraz okazują się być ich poważną słabością. Jako fan rozwiązań w chmurze, jestem na rozdrożu szukając adekwatnego komentarza, bo gdy kilka dużych serwisów na raz odmawia posłuszeństwa trudno nie zakwestionować koncepcji stojącej za EC2. Jedna awaria zdjęła z sieci ponad setkę serwisów, generując poważne straty, tak dla użytkowników jak i właścicieli.  Co gorsza, komunikacja ze strony Amazon zdecydowanie nie ułatwia szukania usprawiedliwień dla twórcy EC2.

Z drugiej strony, warto się zastanowić, czy podobne problemy w zbudowanej samodzielnie infrastrukturze byłyby dla dotkniętych awarią korzystniejsze?  Wybór EC2 podyktowało im poszukiwanie oszczędności, ponieważ tak stworzenie jak i utrzymanie koniecznej infrastruktury samodzielnie, byłoby bardziej kosztowne. Podobnie, zapewnienie bezpieczeństwa danych, które choć przez pewien czas niedostępne, wciąż były obecne na serwerach Amazon i ichniejszych backupach. Nie jestem w stanie ocenić, czy oszczędności usprawiedliwiają ryzyko takich wpadek, ale jestem daleki od sensacyjnych wniosków “Uciekajcie z Chmury! Amazon zabił internet”. ;)

Z mojego punktu widzenia, dopóki ceny outsourcingu infrastruktury są konkurencyjne w porównaniu do budowy, utrzymania i zabezpieczenia własnej po prostu musimy się do takich historii przyzwyczaić.

Spodobał Ci się tekst? Poleć znajomym:
  • Janek

    facebook tez padł

  • http://www.latacz.com mr_zola

    Myślę że z upływem czasu, ceny będą jeszcze bardziej konkurencyjne w stosunku do własnej architektury. Wszystko idzie w kierunku outsourcingu.

  • gszczepa

    Logiczną odpowiedzią jest rozpraszanie serwisów na kilku dostawców, tak aby w przypadku padu jednego spadała wydajność serwisu a nie następowało całkowite załamanie świadczenia usług.

    • mdrozdziel

      Padło raptem jedno DC Amazona. Tutaj problemem okazał się brak redundancji, nawet na poziomie jednego dostawcy. Amazon od dawna ewangelizuje budowanie systemów w różnych Zonach… (co daje im przy okazji dodatkowe $$$). Najgorzej wypadło Heroku, które jako platforma PaaS serwuje kolejne setki aplikacji, a nie może się pozbierać już prawie 24h.

    • http://www.facebook.com/pawel.subocz Pawel Subocz

      Dokładnie, amazon chyba nigdy nie obiecywał, że problemy na poziomie jednego DC się nie zdarzą?
      Rozproszenie serwisu między kilka serwerowni jest b. trudne, ale serwisy mogły się przygotować na szybkie przepięcie, to już jest stosunkowo proste.

  • Yossarian

    Mała errata:

    Oryginał:
    “We’ll be back shortly, we hope. Sorry – it sucks for us too. We’d point fingers, but we wouldn’t be where we are today without EC2.”

    Więc jego znaczenie jest zupełnie inne niż tłumaczy polskie tłumaczenie:
    “Nie chcemy wskazywać palcami, ale nie znajdowalibyśmy się tu gdzie się znajdujemy, gdyby nie EC2″.

    Na przyszłość: jeżeli tłumaczysz z języka angielskiego: tłumacz porządnie, albo wcale.
    Takie wpadki (złośliwy FUD? ignorancja?) obniżają wartość merytoryczną bloga.

    • mdrozdziel

      “Wytykalibyśmy winnego palcami, ale nie osiągnęlibyśmy tego wszystkiego co nam się udało do tej pory, gdyby nie EC2.”

      Z racji tego, że na Blogu naście razy wspomniana była obawa przed czytaniem książek po angielsku, to ja stawiam na brak znajomości języka po prostu… :P

    • https://www.facebook.com/gniewomir.swiechowski Gniewomir Świechowski

      Dzięki za korektę. Pospieszyłem się i przetłumaczyłem to czego się spodziewałem, a nie to co napisali. Naniosłem poprawki.

    • http://zaozi.blogspot.com/ saunterer

      Z ciekawości. Jakie Twoim zdaniem znaczenie powinno “tłumaczyć polskie tłumaczenie”?

    • Yossarian

      Touché, pisane na szybko, przepraszam :-)

  • http://blog.wilgucki.pl/ batman

    @gszczepa
    Microsoftowy Azure zapewnia, iż dla co najmniej 3 instancji aplikacji, jedna z nich znajduje się fizycznie w innym data center niż pozostałe. Oznacza to, że pad, jaki miał miejsce w Amazonie, w przypadku MS spowodowałby co najwyżej spowolnienie usługi. O ile rzeczywiście jest tak jak MS twierdzi. Amazon też obiecał, że padu nie będzie :)

  • http://www.facebook.com/kufel78 Paweł Kuflikowski

    A ja nie wiem co to EC2 i chętnie chociażby na końcu tekstu zobaczyłbym adnotację z wyjaśnieniem. Nie każdy kto czyta AW jest omnibusem w każdej dziedzinie tak jak autor tej notki.

    • sieciobywatel

      lmwtfy: EC2

  • http://www.facebook.com/suchodolski Jan Suchodolski

    Springpad też padł.

    • Borys

      I od wczoraj leży.

  • http://palikowski.net Krzysztof Palikowski

    z chmurą trochę jak z prądem, małe firemki kupują od elektrowni, wielkie koncerny budują sobie własne, bo w perspektywie 25 lat się im to opłaci, szpitale mają swoje generatory bo od tego zależy ludzkie życie itd itp.

    Budując cokolwiek trzeba zwrócić uwagę na projekt, materiały, dostawców, umowy SLA, koszty utrzymywania zapasowych/awaryjnych rozwiązań, wliczyć jakieś ryzyka itd.

    Chmura chmurze nierówna, każdy system składa się z wielu komponentów i część z nich można sobie wrzucić w chmurę, jednak nie rozwiązuje to od razu wszystkich problemów.

    • http://www.arnoldbuzdygan.com Arnold Buzdygan

      No tak, tylko, że przy “samemu” jest poważny problem z międzynarodowymi lokacjami.
      Uruchamiam teraz taki “międzynarodowy” (przynajmniej w założeniach) serwis i jeśli się przyjmie to pojawi się właśnie problem przepustowości łączy. :(

  • Matt Rutkowsky

    Goole App Engine czy Goole Storage for developers tez pada. Nie raz dostalismy po uszach jak komus system nie dzialal i jakis dzial firmy stanal na pare, parenascie godzin. Moglismy jedynie swiecic oczami przed klientem.

  • http://www.saveup.pl Arek Skuza

    SaveUp.pl też leżał z powodu chmury Amazona. Jednak mieliśmy własną, zapasową maszynę na której udało się wystartować odchudzony serwis.

  • Łukasz

    Padł też hosting jednej z baz NoSQL’owej http://www.mongohq.com (też amazon), z której korzysta moja i z pewnością inne firmy, więc podejrzewam, że skutki awarii EC2 są jeszcze bardziej rozległe…

  • Artur

    Dodatkowe niebezpieczeństwo z EC2 jest takie, że większość serwisów z nich korzystających jest mocno z nim zintegrowane. To nie tylko zwykły hosting, ale też skrypty do tworzenia instancji automatycznie odpalane dla danego loadu, software pisany pod serwisy amazona (EBS, S3). Przy awarii nie da się tak po prostu przenieść serwisu do innej firmy, technologie są amazonowe, a nie uniksowe/windowsowe. Jak widać chmury to mocny “vendor lock-in”.

    Do tego jak już coś się stanie, to możemy długo poczekać na reakcję supportu takiego giganta (kimże jesteśmy w obliczu takiej potęgi?).

    Wg mnie najlepsze są ciągle mniejsze firmy hostingowe gdzie chodzi normalny Linux – nie ma problemu z ewentualnym przeniesieniem się gdzie indziej, i nie zostaniemy tak łatwo olani.

    • Anonim

      Ależ stek bzdur. Lepsze są mniejsze firmy bo co? To są normalne wirtualki. Nikt Ci nie każde używać API, jak nie chcesz sie lockować.

    • Artur

      Jak nie chcesz używać Api, to po co Ci Amazon? Dużo taniej i lepiej będziesz miał na zwykłym hostingu. Transfer na EC2 jest 5-krotnie droższy niż w normalnych hostinach (np. ovh).

    • Artur

      A mniejsze firmy są lepsze, bo mają “indywidualne podejście do klienta”. Im samym będzie na Tobie zależało i pomogą Ci dużo ponad formalną umowę.

  • Pingback: Na szali jest życie pacjentów, ale ich fotki są bezpieczne. Awaria chmury Amazonu inaczej

  • Pingback: mBank leży? – awaria jednego z ważniejszych biznesów internetowych w Polsce

  • Pingback: Przestój w dostawie prądu i znowu chmura leży, tym razem chmura Microsoftu – warto korzystać z SaaS?