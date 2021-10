Jedni uważali, że to apokalipsa, innych to nie obchodziło zupełnie, a jeszcze inni świętowali. Internet zelektryzowała wczorajsza masowa awaria w Facebook. Nie dotyczyła ona tylko centralnego serwisu społecznościowego: pamiętajmy, że to także inne usługi - komunikatory i serwisy społecznościowe.

Zakres awarii Facebooka był znacznie szerszy niż nam się wydaje. Okazało się, że poza tym co widzimy - a zatem usługami, przestały "odzywać się" także wewnętrzne narzędzia pracowników Facebooka. Ci nie mogli korzystać z komunikatora pracowniczego, niemożliwe było przejrzenie wewnętrznych dokumentów, a nawet wejście do budynków - przestały bowiem działać karty dostępowe oraz systemy bezpieczeństwa w strzeżonych częściach biur i centrach danych. Deweloperzy nie byli w stanie skorzystać z usług online, by wypuszczać nowe kompilacje poszczególnych modułów.

Około 17:40 czasu polskiego, użytkownicy zaczęli odczuwać problemy z funkcjonowaniem Facebooka, Messengera, WhatsAppa oraz Oculusa. Wszystko "stanęło" właściwie natychmiast, bez jakiejkolwiek możliwości użycia tych aplikacji. Właściwie w kilka minut wszystko to, co dla wielu ludzi jest definicją "okna na świat" zostało wyczyszczone z Internetu. Tak, jakby ktoś je po prostu usunął. Czy tak było?

Oczywiście nie. Okazuje się, że problemem było (tu prostsze wyjaśnienie) coś, co możemy nazwać "systemem pocztowym Internetu". Tak samo jak my mamy przypisane do nas adresy korespondencyjne, podobnie i w Internecie takowe się znajdują. Żeby się do nich dostać, trzeba wiedzieć jak to zrobić. Gdyby poczta nie wiedziała, gdzie się znajdujemy bo "zapomniałaby" jak wyglądają drogi dotarcia do nas z wykorzystaniem wewnętrznej infrastruktury, nie otrzymalibyśmy żadnej korespondencji. W dalszym ciągu istniejemy, ale nikt nie wie, w jaki sposób dotrzeć do naszego adresu.

I tak samo było z Facebookiem. BGP, czyli "border gateway protocol" jest właśnie taką usługą pocztową. Cloudflare wykrył dużą liczbę zmian w tym protokole po stronie Facebooka, przede wszystkim wycofania tras do systemów autonomicznych giganta. Jaśniej: tuż przed awarią zostały wycofane rekordy DNS, które mówią urządzeniom w Internecie jak dostać się do adresów: Facebook.com, czy Instagram.com. Facebook samodzielnie kontroluje swoje rekordy DNS, więc awaria mogła być spowodowana ich aktualizacją, która została po prostu poszła źle z powodu błędu. Wszystko to doprowadziło do reakcji łańcuchowej, która w efekcie położyła wszystkie serwisy.

Santosh Janardhan, zarządzający pionem infrastruktury napisał na Facebook Engineering artykuł tłumaczący powody wczorajszej awarii:

Zmiany konfiguracyjne na routerach szkieletowych, które koordynują ruch sieciowy między naszymi centrami danych spowodowały problemy, które przerwały komunikację między nimi. To zakłócenie ruchu sieciowego wywołało efekt domina w sposobie porozumiewania się naszych centrów danych, powodując zatrzymanie działania naszych usług.

Skutki awarii Facebooka były naprawdę poważne

Ci, którzy używają Facebooka jedynie do tego, by konsumować na nim treści, mogli jedynie przeżyć krótki zespół odstawienia serwisu społecznościowego. Nic strasznego. Te osoby jednak, które mają chleb dzięki temu, że istnieje Facebook - czyli wszelkiej maści marketingowcy, pracownicy mediów, zarządzający profilami sklepów, marek, influencerzy i wielu, wielu innych miało naprawdę ciemno przed oczami w momencie, gdy okazało się że Facebooka nie ma. 6-godzinny przestój w pracy najprawdopodobniej nie spowodował ogromnych strat wśród tych ludzi, ale za to kapitalizacja Facebooka trochę spadła: spółka zanotowała blisko pięcioprocentowy spadek.

Świat absolutnie się przez to nie zatrzymał, część przeniosła się na Twittera, inni polecali alternatywne komunikatory - między innymi Signala, Telegrama, Vibera i wiele, wiele innych. Nawet sam Twitter przez to, że Facebook "padł", miał pewne problemy - ogromna liczba aktywnych użytkowników spowodowała trudności w działaniu infrastruktury konkurenta Facebooka. Uaktywnił się nawet profil doskonałego serwisu Albicla, który zapraszał do siebie i próbował coś sobie uszczknąć z tortu przygotowanego na okazję chwilowej "śmierci" Facebooka. Tyle, że jak Facebook w styczniu działał świetnie, a oni się rodzili, to rozwój serwisu Albicla można było wyrazić w jednostce pp/m (profilach papieża na minutę). Nie mówię o koszmarnych błędach.

Wielu wysokich rangą pracowników Facebooka publikowało przeprosiny w związku z awaria. Po 6 godzinach Facebook powrócił do Internetu, ale niektórzy użytkownicy w pełni mogli cieszyć się serwisami do niego należącymi dopiero po dłuższym czasie. Są też tacy, którzy trudności z dostaniem się do aplikacji, stron mają do dziś. Aktualizacja rekordów może odrobinę trwać. Świat się nie zatrzymał. Wygląda na to, że możemy żyć bez Facebooka.