W ostatnim czasie mieliśmy do czynienia z poważną awarią chmury należącej do Amazon - usterka spowodowała niedostępność lub nieprawidłowe działanie wielu popularnych stron w internecie. Mówiło się o tym, że w wyniku awarii wyłączono "pół internetu", wcale nie było tak źle. Niemniej, warto dodać, że problem dotyczył bardzo obleganych usług, m. in. iCloud, Slacka, a nawet IsItDownRightNow.
Nieprawidłowe działanie chmury Amazon S3 utrzymywało się przez ponad 3 godziny, co skutecznie utrudniło pracę niektórych firmom. Usługodawca już teraz zapowiedział, że jeżeli tego typu usterki pojawią się w przyszłości, czas ich naprawienia zostanie znacząco zmniejszony. Rzeczywiście, ponad 3 godziny oczekiwania na przywrócenie porządku to całkiem sporo. Ale nie to jest w tej sytuacji "najśmieszniejsze". Otóż, to awarii przyczyniła się literówka.
Amazon podaje, że do awarii S3 doszło w wyniku wprowadzenia nieprawidłowej komendy przez jednego z pracowników. W wyniku niewielkiej pomyłki, usunięto większą część serwerów, niż zakładano w trakcie prac konserwacyjnych w ramach S3. Tłumaczenie Amazonu powinno rozpocząć burzę pytań - jak weryfikowane są operacje wprowadzane przez pracowników i czy nie ma procedur, które pozwalają na szybkie powstrzymanie dalszych niekorzystnych zmian w wyniku podobnych błędów.
Literówka? To zdarza się każdemu
Konia z rzędem, tankowiec dobrego trunku i dożywotni zapas krówek temu, komu nie zdarzyła się w życiu żadna literówka. Pierwotnie, tytuł tego artykułu miał brzmieć: "Narzekacie na literówki na Antywebie, a w Amazon taki błąd wyłączył część internetu". Powiedzmy, że był za długi. Ale do czego zmierzam? Literówka to nic złego - jak pokazuje praktyka i nie chodzi mi tutaj tylko o AW, ale również inne tytuły prasowe, również za granicą, to się zdarza. Ba, w każdej pracy zdarzają się niewielkie pomyłki, które mogą ważyć na fiasku całej operacji, projektu, czy nawet większego przedsięwzięcia. Spytajcie się księgowych, co może oznaczać o jedno zero za dużo, albo niewielki błąd w obliczeniach. Można również podpytać lekarza, ile może znaczyć pomyłka w ilości substancji czynnej na recepcie dla pacjenta.
Niektóre błędy można jednak w prosty sposób naprawić. Te, które pojawiają się u nas (nie usprawiedliwiamy się i nie bagatelizujemy, mimo prowadzonych przez nas działań, godzimy się z tym, że nie uda nam się ich wyeliminować do końca) możemy edytować, przeprosić i żyć z tym dalej. Co innego lekarz, czy... pracownik Amazonu. Odrobinę zdziwiło mnie to, że w tak dużej firmie doszło do tak poważnej usterki tylko z powodu jednej literówki, ale jestem w stanie to zrozumieć. Największe wpadki zaczynały się od bardzo niewinnych pomyłek, które potem urastały do rangi niesamowitych tragedii. :)
Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu