Internet

Ludzie którzy przechowują Internet, czyli Wayback Machine w pigułce

Patryk Koncewicz
Ludzie którzy przechowują Internet, czyli Wayback Machine w pigułce
3

Podróże w czasie są niemożliwe? Bzdura! Wayback Machine zabierze Cię do miejsca, w którym Twoja ulubiona strona internetowa zaczynała dopiero raczkować

Zarchiwizować Internet. Brzmi niedorzecznie? Trochę tak, wszakże jest o miejsce, które z sekundy na sekundę powiększa się o tony nowych treści. Istnieje jednak grupa ludzi, wyróżniających się szczególnie ważną misją dla cyfrowego społeczeństwa, którego wszyscy jesteśmy częścią. Mowa o członkach zespołu tworzącego Internet Archive, pasjonatach próbujących uchować Internet od zapomnienia.

Cyfrowa Biblioteka Aleksandryjska

Historia Internet Archive sięga 1996 roku, kiedy to ojciec usługi, Brewster Kahle, poczuł się zobowiązany do stworzenia swego rodzaju biblioteki przyszłości. Od wieków ludzie zajmowali się katalogowanie zbiorów dziedzictwa kulturowego, tworząc księgozbiory i muzea. To, co niegdyś wymagało ogromnych nakładów pracy i środków, dziś może odbywać się z poziomu strony internetowej.

„Większość społeczeństw przywiązuje dużą wagę do przechowywania śladów swojego dziedzictwa kulturowego. Bez takich śladów cywilizacja nie ma pamięci i mechanizmu, który pozwala uczyć się na dawnych błędach i sukcesach. Współczesna kultura produkuje obecnie coraz więcej i więcej śladów w postaci elektronicznej. Naszą misją jest pomóc zachować te ślady i utworzyć bibliotekę internetową dla badaczy, historyków i w celach edukacyjnych”

Internet Archive powstało jako organizacja non-profit zajmująca się gromadzeniem cyfrowych dóbr kultury. W październiku 1996 roku rozpoczęto archiwizację i przechowywanie sieci WWW w dużych ilościach. Dziś Internet Archive możemy nazwać cyfrową biblioteką wiedzy wszelakiej. W ramach inicjatywy archiwizowane są nie tyle strony internetowe, ale także obrazy, wideo, muzyka, podcasty czy programy komputerowe. W maju tego roku sumaryczna liczba samych witryn wyniosła aż 682 miliardy. Nie zawsze były one jednak dostępne publicznie. Internet Archive na dobre rozwinęło skrzydła pięć lat po uruchomieniu, kiedy do życia powołano Wayback Machine.

Oprogramowanie do podróży w czasie

Czy kiedykolwiek marzyliście o tym, żeby choć na chwilę przenieść się do przeszłości? Głupie pytanie, każdy o tym marzył! Co prawda dzięki Wayback Machine nie cofniecie się do 2009 roku, żeby kupić trochę Bitcoina, ale za to możecie sprawdzić,  jak wyglądała dana strona internetowa przed laty. Wayback Machine to cyfrowe archiwum należące do Internet Archive. Crawlery – zwane też pająkami czy pełzaczami – to oprogramowanie zbierające informacje o strukturze i treści stron internetowych. Roboty archiwizują kod HTML, a obrazy pobierane są ze stron źródłowych. Dzięki temu połączeniu otrzymujemy snapshoty, czyli zrzut danych zapewniający dostęp do starszej wersji danej witryny.

Samo użytkowanie Wayback Machine jest banalnie proste. Wystarczy po wejściu na dedykowaną stronę wpisać adres URL w oknie wyszukiwania i gotowe. Zostaniemy przeniesieni do kalendarza z kolorowymi kropkami. Kolory informują o statusie przechowywanego zbioru:

Źródło: Marcin Wilkowski, Wayback Machine - podstawy wykorzystania

Po kliknięciu danej daty ukażą się snapshoty, które zawierają w sobie archiwalną wersję witryny. Dla przykładu cofnijmy się o 10 lat i zobaczmy jak wyglądał Antyweb dekadę temu.

 

Narzędzie jest przydatne nie tylko pod kątem archiwizowania dziedzictwa cyfrowej kultury, ale także w kwestii badania zmieniających się trendów wizualnych i technicznych. Dzięki Wayback Machine przedsiębiorstwa mogą analizować rozwój swoich cyfrowych wizytówek, a dla naukowców jest to ogromna skarbnica wiedzy i obiekt setek przeprowadzonych badań.

Wbrew powszechnej opinii oprogramowanie nie indeksuje jednak całego Internetu. Istnieją bowiem prywatne bazy lub materiały o dostępnie ograniczonym przez wydawców, do których crawlery nie mają dostępu. Pomimo to rozmiar zarchiwizowanych treści przyprawia o ból głowy. Samo Wayback Machine to zbiór ponad 57 petabajtów, czyli przeszło 57 milionów gigabajtów. Z danych na 2021 rok wynika, że całość zbiorów Internet Archive szacowana jest na 212 petabajtów. Przyznacie, że sporo?

Internet Archive i Wayback Machine powstały w celu propagowania otwartego dostępu do treści. Co jednak z osobami, które nie mają dostępu do Internetu? Cóż, o tym także pomyślano. Offline Archive to jeden z pobocznych projektów realizowanych przez amerykańskie archiwum, dzięki któremu dostęp do historycznych treści mogą uzyskać także osoby bez dostępu do sieci. Dane z internetowej bazy są przesyłane do serwera znajdującego się poza siecią, a następnie mogą być kopiowane na nośnikach danych takich jak dyski zewnętrzne czy karty SD.

Źródło: Depositphotos

Poza niewątpliwymi korzyściami naukowymi Wayback Machine jest po prostu świetną ciekawostką. Możliwość ponownego zajrzenia na strony, które wizualnie lub technicznie nigdy już nie powrócą, wywołuje potężne dawki nostalgii. Dzięki niemu możemy całkiem dosłownie cofnąć się w czasie do momentów, w których Internet był zupełnie innym miejscem. Polecam samodzielnie wypróbować pod tym adresem. Dajcie znać w komentarzach, której strony brakuje wam najbardziej. Wayback Machine jej nie przywróci, ale choć na chwilę przywoła miłe wspomnienia.

Stock image from Depositphotos

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu