13

Książki w formacie DjVu i Mac – macOS na sterydach cz. 6

Nie samą technologią człowiek żyje. Jeśli jednym z waszych zainteresowań, oprócz smartfonowo-komputerowego świata, jest historia, mogliście się natknąć na odsyłacze prowadzące do plików o tajemniczym rozszerzeniu .djvu. Jeśli poszukujecie wartościowych materiałów z tej dziedziny, to właśnie pośród plików tego typu znajdziecie ich najwięcej, ponieważ największą popularność zdobył wśród bibliotecznych archiwistów.

Co to jest DjVu?

W czasach kiedy PDF był płatnym i wymagającym zdobycia licencji od Adobe formatem, to właśnie DJVU pełniło rolę najlepszego nośnika dla dokumentów elektronicznych opartych na skanach. Siłą formatu jest skomplikowana segmentacja obrazu, pozwalająca zapisywać poszczególne elementy skanu z różną rozdzielczością i siłą kompresji. Dzięki temu pliki są niewielkie, a jednocześnie ładują się bardzo szybko. Ważną cechą jest też możliwość dodawania warstwy z tekstem rozpoznanym przez oprogramowanie typu OCR, powiązanym z treścią na skanie.

Format opracowano w latach 1996 – 1999 w firmie AT&T i szybko został zaadoptowany przez dużą część bibliotek czy klasycznych archiwów. Także nowoczesne repozytoria cyfrowe w typie Internet Archive używały go dla swoich potrzeb. Pomimo że od czasu „uwolnienia” formatu PDF w 2008 r. to właśnie on, przez swoją uniwersalność, stał się dominującym standardem, to w „konserwatywnych” organizacjach, do dziś publikuje się sporo rzeczy właśnie w DjVu. W tym formacie dostępna jest też ciągle większość dokumentów znajdujących się na stronach polskich bibliotek cyfrowych.

Jak czytać książki .djvu na Macu?

Jeszcze parę lat temu sytuacja na macOS nie była zbyt kolorowa. Do wyboru mieliśmy obsługę z poziomu niektórych przeglądarek przy pomocy fatalnych plug-inów. Przeglądanie w tej formie, niezależnie od przeglądarki, było bardzo powolne, trapione bugami, a plug-iny nie oferowały zbyt wielu funkcji pomocniczych.

Nie wiele lepiej było z programami, większość z nich była kiepskiej jakości javowymi portami, które funkcjonalnie były bogatsze, ale działały chyba jeszcze wolniej i mniej stabilnie. Do tego przy każdym updacie systemu istniała obawa, że taki program może przestać działać.

Na szczęście w ciągu ostatnich lat sytuacja mocno się poprawiła. Większość bibliotek ma dziś własne mechanizmy wyświetlania DjVu zbudowane w HTML5, które pozwalają na w miarę szybkie i komfortowe czytanie. Pewnym problemem jest to, że od czasu do czasu trafią się książki, które mają coś namieszane w strukturze segmentów i nieraz wymagają odświeżenia przeglądarki, żeby kolejna strona załadowała się poprawnie. Jeśli takie przeglądanie on-line wam odpowiada, powinniście tylko pamiętać, że te przeglądarki lepiej działają w Chrome, niż w Safari.

Programy? Nie jest dobrze…

Jeśli jednak zależy nam na stworzeniu własnego, podręcznego archiwum książek, czytanie przez przeglądarkę nie będzie możliwe. Javowe plug-iny zostały z nich usunięte jakiś czas temu i wrzucenie pliku w okno przeglądarki nic nie da. Trzeba będzie się w takim wypadku posiłkować programami zewnętrznymi.

Tych niestety jest niewiele, a i tak wśród nich większość jest po prostu kiepska. Ponieważ korzystam z tego DjVu bardzo intensywnie, sprawdziłem chyba wszystkie dostępne aplikacje do ich obsługi. Poniżej przedstawiam wam dwie aplikacje, które są warte waszej uwagi.

DjVu Reader Pro

Moim podstawowym narzędziem jest DjVu Reader Pro, płatny program, który znajdziemy w Mac App Store. Aktualnie kosztuje 18,99 zł i jest natywną makową aplikacją o klasycznym, estetycznym i czytelnym interfejsie. Działa szybko, pozwala na eksport dokumentów do formatu PDF i TXT.

Co bardzo ważne, wygląda na to, że jest ciągle rozwijany. Ostatnia aktualizacji miała miejsce 4 miesiące temu, program uruchamia się tak w Mojave, jak i Big Sur. Jest więc nadzieja, że zostanie natywnie przepisany na procesory serii M.

DjView

Drugim programem jest najpopularniejsze niegdyś narzędzie typu open source, czyli DjView. Tu ważna uwaga, najnowsza wersja 4.12 nie działa ani na Mojave, ani Big Sur, więc chcąc go używać, musicie ściągnąć starszą wersję 4.10.6-qt57c.

Program jest darmowy i znajdziecie go na stronie sourceforge.net. Jest on co prawda, jak to w przypadku międzyplatformowych aplikacji, podobnie toporny jak np. LibreOffice, ale ma jedną cechę, która czyni go niezbędnym w arsenale doświadczonego czytelnika, potrafi zapisać pliki DjVu.

Pięćset do jednego

Ktoś z Was mógłby w tym momencie zapytać, po co zapisywać DjVu, skoro już nim dysponujemy. Otóż książkę w tym formacie można stworzyć na dwa sposoby, jako pojedynczy plik typu Bundle, zawierający wszystkie strony książki, lub jako zbiór plików o strukturze podobnej do stron www. W takim wypadku folder z 500-stronicową książką będzie zawierał 501 plików, osobno poszczególne strony oraz indeks.

Ponieważ zarządzanie i przeglądanie tego typu materiału to po prostu koszmar, pierwsze co robię po ściągnięciu tak przygotowanej książki, to zapisuje jako pojedynczy plik właśnie w DjView. To pomaga utrzymać porządek, pozwalając grupować książki o podobnej tematyce w jednym folderze.

Resztę omijać szerokim łukiem

W Mac App Store znajdziecie jeszcze kilka innych narzędzi do czytania DJVU, tak płatnych, jak i darmowych, ale nie warto tracić na nie czasu. Prawdziwie darmowy „DjVu Viewer + DjVu to PDF” nie otwiera mi większych książek, po prostu się wieszając.

„Document Reader” oraz „DjVu Viewer – Read DjVu Files” to aplikacje-klony, z których jedną można kupić bezpośrednio, a drugą aktywować (znacznie drożej) w aplikacji. Problem w tym, że obie prawdopodobnie oszukują i „otwierając” plik, tak naprawdę konwertują go w tle do PDF-a. W efekcie 300-stronicowa książka potrafi się otwierać kilka minut. Co gorsza, gubią przy tym warstwę OCR, uniemożliwiając przeszukiwanie tekstu, pomimo, że interfejs ma pole do tego przeznaczone.

Pozostałe aplikacje to zwykłe konwertery formatu DjVu do PDF. Z racji tego, że polecane przeze mnie programy potrafią eksportować do tego formatu, wolę korzystać z pomocy DjVu Reader Pro.

Dlaczego nie uciec w PDF

Jak widać z powyższego artykułu, o ile sytuacja z czytaniem online jest dobra, to z aplikacjami wygląda o wiele gorzej. Dostępny jest tylko jeden naprawdę nowoczesny i ciągle aktualizowany program i miejmy nadzieję, że deweloper go nie porzuci. Można by więc zapytać, dlaczego nie skonwertować swoich książek do PDF. Niestety, żaden z wymienionych tutaj programów nie potrafi tego zrobić, zachowując jednocześnie aktywną warstwę tekstową.

Żeby zachować tę samą funkcjonalność, należałoby wyeksportować każdą pozycję, a następnie poddać ją ponownemu procesowi OCR. To oznacza masę pracy, którą przecież trzeba też jakoś weryfikować, szczególnie gdy mowa o niełatwym dla OCR języku polskim w wydaniu sprzed lat. W książkach przygotowanych w .djvu zrobili to za nas archiwiści i najczęściej zrobili to dobrze.

Gdzie znaleźć wartościowe książki?

Królestwem książek tego typu są biblioteki cyfrowe. Po wpisaniu tej frazy w Google wyskoczy wam kilkanaście stron tego typu, podzielonych regionalnie plus biblioteki uniwersyteckie. Jednak najlepiej wyszukuje się takich materiałów przez stronę Federacji Polskich Bibliotek Cyfrowych – fbc.pionier.net.pl. Jest to agregat pozwalający przeszukać Wam za jednym razem większość polskich zbiorów tego typu.

Jeśli chodzi o tematy bardziej technologiczne, na pewno warto odwiedzić stronę Internet Archive, na której znajdziemy m. in. dużo starszych magazynów technologicznych, tak zagranicznych, jak i polskich (np. Bajtek). W przypadku tej strony można też często wybrać pomiędzy formatem DjVu a PDF i jak zauważycie, te pierwsze zajmują najczęściej o wiele mniej miejsca. Sam często korzystam ze starych numerów MacWorld czy MacAddict z tej strony przy pisaniu artykułów o historii Apple.

Podsumowując, żyjemy w fantastycznych czasach, jeśli chodzi o dostęp do wiedzy. Możemy łatwo skorzystać z tysięcy książek, czasopism, które dają nam możliwości o których, nie tylko nasi rodzice, ale i zawodowi historycy sprzed lat mogli tylko marzyć. DjVu jest jednym z ważnych kluczy do tych zasobów i zachęcam was, żeby po niego jak najczęściej sięgać.