15

Sprawdzamy ABBYY FineReader 12. Techniki OCR są dziś skuteczne i dokładne, jak nigdy wcześniej

Upłynie jeszcze sporo wody w Wiśle zanim papier wyjdzie z użytku w biurach. Z tego też powodu oprogramowanie OCR ciągle znajduje zastosowanie w biznesie. Nie tylko tam zresztą. Ja zainstalowałem ABBYY FineReader na swoim domowym laptopie, żeby przekonać się, ile potrafi i do czego może mi się przydać.

ABBYY jest marką, której w pewnych kręgach nie trzeba przedstawiać. Pamiętam, jak dobrych kilkanaście lat temu kupowałem pierwszą w życiu drukarkę i dostałem ich oprogramowanie w pakiecie. Od tamtego czasu sporo się zmieniło, a oferta ABBYY się rozrosła. FineReader stanowi tutaj kluczową rolę, a dowodem tego może być chociażby zgodność ze 190 różnymi językami.

Technologia OCR nie istnieje od dziś. W dużym skrócie chodzi po prostu o rozpoznawanie znaków i całych tekstów na zeskanowanych dokumentach, a następnie konwertowanie ich na formę cyfrową. Ma to zapobiegać mozolnemu przepisywaniu setek stron. Dziś techniki OCR są na tyle zaawansowane, że nie tylko rozpoznają sam tekst, ale również jego formatowanie (krój, interlinie itp.). A na tym nie koniec – FineReader radzi sobie również z tabelkami, grafami i wykresami.

Instalacja programu przebiega w sposób klasyczny. Zanim uruchomimy kreator, możemy zdecydować, czy instalujemy FineReadera na jednym stanowisku czy może na wszystkich komputerach w sieci.

W wydaniu oznaczonym numerkiem 12 twórcy wprowadzili szereg zmian i nowości. W dużej mierze dotyczą one wydajności i skuteczności programu. Konwersję tabel poprawiono o 40 proc., a wykresów i grafów – o 30 proc. Wielostronicowe dokumenty mają być teraz otwierane 10 razy szybciej, a ogólną szybkość konwersji wszystkich skanów podniesiono o 15 proc. To suche liczby, których niestety nie mogę zweryfikować, bo nie używałem poprzedniej wersji FineReadera. W każdym razie w trakcie testów nie narzekałem na wydajność programu.

Jedną z największych zmian jest jednak odświeżony interfejs. Utrzymano go w stylistyce flat design, a zatem wszystkie ikonki są spłaszczone i minimalistyczne. Całość już na pierwszy rzut oka sprawia wrażenie intuicyjnej – szczególnie, że od razu po uruchomieniu wita nas kreator ułatwiający wykonywanie podstawowych zadań.

Dokumenty możemy załadowywać w programie za pomocą biurowego/domowego skanera. FineReader sprawnie wykrył mojego Brothera DCP-7065DN i się z nim połączył. Został przy tym wyposażony w rozbudowany kreator skanowania o dużych możliwościach. Jeżeli jednak nie mamy skanera, możemy po prostu robić dokumentom zdjęcia – np. smartfonem czy tabletem. FineReader również sobie z nimi poradzi. Twórcy programu zalecają tutaj jednak aparaty z matrycami o rozdzielczości minimum 2 Mpix (rekomendowane 5 Mpix), co warto mieć na uwadze. W każdym z tych przypadków dokument zostanie również poddany analizie i załadowany do programu. I tutaj dopiero FineReader pokazuje, na co go stać.

Na zrzutach ekranu możecie zobaczyć jeden z przeprowadzonych testów – była to ulotka dołączona do programu (otrzymaliśmy wersję pudełkową). FineReader nie tylko automatycznie podzielił ją na osobne strony (i zaproponował dodanie kolejnych do tego samego projektu), ale też przeanalizował każdy blok tekstu i grafikę, a następnie rozpoznał ich formatowanie i ustawienia. W edytorze możemy dokonać stosownych poprawek oraz weryfikacji tekstu w sytuacji, gdy praca algorytmów była niedokładna. Nie miałem jednak ani jednej takiej sytuacji, a przeskanowałem kilkadziesiąt różnych dokumentów. Mamy tutaj też do dyspozycji całkiem rozbudowany edytor obrazów. Całość jest zaskakująco prosta w obsłudze, choć początkowo liczba przycisków i poleceń może lekko przytłaczać.

Przeanalizowany w ten sposób skan możemy zapisać w nieedytowalnych (PDF, EPUB, JPEG, BMP, PNG i im podobne) lub edytowalnych formatach. Lista jest długa i obejmuje najpopularniejsze typu plików m.in. Office’a (DOC, DOCX, XLS, XLSX, PPT, PPTX), Open Document (ODT), RTF, TXT czy nawet CSV. Tutaj FineReader również sprawdza się bardzo dobrze. W przypadku wydruków nie natknąłem się właściwie na żadne błędy. Nie powinno to dziwić, skoro twórcy zapewniają, że dokładność rozpoznawania sięga 99,8 proc. Program czasem był wręcz nadgorliwy po rozpoznawał niektóre ilustracje jako bloki tekstu i przekształcał je w tabele. Działo się tak głównie w sytuacjach, gdy na obrazku było sporo tekstu i białego tła.

Przed zapisaniem zeskanowanego dokumentu możemy z nim zrobić więcej niż tylko nanieść poprawki czy skonwertować do edytowalnego formatu. FineReader wybiela tła starych dokumentów w przypadku, gdy są one pożółkłe lub poszarzałe. Za pomocą programu możemy też usuwać z nich kolorowe znaki – np. pieczątki.

FineReader 12 to również masa dodatkowych funkcji. W menu zapisu znajdziemy np. polecenie wysyłania zeskanowanego dokumentu na czytnik Kindle. Możemy też szybko wysyłać i pobierać dokumenty z chmury – Google Drive’a, Dropboksa lub OneDrive’a. To szczególnie przydatne w sytuacji, gdy za pomocą smartfona wykonujemy sporo zdjęć dokumentów, które po powrocie do biura chcemy poddać konwersji. Wszystkie z wymienionych usług oferują funkcje automatycznego przesyłania fotografii, więc tak naprawdę nie musimy nic robić – uruchamiamy komputer i już mamy do nich dostęp. Twórcy dołączyli też do programu skaner wizytówek, który konwertuje je na format Outlooka i szybko wysyła do programu. Warto też dodać, że po zarejestrowaniu otrzymujemy też dostęp do aplikacji Screenshot Reader, która pozwala nam na robienie zrzutów ekranu w dowolnym miejscu, a następnie wyciąga z nich czysty tekst.

ABBYY FineReader 12 to prawdopodobnie aplikacja obowiązkowa dla każdego, kto dużo pracuje na papierowych dokumentach i często jest zmuszony je skanować lub przepisywać. I nie mam tutaj na myśli jedynie zastosowań biznesowych. Sięgając pamięcią wstecz, przypominam sobie miliony sytuacji (szczególnie na studiach), w których tego typu zaawansowane funkcje nierzadko ratowały życie. Teraz uświadamiam sobie, jak duży postęp w technikach OCR dokonał się przez te kilka lat. Jednocześnie twórcy nie przeszli obojętnie obok trendów, czego dowodem jest integracja z chmurami czy możliwość wysyłania dokumentów na czytniki Kindle.

Artykuł powstał we współpracy z firmą AutoID Polska S.A., która jest generalnym dystrybutorem oprogramowania ABBYY w kraju.