16

Sprawdzamy ABBYY FineReader 12. Techniki OCR są dziś skuteczne i dokładne, jak nigdy wcześniej

Upłynie jeszcze sporo wody w Wiśle zanim papier wyjdzie z użytku w biurach. Z tego też powodu oprogramowanie OCR ciągle znajduje zastosowanie w biznesie. Nie tylko tam zresztą. Ja zainstalowałem ABBYY FineReader na swoim domowym laptopie, żeby przekonać się, ile potrafi i do czego może mi się przydać.

ABBYY jest marką, której w pewnych kręgach nie trzeba przedstawiać. Pamiętam, jak dobrych kilkanaście lat temu kupowałem pierwszą w życiu drukarkę i dostałem ich oprogramowanie w pakiecie. Od tamtego czasu sporo się zmieniło, a oferta ABBYY się rozrosła. FineReader stanowi tutaj kluczową rolę, a dowodem tego może być chociażby zgodność ze 190 różnymi językami.

Technologia OCR nie istnieje od dziś. W dużym skrócie chodzi po prostu o rozpoznawanie znaków i całych tekstów na zeskanowanych dokumentach, a następnie konwertowanie ich na formę cyfrową. Ma to zapobiegać mozolnemu przepisywaniu setek stron. Dziś techniki OCR są na tyle zaawansowane, że nie tylko rozpoznają sam tekst, ale również jego formatowanie (krój, interlinie itp.). A na tym nie koniec – FineReader radzi sobie również z tabelkami, grafami i wykresami.

Instalacja programu przebiega w sposób klasyczny. Zanim uruchomimy kreator, możemy zdecydować, czy instalujemy FineReadera na jednym stanowisku czy może na wszystkich komputerach w sieci.

W wydaniu oznaczonym numerkiem 12 twórcy wprowadzili szereg zmian i nowości. W dużej mierze dotyczą one wydajności i skuteczności programu. Konwersję tabel poprawiono o 40 proc., a wykresów i grafów – o 30 proc. Wielostronicowe dokumenty mają być teraz otwierane 10 razy szybciej, a ogólną szybkość konwersji wszystkich skanów podniesiono o 15 proc. To suche liczby, których niestety nie mogę zweryfikować, bo nie używałem poprzedniej wersji FineReadera. W każdym razie w trakcie testów nie narzekałem na wydajność programu.

Jedną z największych zmian jest jednak odświeżony interfejs. Utrzymano go w stylistyce flat design, a zatem wszystkie ikonki są spłaszczone i minimalistyczne. Całość już na pierwszy rzut oka sprawia wrażenie intuicyjnej – szczególnie, że od razu po uruchomieniu wita nas kreator ułatwiający wykonywanie podstawowych zadań.

Dokumenty możemy załadowywać w programie za pomocą biurowego/domowego skanera. FineReader sprawnie wykrył mojego Brothera DCP-7065DN i się z nim połączył. Został przy tym wyposażony w rozbudowany kreator skanowania o dużych możliwościach. Jeżeli jednak nie mamy skanera, możemy po prostu robić dokumentom zdjęcia – np. smartfonem czy tabletem. FineReader również sobie z nimi poradzi. Twórcy programu zalecają tutaj jednak aparaty z matrycami o rozdzielczości minimum 2 Mpix (rekomendowane 5 Mpix), co warto mieć na uwadze. W każdym z tych przypadków dokument zostanie również poddany analizie i załadowany do programu. I tutaj dopiero FineReader pokazuje, na co go stać.

Na zrzutach ekranu możecie zobaczyć jeden z przeprowadzonych testów – była to ulotka dołączona do programu (otrzymaliśmy wersję pudełkową). FineReader nie tylko automatycznie podzielił ją na osobne strony (i zaproponował dodanie kolejnych do tego samego projektu), ale też przeanalizował każdy blok tekstu i grafikę, a następnie rozpoznał ich formatowanie i ustawienia. W edytorze możemy dokonać stosownych poprawek oraz weryfikacji tekstu w sytuacji, gdy praca algorytmów była niedokładna. Nie miałem jednak ani jednej takiej sytuacji, a przeskanowałem kilkadziesiąt różnych dokumentów. Mamy tutaj też do dyspozycji całkiem rozbudowany edytor obrazów. Całość jest zaskakująco prosta w obsłudze, choć początkowo liczba przycisków i poleceń może lekko przytłaczać.

Przeanalizowany w ten sposób skan możemy zapisać w nieedytowalnych (PDF, EPUB, JPEG, BMP, PNG i im podobne) lub edytowalnych formatach. Lista jest długa i obejmuje najpopularniejsze typu plików m.in. Office’a (DOC, DOCX, XLS, XLSX, PPT, PPTX), Open Document (ODT), RTF, TXT czy nawet CSV. Tutaj FineReader również sprawdza się bardzo dobrze. W przypadku wydruków nie natknąłem się właściwie na żadne błędy. Nie powinno to dziwić, skoro twórcy zapewniają, że dokładność rozpoznawania sięga 99,8 proc. Program czasem był wręcz nadgorliwy po rozpoznawał niektóre ilustracje jako bloki tekstu i przekształcał je w tabele. Działo się tak głównie w sytuacjach, gdy na obrazku było sporo tekstu i białego tła.

Przed zapisaniem zeskanowanego dokumentu możemy z nim zrobić więcej niż tylko nanieść poprawki czy skonwertować do edytowalnego formatu. FineReader wybiela tła starych dokumentów w przypadku, gdy są one pożółkłe lub poszarzałe. Za pomocą programu możemy też usuwać z nich kolorowe znaki – np. pieczątki.

FineReader 12 to również masa dodatkowych funkcji. W menu zapisu znajdziemy np. polecenie wysyłania zeskanowanego dokumentu na czytnik Kindle. Możemy też szybko wysyłać i pobierać dokumenty z chmury – Google Drive’a, Dropboksa lub OneDrive’a. To szczególnie przydatne w sytuacji, gdy za pomocą smartfona wykonujemy sporo zdjęć dokumentów, które po powrocie do biura chcemy poddać konwersji. Wszystkie z wymienionych usług oferują funkcje automatycznego przesyłania fotografii, więc tak naprawdę nie musimy nic robić – uruchamiamy komputer i już mamy do nich dostęp. Twórcy dołączyli też do programu skaner wizytówek, który konwertuje je na format Outlooka i szybko wysyła do programu. Warto też dodać, że po zarejestrowaniu otrzymujemy też dostęp do aplikacji Screenshot Reader, która pozwala nam na robienie zrzutów ekranu w dowolnym miejscu, a następnie wyciąga z nich czysty tekst.

ABBYY FineReader 12 to prawdopodobnie aplikacja obowiązkowa dla każdego, kto dużo pracuje na papierowych dokumentach i często jest zmuszony je skanować lub przepisywać. I nie mam tutaj na myśli jedynie zastosowań biznesowych. Sięgając pamięcią wstecz, przypominam sobie miliony sytuacji (szczególnie na studiach), w których tego typu zaawansowane funkcje nierzadko ratowały życie. Teraz uświadamiam sobie, jak duży postęp w technikach OCR dokonał się przez te kilka lat. Jednocześnie twórcy nie przeszli obojętnie obok trendów, czego dowodem jest integracja z chmurami czy możliwość wysyłania dokumentów na czytniki Kindle.

Artykuł powstał we współpracy z firmą AutoID Polska S.A., która jest generalnym dystrybutorem oprogramowania ABBYY w kraju.

  • Drooith

    No FineReader to klasyka – dawno temu używałem jakiejś wersji OEM i działał znakomicie :)

  • Szybka reakcja ;) 1. Tekst ewidentnie jest sponsorowany, ale „powstanie we współpracy” to nie to samo, co „sponsorowanie” (domyślam się, że autor dostał za darmo swoją kopię programu). Informacja o sponsorowaniu powinna wg mnie być na gorze 2. Program już nie jest nowy i nie jest nowością – artykuł nie prezentuje nic ciekawego. 3. Używam często i namiętnie tego programu, robię to dla kogoś, jeszcze nie szukałem szczególnie czegoś innego (cena…) , ale ten program wcale nie jest idealny i potrafi z akt sądowych zrobić taki burdel, że już nie wiadomo, co usuwać, bo 3 teksty są jeden na drugim, zawsze trzeba ręcznie formatować. Jak coś, ostrzegam innych – do skanowania pisma ręcznego absolutnie się nie nadaje.
    . Korzystając z okazji, że jest tu jeszcze niewiele komentarzy, może ktoś z AW odpowie – jak wygląda sytuacja z tą firmą, co miała opatentować anti-adblocka? Po 2 artykułach ucichło o niej na waszym blogu.

    • aaa

      Jako że szukam programu do OCR kliknąłem w nadzieji że znajdę rzetelne omówienie FineReadera (zwłaszcza że w linku i nagłówku artykułu nie pisało nic o sponsorowaniu). Zawiodłem się bo zamiast tego dostałem żałosną papkę działu PR producenta; po rzeczytaniu tego korpobełkotu na pewno FineReadera nie kupię. Najlepsze jest to że te kilka zdań adamo1139 dały mi więcej rozeznania niż cała „recenzja” antywebu (zastanawiam się co oznacza powstał we współpracy; czy ten tekst współredagował dział PR FineReadera). Nie dziwcie się droga redakcjo że powstają strony typu „czytam antyweb dla beki”. Gdy natomiast powstaje temat blokowania stron adblockiem to nastepuje napinanie się redakcji jakie to nasze treści są wysokiej jakości i straszenie paywallem. Czy zrobienie np. testu w którym mamy za zadanie przenieść do postaci cyfrowej kilkanascie kartek tekstu; jedna osoba przepisuje go ręcznie a druga wspomaga się programem do OCR byłoby aż tak trudne?

    • Krzysztof Kalinowski

      Om om om.
      1. jest wyraźnie napisane że sponsorowany
      2. sponsorowany = we współpracy. To jest jednak iich źródło zarobku.

  • mirekk

    Używam tego programu od wersji chyba 6, o ile dobrze pamiętam. Ogólnie jestem zadowolony, choć nie zawsze efekty są dobre i niemal zawsze wymaga obróbki ręcznej. Jednak i tak lepszy od Solid PDF (który jest równie kiepski jak popularny). Niestety w wersji 12 program wciąż sobie nie radzi ze stopkami/nagłówkami. Parę innych błędów też by się znalazło ale nie chce mi się szukać w pamięci… Ale generalnie polecam, zwłaszcza w promocji :)

  • areskrk

    Potrzebny Wam ktoś do wymyślania tytułów artów sponsorowanych :) Art spoko, że sponsorowany, spoko, soft spoko. Ale ten tytuł… Bida :) Jak bym był z marketingu telewizorów to bym się bał u Was arta zamawiać :) Można zobaczyć coś w stylu: „Telewizory są teraz lepsze niż kiedyś” :)
    wow
    No błagam :)

  • TadzikMen

    Tytuł pompatyczny, treść merytoryczna nikła…

  • Mamba

    Takie nas czekają czasy wkrótce. O ile teraz większość poważnych portali pisze że artykuł sponsorowany to w przyszłości będziemy dostawali takie kwiatki jak ten.

  • JaWcaleNieJestemZadowolony

    Mam wyłączonego adblocka – chcę, żebyście zarabiali na reklamach, ale to to już przesada. Nie atakujcie swoich użytkowników papką bo przestaną was czytać.

  • Krzysztof Kalinowski

    Mi w zasadzie brakuje w tekście tylko informacji ile golda chcą za takie cudo. (trzeba samemu googlować)

  • kaszub

    OCR(Abbyy) + TTS(Ivona) + słuchawki bezprzewodowe(Sennheiser) == super szybkie i przyjemne pochłanianie olbrzymich ilości książek. Polecam. Sprawdzone.

    • amonlb

      Ivona nauczyła się czytać ”natualnie” czy nadal bełkocze? Bo jeśli bełkocze tak jak rok czy dwa lata temu to albo masz anielską cierpliwość albo Ci współczuję.
      Audiobooków słucham od lat, ale czytanych przez człowieka. Ivona wywołuje u mnie ból głowy już w trakcie czytania przepisu na jajecznicę, daleko jej do czytania całych książek.

    • kaszub

      Naturalnie to nigdy się nie nauczy – prawdopodobnie, bo to algorytm. Bełkocze, ale zrozumiale. Mam cierpliwość – kilka razy tez zdarzyło mi się zasnąć ze słuchawkami ;) – przy dłuższym słuchaniu głos staje się faktycznie monotonny. Dobry sprzęt audio + tuning parametrów odsłuchu koryguje wady syntezatora – ale faktycznie musi to być sprzęt topowy. Ja audiobooków nie słucham z prostego powodu – takich jak mi są potrzebne nie ma i raczej nie będzie, a jak posłucham wypocin aktorzyn, starających się wczuć w rolę i nadinterpretujących tekst pisany to też mi się niedobrze robi. Wolę zrozumiały, i być może trochę systetyczny bełkot. Nie bez znaczenia jest tez praktyczność tego rozwiązania – szybkość, koszty itp.. Z Ivoną jestem od początku jej komercyjnego istnienia, i szczerze to najlepszy syntetazor jakiego używałem. Abbyy przynajmniej w tych wcześniejszych wersjach nastręczał problemów, ale też pozostaje obecnie najlepszy.

    • amonlb

      Sprawdziłem fragment tekstu na ich stronie. Niestety dla mnie to nie do przyjęcia. Nie zrozum mnie źle. Sama technologia jak i jej rozwój są imponujące. Popieram i pragnę bardzo, żeby działało to w przyszłości jak należy ale na tą chwilę nadaje się do prostych czynności, na pewno nie do czytania książki co najwyżej maila lub smsa. Chyba że masz jakiś sposób na poprawienie brzmienia tego syntezatora mowy.

    • kaszub

      Mam, ustawienia programowe odtwarzania dźwięku – typu lekki pogłos, amfiteatr lub inne poprawiają indywidualnie wrażenia dźwiękowe. Oczywiście to działa indywidualnie. Przy dłuższym odsłuchiwaniu – przyznam staje się monotonne i lekko męczące. Ale np. nadaje się idealnie do zgrania do formatu mp3 i odsłuchiwania np. podczas jazdy na rowerze. Zgadzam się, nie jest to rozwiązanie idealne, ma wady, ale … coś za coś.

  • natankraps

    Dla użytkowników domowych i firm jest darmowy PdfXchange, gdzie jest pakiet OCR (trzeba osobno doinstalować). Działa bardzo dobrze jak na darmochę. Jest wersja dedykowana dla języka polskiego. Z mojego doświadczenia wynika, że standardowy wydruk na drukarce laserowej w czcionce 11-12p Times New Roman lub Arial odczyta z dokładnością 99,9%.