Felietony

Google Docs z OCR-em do rozpoznawania tekstu z PDF-ów i obrazków

Grzegorz Marczak
Google Docs z OCR-em do rozpoznawania tekstu z PDF-ów i obrazków
10

Google wprowadziło w swoim pakiecie aplikacji biurowych czyli Google Docs bardzo ciekawą funkcję rozpoznawania tekstu (OCR) w obrazkach i plikach PDF. Wcześniej ta opcja była dostępna jako "eksperyment" ale jakoś uciekła mojej uwadze. Jak to działa? Podczas wgrywania do Google Docs PDF lub skanu...

Google wprowadziło w swoim pakiecie aplikacji biurowych czyli Google Docs bardzo ciekawą funkcję rozpoznawania tekstu (OCR) w obrazkach i plikach PDF. Wcześniej ta opcja była dostępna jako "eksperyment" ale jakoś uciekła mojej uwadze.

Jak to działa? Podczas wgrywania do Google Docs PDF lub skanu jakiegoś tekstu zobaczymy opcję dającą możliwość przekonwertowania informacji do tekstu. Wygenerowany w ten sposób tekst jest zapisywany jako dokument w Docs. Niestety oryginał nie jest wgrywany, więc jeśli chcemy mieć też w Google Docs źródło przekonwertowanego tekstu to musimy wgrać je oddzielnie.

I teraz najważniejsze - podobno z jakością rozpoznawania tekstu nie jest jeszcze najlepiej (sam jeszcze nie miałem okazji przetestować). Według googlesystem skąd pochodzi ta informacja przy pierwszych testach konwersji ok 10% tekstu zostało nie rozpoznane lub rozpoznane błędnie. Moim zdaniem nie jest to najgorszy wynik jak na narzędzie online.




Nie ma co się jednak nastawiać na to, że OCR w Google Docs będzie na tym samym poziomie co specjalistyczne dedykowane do tego celu płatne aplikacje. Ma to być raczej narzędzie dla osób, które okazjonalnie mają potrzebę skopiowania tekstu z zeskanowanego zdjęcia czy też obrazka.

Hej, jesteśmy na Google News - Obserwuj to, co ważne w techu

Więcej na tematy:

Googlegoogle docs