10

Google Docs z OCR-em do rozpoznawania tekstu z PDF-ów i obrazków

Google wprowadziło w swoim pakiecie aplikacji biurowych czyli Google Docs bardzo ciekawą funkcję rozpoznawania tekstu (OCR) w obrazkach i plikach PDF. Wcześniej ta opcja była dostępna jako „eksperyment” ale jakoś uciekła mojej uwadze. Jak to działa? Podczas wgrywania do Google Docs PDF lub skanu jakiegoś tekstu zobaczymy opcję dającą możliwość przekonwertowania informacji do tekstu. Wygenerowany […]

Google wprowadziło w swoim pakiecie aplikacji biurowych czyli Google Docs bardzo ciekawą funkcję rozpoznawania tekstu (OCR) w obrazkach i plikach PDF. Wcześniej ta opcja była dostępna jako „eksperyment” ale jakoś uciekła mojej uwadze.

Jak to działa? Podczas wgrywania do Google Docs PDF lub skanu jakiegoś tekstu zobaczymy opcję dającą możliwość przekonwertowania informacji do tekstu. Wygenerowany w ten sposób tekst jest zapisywany jako dokument w Docs. Niestety oryginał nie jest wgrywany, więc jeśli chcemy mieć też w Google Docs źródło przekonwertowanego tekstu to musimy wgrać je oddzielnie.

I teraz najważniejsze – podobno z jakością rozpoznawania tekstu nie jest jeszcze najlepiej (sam jeszcze nie miałem okazji przetestować). Według googlesystem skąd pochodzi ta informacja przy pierwszych testach konwersji ok 10% tekstu zostało nie rozpoznane lub rozpoznane błędnie. Moim zdaniem nie jest to najgorszy wynik jak na narzędzie online.




Nie ma co się jednak nastawiać na to, że OCR w Google Docs będzie na tym samym poziomie co specjalistyczne dedykowane do tego celu płatne aplikacje. Ma to być raczej narzędzie dla osób, które okazjonalnie mają potrzebę skopiowania tekstu z zeskanowanego zdjęcia czy też obrazka.