Logo Tyfloświat

Programu FineReader nie trzeba chyba nikomu przedstawiać. Gdyby jednak zaszła taka konieczność, nadmienię tylko, że to najczęściej używane przez niewidomych narzędzie do rozpoznawania tekstów drukowanych, z angielska i skrótowo określane jako OCR. Dawniej programów OCR używaliśmy przede wszystkim do rozpoznawania obrazów pozyskanych za pomocą skanera, żmudnie, niekiedy przez wiele godzin, wprowadzając do komputera papierowe książki. Obecnie, gdy księgarnie coraz częściej sprzedają książki w wersjach cyfrowych, na szczęście coraz rzadziej musimy wykonywać tę  mrówczą pracę, szczególnie, jeśli interesuje nas beletrystyka, bo w przypadku publikacji typowo naukowych nadal dość często jesteśmy zmuszeni do korzystania ze starych, nieco może archaicznych, ale wypróbowanych metod.

Po co w takim razie obecnie warto mieć program OCR?

Okazuje się, że w dzisiejszych czasach może być on dla nas również bardzo przydatny. Żyjemy w świecie, w którym, czy tego chcemy, czy nie, coraz większe znaczenie ma obraz. Znaczenie obrazu jest tym większe, że bardzo często postać grafiki przyjmuje także to, co nią wcale być nie musi, bo to po prostu kartka z tekstem, ale akurat tak komuś było wygodniej, bo nie wiedział, nie pomyślał, nie zastanowił się nad tym, że ktoś może mieć problem z odbiorem treści publikowanych w takiej formie i udostępnił tę kartkę np. w jakimś serwisie społecznościowym. O ile do instytucji publicznych, które zamieszczają informacje w takiej formie obrazkowej możemy, a nawet powinniśmy mieć pretensje, a prawo będzie po naszej stronie, o tyle przecież nie „obsztorcujemy” naszego znajomego, że utrudnia nam dostęp do treści i nie przygotował wersji alternatywnej. Oczywiście, uwagę możemy zwrócić i może nawet czasem coś to da, ale jeśli zależy nam przede wszystkim na efekcie, czyli zapoznaniu się z treścią wzmiankowanej tutaj grafiki, a wiemy, że jest tam tekst, to możemy tego dokonać w całkiem prosty sposób i to w dodatku za darmo. Co więcej, można to zrobić nawet wtedy, gdy na naszym komputerze nie znajduje się jakaś wersja FineReadera.

Na ratunek Ocr.space

Serwis www.ocr.space wychodzi naprzeciw wszystkim, którzy potrzebują wydobywać tekst z grafik lub plików PDF będących skanami. Co ważne, jednym z języków, wspieranych przez silnik Ocr.space jest język polski, tak więc możemy zapoznać się z rodzimymi tekstami bez obaw o „ogonki”. Zasada działania serwisu jest banalnie prosta.

Po wejściu na stronę główną korzystamy ze standardowego, przeglądarkowego mechanizmu do wysyłania pliku. Aktywujemy przycisk opisany jako „Przeglądaj” lub „Wybierz plik”. Alternatywnie, jeśli plik znajduje się gdzieś w sieci, a my znamy jego adres, możemy skorzystać z pola podpisanego „Paste url to source file (.png or .jpg or .pdf)”. Poniżej, na liście „Select OCR language” wybieramy język rozpoznawania tekstu. Domyślnie wybrany jest język systemowy, tak więc prawdopodobnie wartości „Polish” nie będziemy musieli zmieniać na nic innego. Kolejnym krokiem jest wybór formy, w jakiej chcemy otrzymać rozpoznaną treść. Możemy przejrzeć po prostu dane wynikowe, pozostawiając domyślnie zaznaczony przycisk opcji „Just extract text and show overlay (fastest option)”. Jeśli jednak nasz wynik chcemy zapisać w pliku PDF, to korzystamy z 2 pozostałych opcji: „Create searchable PDF with visible text layer” lub „Create searchable PDF with invisible text layer” – różnica polega na widoczności warstwy tekstowej, bądź jej braku i wyświetlaniu oryginalnej grafiki. W każdym przypadku warstwa tekstowa zostanie dodana do pliku PDF i będzie dostępna dla naszego programu odczytującego ekran. Skoro wszystko mamy ustawione, ostatnim krokiem jest uaktywnienie odnośnika „Start OCR!”. Po kilkunastu, kilkudziesięciu sekundach otrzymamy wyniki w wybranej przez nas formie. W tym miejscu ważna informacja dla wszystkich, którzy lubią programować. Po pierwsze, wyniki mogą być dostarczane także w tekstowym formacie JSON, a po drugie, Ocr.space umożliwia bezpłatne pozyskanie klucza API, który może być używany w naszych aplikacjach.

Jedynym minusem opisywanego tu serwisu, jest limit pliku, jaki możemy poddać procesowi rozpoznawania, wynosi on 5MB. Niby dużo dla pojedynczego obrazka, obawiam się jednak, że dla skanu książki zapisanej w PDF czy obrazów o wysokiej rozdzielczości może on być niewystarczający. Na szczęście właściciele serwisu w razie takich problemów deklarują elastyczność, zachęcając do kontaktu.

A jak to wygląda w praktyce?

Rezultaty są naprawdę zadowalające. Tekst z grafik, które przesyłałem do  serwisu www.ocr.space odczytywany był dobrze, oczywiście nie obyło się bez błędów, ale żaden z programów tego typu, przynajmniej na razie, nie może pochwalić się 100-procentową dokładnością. Jedyny problem to teksty w formie tabelarycznej. Twórcy serwisu deklarują, że narzędzie radzi sobie z tabelami, ale jedyne, co pozytywnego mogę o tym powiedzieć, to chyba to, że wyłuskuje ono z nich tekst. O jakiejkolwiek strukturze możemy niestety zapomnieć. To dość istotny mankament, bo przecież bardzo często w przypadku danych przedstawianych w formie tabel ma ona jednak znaczenie.

A jakieś alternatywy?

Wszystkim, którzy chcą korzystać z darmowego narzędzia OCR bez konieczności łączenia się z serwisami zewnętrznymi, polecam narzędzie PDF Reader z projektu Webbie. To bardzo prosta aplikacja, do której możemy wczytać zarówno dokument PDF, jak i dowolny obrazek, a pliki zostaną poddane działaniu oprogramowania OCR.

Oczywiście nie mam zamiaru nikogo odwodzić od korzystania czy zakupu FineReadera. To aplikacja, która w pełni zasługuje na to, by ją wspierać. Narzędzie jest dojrzałym produktem i z pewnością wartym swojej ceny, a możliwości, które oferuje, z pewnością nie znajdziemy w darmowych rozwiązaniach tego typu. Jednak, powiedzmy sobie szczerze, nie zawsze potrzebujemy płatnego, komercyjnego rozwiązania. Jeśli trzeba nam czegoś szybkiego, małego ale i skutecznego, warto dać szansę opisywanym w niniejszym artykule narzędziom tak, jak czynię to ja.

Michał Dziwisz

Partnerzy

 Fundacja Instytut Rozwoju Regionalnego                     Państwowy Fundusz Rehabilitacji Osób Niepełnosprawnych

Back to top