Artykuł: TextScout konkurencją dla KNFB

Minął rok od pojawienia się na naszym rynku rewolucyjnego programu KNFB Reader. Amerykańska firma KNFBReading Technology stworzyła aplikację OCR, którą możemy zainstalować w naszych telefonach i która potrafi rozpoznać tekst na zrobionych przez nas zdjęciach. W tym roku, zaprezentowany został jej godny konkurent. Program TextScout, niemieckiej firmy Elumo. Aplikacja ta nie tylko dorównuje KNFB w łatwości obsługi i jakości rozpoznawanych tekstów, ale momentami, pod wieloma względami zdaje się ją przewyższać.

Różnice na plus dla niemieckiej aplikacji zauważamy już w trakcie samej instalacji programu. Proces rejestracji, także wersji demo, jest o wiele bardziej przyjazny dla użytkownika niż w KNFB. Do dyspozycji mamy trzy sposoby instalacji. Dwa są tradycyjne (pobranie plików programu ze strony http://instal.textscout.eu i instalacja z poziomu komputera lub karty pamięci telefonu), trzeci polega na wpisaniu podanego adresu w przeglądarce naszego telefonu. Po pobraniu plików z wyświetlonej strony, program zacznie się instalować automatycznie. Niewątpliwym plusem niemieckiej aplikacji jest możliwość jednoczesnej instalacji trzech pakietów językowych. Podstawowa wersja KNFB zezwala tylko na jeden język odczytu.

Przy pierwszym uruchomieniu TextScout musimy zaakceptować warunki licencyjne i potwierdzić, iż zdajemy sobie sprawę, że program będzie łączył się z Internetem, generując dodatkowe koszty. Oba komunikaty można od razu wyłączyć na stałe numerycznym klawiszem ?3?. Zaraz potem uruchomi się prosty kreator, który pomoże początkującym użytkownikom odpowiednio ustawić podstawowe opcje programu.

Aplikacja posiada bardzo przejrzyste i intuicyjne menu, do którego wchodzimy lewym klawiszem funkcyjnym. Po ustawieniach poruszamy się strzałkami ?w górę? i ?w dół?, rozwijając lub wybierając opcje strzałką ?w prawo? lub klawiszem wyboru. Opcje zwijamy strzałką ?w lewo?, a menu opuszczamy prawym klawiszem funkcyjnym. W menu m.in. możemy ustawić parametry syntezatora, wybrać głos odczytujący rozpoznane wyniki, ustalić, które połączenie internetowe ma być aktywne i dobrać optymalne ustawienia fotografowania.

Do tych ciekawszych propozycji, które sprawiają, iż "Skałt" jest bardziej przyjazny użytkownikowi niż KNFB, możemy zaliczyć:

- możliwość wyłączenia ekranu telefonu, co w znaczący sposób wpływa na zużycie energii baterii,

- włączanie i wyłączanie funkcji stabilizacji obrazu, która włączona np. w pociągu może nam uniemożliwić wykonanie zdjęcia,

- dokładną instrukcję obsługi, odczytywaną głosem TextScout.

TextScout posiada trzy tryby pracy: fotografowania, odczytu oraz odczytu zewnętrznego. W dowolnym momencie możemy sprawdzić, w którym z nich się znajdujemy, naciskając klawisz ?#? na klawiaturze telefonu.

W trybie fotografowania wykonujemy zdjęcie wybranego obiektu w celu rozpoznania znajdującego się na nim tekstu. Poruszając się strzałkami ?w lewo? i ?w prawo? możemy doprecyzować, jakiego rodzaju napis chcemy fotografować. Do wyboru mamy: tryb automatyczny, opakowania produktów, szybki, drobny tekst oraz rachunki. Domyślnie, przy każdorazowym uruchomieniu ustawiony jest tryb automatyczny. Wielokrotne próby z wykorzystaniem wszystkich trybów fotografowania pokazały, że tryb automatyczny sprawdza się najlepiej w niemal każdej sytuacji. Zdjęcie danego obiektu wykonujemy, naciskając spust migawki. W momencie naciskania wyzwalacza, obiektyw aparatu powinien znajdować się na środku fotografowanego przedmiotu, w minimalnej odległości. Następnie należy stopniowo unosić telefon, oddalając obiektyw od naszego przedmiotu. Jeśli mamy włączoną opcję wspomagania namierzania, usłyszymy dwa zmieniające się dźwięki. Wysokość tonów pomaga nam określić, czy aparat znajduje się w prawidłowym położeniu. W chwili, gdy obiektyw obejmie cały fotografowany przedmiot, aplikacja automatycznie wykona zdjęcie. Po zrobieniu fotografii, program wysyła ją do serwerów TextScout, gdzie zostaje ona rozpoznana i po krótkiej chwili wyniki trafiają na nasz telefon. Na bieżąco jesteśmy informowani, czy zdjęcie zostało wykonane poprawnie, czy aparat jest obrócony względem fotografowanego obiektu, w którą stronę i ile stopni.

Gdy tylko otrzymamy wyniki z serwera, program przełącza się w tryb odczytu i rozpoczyna automatycznie odczytywać rozpoznany tekst. Odczyt zatrzymujemy i wznawiamy klawiszem zielonej słuchawki. Podczas automatycznego czytania, strzałkami ?góra? i ?dół? przemieszczamy się między akapitami. Strzałki ?w lewo? i ?w prawo? przenoszą nas między zdaniami. W chwili, gdy zatrzymujemy odczyt, kursory zmieniają swoją funkcjonalność - ?w górę? i ?w dół? odczytują wyrazy, a ?w lewo? i ?w prawo? poszczególne litery. Klawiszem gwiazdki zapisujemy wyświetlony tekst w ?Ulubionych?. Jeśli ustawiliśmy automatyczne zapisywanie dokumentów, a nie chcemy zapisać danego wyniku, możemy go usunąć dwukrotnie naciskając klawisz kasowania.

Klawisz ?0? włącza indeksowanie rozpoznanego tekstu. Dzięki tej opcji możemy bardzo szybko poruszać się po tekście, wykorzystując klawisze numeryczne, przypisane poszczególnym akapitom. Tryb odczytu zamykamy prawym klawiszem funkcyjnym.

Tryb odczytu zewnętrznego od odczytu klasycznego odróżnia możliwość wyboru głosu syntezatora czytającego rozpoznany tekst. Wyboru dokonujemy między głosem Ania programu TextScout a syntezatorem naszego screenreadera, zainstalowanego w telefonie. Jest to funkcja nieznana posiadaczom programu KNFB. Sprawia, iż wyniki rozpoznawania, posiadające znaczną ilość błędów, mogą być lepiej zrozumiane przez użytkownika przyzwyczajonego do głosu syntezatora, z którego korzysta na co dzień. Niestety, w trybie odczytu zewnętrznego indeksowanie działa w nieco inny sposób niż w trybie klasycznym. Aby móc zaindeksować wyniki, musimy najpierw nacisnąć prawy klawisz funkcyjny i dopiero wtedy klawisz ?0?, który zaindeksuje tekst.

TekstScout bardzo dobrze rozpoznaje tekst i robi to lepiej niż aplikacja KNFB. Dzieje się tak zapewne za sprawą zdalnych serwerów, które dysponują o wiele bardziej rozbudowanym oprogramowaniem i mocą obliczeniową niż KNFB korzystający z oprogramowania i procesora telefonu. Niestety, musimy za to dodatkowo zapłacić, ponosząc koszt połączenia internetowego. Jeśli mamy możliwość skorzystania z połączenia w obrębie naszego kraju, koszta są do zaakceptowania. Jeśli jednak chcielibyśmy użyć "Skałta" za granicą, ceny połączeń internetowych stają się zaporowe. Kupując niemiecką aplikację dodatkowo uzyskujemy dostęp do internetowych usług TextScout pozwalających nam m.in. na automatyczne wysyłanie rozpoznanych wyników na nasze prywatne konto e-mail czy też rozpoznawanie tekstu z fotografii wysyłanych mailem do serwerów projektu TextScout.

Producenci TekstScout postarali się, aby ich program był przyjazny dla użytkownika, bardzo dobrze spełniał swoją funkcję oraz posiadał dodatkowe wsparcie internetowe. Dzięki takiemu podejściu do klienta mają spore szanse zdominować rynek mobilnych aplikacji OCR dedykowanych osobom z dysfunkcją wzroku.

Na koniec miłe zaskoczenie, strona programu jest wielojęzyczna, jej znaczna część występuje również w języku polskim. Informacje o programie można znaleźć pod adresem: http://www.textscout.eu/

Piotr Witek

 

Projekt współfinansowany ze środków Państwowego Funduszu Rehabilitacji Osób Niepełnosprawnych oraz Gminy Miejskiej Kraków