Nowości w VoiceOver 3.0

Przeszło miesiąc temu swoją premierę miała najnowsza aktualizacja systemu operacyjnego firmy Apple - Mac OS X Snow Leopard.

Prezentujemy nowe funkcje związane z uniwersalnym dostępem, w szczególności zaś z wbudowanym w system screenreaderem - VoiceOver. Przypominamy, że w chwili ukazywania się tego newsa, interfejs polskiej syntezy do komputerów Apple - Acapela Ania dostępny jest jedynie w wersji beta.

Oto nowe funkcje oprogramowania:

  • Sterowanie funkcjami komputera za pomocą gestów na gładziku Multi-Touch, nawet jeśli użytkownik nie widzi ekranu. Powierzchnia gładzika w notebooku Mac to aktywne okno komputera: wystarczy dotknąć, aby usłyszeć głos wywołany przy pomocy palca; przeciągnąć, aby usłyszeć słowa odtwarzane w miarę, jak przesuwasz palec; wykonać niewielki ruch palcem, aby przejść do kolejnego lub poprzedniego elementu. Usłyszysz, jak elementy zostały rozmieszczone na ekranie ? dzięki temu będziesz mieć możliwość bezpośredniego przejścia do elementu, dotykając odpowiedniego miejsca na gładziku. Możesz na przykład przesunąć palcem dookoła gładzika, aby dowiedzieć się, jaki jest układ witryny WWW, arkusza kalkulacyjnego, prezentacji lub dowolnego dokumentu tekstowego. Każde dotknięcie to więcej informacji. Opisany sposób sterowania dostępny jest również z poziomu poszczególnych aplikacji oraz w iPhone'ach.

  • Pokrętło. To zupełna nowość w nawigacji, która jednym przypadnie do gustu, innych zniechęci, lecz na szczęście nie jest konieczne jej stosowanie. Już nie musisz uczyć się na pamięć skrótów klawiszowych, aby poruszać się po ekranie. Funkcja VoiceOver udostępnia wirtualny element sterujący, tzw. pokrętło. Obracasz pokrętło dwoma palcami na gładziku, niczym tarczę w telefonie, a VoiceOver zmienia sposób i kolejność odczytywania elementów tekstowych. Na przykład po ustawieniu pokrętła w pozycji ?Słowo? lub ?Znak? przy każdym ruchu VoiceOver odczytuje tekst słowo po słowie, co jest idealnym rozwiązaniem podczas sprawdzania lub edycji  tekstu. Pokrętło można również zastosować podczas nawigowania na stronach WWW . Po przejściu na daną stronę pokrętło będzie już zawierać nazwy często występujących elementów, takich jak nagłówki, odsyłacze, tabele, obrazy i wiele więcej. Wybierz ustawienie, a następnie wykonaj ruch palcem w górę lub w dół, aby przejść do poprzedniego lub następnego wystąpienia danej pozycji, omijając elementy znajdujące się pomiędzy.

  • Poprawiona wydajność przy odczytywaniu, rozpoznawaniu elementów i nawigacji na stronach WWW. VoiceOver udostępnia konfigurowalne podsumowanie strony WWW, uwzględniające tytuł, liczbę tabel, nagłówki, odsyłacze, elementy formularzy i wiele więcej. Snow Leopard  w pełni obsługuje tabele stron WWW w formacie HTML bez konieczności użycia formularzy oraz trybu tabeli. Za pomocą tych samych, dobrze znanych poleceń możesz nawigować w tabelach. Przeciągając palec po gładziku i korzystając z kilku klawiszy, usłyszysz treść tabeli, w tym tytuł kolumny oraz numer kolumny i wiersza.

  • Wprowadzenie znaczników, dzięki którym można oznaczać istotne miejsca na określonych stronach WWW, przechodzić do nich bezpośrednio lub tak ustawić VoiceOver, by po otwarciu danej strony, automatycznie przechodził do danego znacznika.

  • Rozszerzenie opcje konfiguracyjnych VoiceOver. Wprowadzono kilka poziomów oznajmiania, szereg nowych opcji, wpływających na ilość i kolejność wymawianych elementów.

  • Lepsza współpraca z urządzeniami peryferyjnymi. VoiceOver obsługuje ponad 40 modeli monitorów brajlowskich, w tym z tymi, które połączenie z komputerem nawiązują poprzez technologię Bluetooth. Możliwe jest wyświetlanie tekstu na kilku urządzeniach podłączonych do komputera.

    Więcej informacji na stronach Apple

    Źródło: Apple, Makowisko

Dolphin Guide po polsku - przyjazne środowisko pracy z komputerem dla początkujących niewidomych i słabowidzących

Dolphin Guide

W ofercie firmy Harpo pojawił się program Dolphin Guide. Jest to zintegrowane oprogramowanie, przeznaczone dla osób niewidomych i słabowidzących, mające maksymalnie uprościć pracę z komputerem. Dedykowane jest raczej dla osób starszych, używających w niewielkim stopniu komputera lub mających trudności z obsługą systemu Windows ze screenreaderem.
Pakiet dostępny w polskiej wersji językowej, udźwiękowiony jest polską syntezą Real Speak Agata 22 KHZ. Obsługa sprowadza się do nawigacji po menu klawiszami kursora "góra" - "dół" i naciskaniu ENTER albo ESC. Poszczególne moduły programu i opcje mają ponadto przypisane klawisze numeryczne.

Dolphin Guide zawiera:
? edytor tekstów ze słownikiem i elementami formatowania,
? moduł do skanowania, rozpoznawania i czytania tekstów,
? klienta poczty elektronicznej,
? przeglądarkę internetową,
? czytnik RSS,
? aplikację do podcastów i słuchania stacji radiowych,
? odtwarzacz multimediów, w tym płyt CD/DVD, oprogramowanie do nagrywania płyt,
? możliwość obsługi komunikatora Skype i MSN,
? książkę adresową i kalendarz,
? kalkulator i aplikację Finanse,
? oprogramowanie do notatek głosowych komputerowym mikrofonem,
? inne.

Już wkrótce na Portalu znajdziecie artykuł na temat Dolphin Guide. Na temat wzmiankowanej aplikacji będzie można także posłuchać w odcinku Tyflopodcastu.

Informacje o produkcie na stronie firmy Harpo i stronie producenta.

Źródło: Harpo, Dolphin

Tyfloświat_03_05_2009

Zapraszamy do pobrania najnowszego numeru czasopisma

Okładka Tyfloświata_03_2009

Istnieje możliwość bezpłatnej prenumeraty czasopisma w formie czarnodrukowej, również w druku powiększonym. Oferujemy również możliwość druku czasopisma w brajlu.

Zainteresowane osoby proszone są o kontakt z redakcją.

ZałącznikRozmiar
Tyfloswiat_03_2009.pdf2.33 MB
Tyfloswiat_03_2009.txt141.92 KB

PenFriend - nowy etykietownik głosowy w RNIB

PenFriend - etykietownikEtykietownik Pen Friend_fot. RNIB

Royal National Institute of Blind People wprowadził na rynek nowy etykietownik głosowy ? PenFriend. Urządzenie ma spore szanse stać się przebojem roku. Jego pojawienie się dobrze rokuje dla rozwoju rynku tyflotechnologicznego - wreszcie dostępne zaczynają być praktyczne rozwiązania w przystępnej cenie.

Za około 60 funtów dostajemy aparat, w którym możemy zachować do 70 godzin nazw głosowych, przypisywanych do samoprzylepnych etykiet, przy czym długość poszczegółnego nagrania nie jest ograniczona.

W paczce z PenFriendem otrzymujemy 127 etykiet z nadrukowanym mikroskopijnym kodem paskowym. Dodatkowy zestaw 380 etykiet to koszt około 10 funtów.

Sam PenFriend wyposażony jest w skaner i oprogramowanie do rozpoznawania kodu. Producent ? firma Mantra Lingua i RNIB ? informują, że obsługa urządzenia jest bardzo prosta. Naklejamy etykietę na produkt żywnościowy, lek, płytę czy jakikolwiek inny przedmiot, który chcemy oznaczyć, przykładamy PenFrienda i tworzymy nagranie głosowe. Później, przykładając PenFrienda do etykiety, możemy odsłuchać nagraną informację.

Urządzenie, zasilane dwoma bateriami AAA, można dodatkowo wykorzystywać jako odtwarzacz MP3.

Więcej informacji na temat urządzenia ukaże się niebawem w portalu, po przeprowadzeniu testów.

Drzwi do kultury. Audiodeskrypcja szansą na zwiększenie dostępu osób niewidomych i słabowidzących do sztuk wizualnych

Audiodeskrypcja - szansa na dostęp do sztuki

Fundacja Audiodeskrypcja oraz Fundacja Prawo i Partnerstwo rozpoczęły 24 września,cykl szkoleń w ramach projektu: ?Drzwi do kultury. Audiodeskrypcja szansą na zwiększenie dostępu osób niewidomych i słabowidzących do sztuk wizualnych.? Projekt dofinansowany jest ze środków Ministerstwa Pracy i Polityki Społecznej, z Programu Operacyjnego Fundusz Inicjatyw Obywatelskich.

Do udziału w szkoleniach zaproszone zostały osoby, które uczestniczą w planowaniu i realizowaniu strategii udostępniania dóbr kultury i edukacji kulturowej w instytucjach kulturalnych z województwa podlaskiego. Uczestnicy szkolenia zostaną zapoznani z informacjami na temat rodzajów niepełnosprawności wzrokowej, specyfiki możliwości percepcyjnych osób niewidomych i słabowidzących. Dowiedzą się też, na czym polega tworzenie opisów audiodeskrypcyjnych dzieł plastycznych, scenicznych, filmowych, jakie obowiązują przy tym zasady, jakie są możliwości zastosowania technik multisensorycznych w udostępnianiu dóbr kultury osobom niewidomym i słabowidzącym. Uczestnicy szkolenia pozyskają też informacje na temat dostępnych rozwiązań technologicznych, które umożliwiają stosowanie audiodeskrypcji w galerii, muzeum, teatrze czy operze. W czasie szkolenia analizowane będą także przykłady i formy stosowania audiodeskrypcji w placówkach kulturalnych na świecie.

Do udziału w szkoleniu swoich przedstawicieli (w sumie czternaście osób) zgłosiło dziewięć instytucji:

1. Muzeum Rzeźby Alfonsa Karnego,

2. Galeria im. Sleńdzińskich w Białymstoku,

3. Wojewódzki Ośrodek Animacji Kultury w Białymstoku,

4. Muzeum Przyrody w Drozdowie,

5. Wigierski Park Narodowy,

6. Muzeum Ikon w Supraślu,

7. Muzeum Wojska Polskiego w Białymstoku,

8. Muzeum Podlaskie w Białymstoku,

9. Białostockie Muzeum Wsi.

Szkolenia potrwają 8 dni i obejmą 4 dwudniowe zjazdy (czwartek-piątek) w terminach: 24-25 września, 8-9 października, 22-23 października, 5-6 listopada. Szkolenia są bezpłatne. Odbędą się w hotelu ZEJER, w Barszczewie koło Białegostoku.

Wszelkich dodatkowych informacji udzielają:

Tomasz Strzymiński ? prezes Fundacji Audiodeskrypcja, tel. 500 269 391

Barbara Szymańska ? wiceprezes Fundacji Audiodeskrypcja, tel. 500 093 090

Katarzyna Dziedzik ? członek zarządu Fundacji Audiodeskrypcja, koordynator projektu, tel. 605 580 766

Logo fundacji AudiodeskrypcjaLogo fundacji Prawo i PartnerstwoLogo FIO

Projekt dofinansowany ze środków Programu Operacyjnego Fundusz Inicjatyw Obywatelskich

Produkty firmy Dolphin w wersji 11

Nowe wersje produktów Dolphin 11

Produkty firmy Dolphin Computer Access w wersji 11 zostały zaprezentowane wiosną bieżącego roku, lecz z informacją o nowościach czekaliśmy, aż dowiemy się czegoś więcej o spolszczeniu. Wszystko wskazuje jednak na to, że w chwili obecnej produkty Dolphin w najnowszej wersji nie będą dostępne po polsku.

Poniżej zamieszczamy listę wybranych nowości, wprowadzonych do produktów Dolphin w wersji 11:

? wsparcie dla 64-bitowej wersji Windows Vista (w chwili obecnej mocno niedopracowane, wraz z nowymi aktualizacjami będzie zapewne funkcjonowało coraz lepiej)

? wsparcie dla Windows 7 (wersja publiczna beta)

? możliwość instalacji programu dla wszystkich użytkowników danego komputera - ustawienia osobiste są teraz zapisane w profilu użytkownika

? wsparcie dla MS Internet Explorer 8

? podstawowe wsparcie dla iTunes

? komptybilność z programem Skype w wersji 4

? "gorący klawisz" w przeglądarce internetowej Mozilla Firefox, wyświetlający listę wszystkich zakładek (CAPSLOCK + Q)

? poprawka ogłaszania funkcji paska stanu w programach Word XP & Word 2003

Wersja 11 wykrywa i ogłasza stany takie, jak: "Zastępowanie", "Śledzenie zmian", "Rozszerzanie zaznaczenia" i "Zarejestruj nowe makro", które znajdują się na pasku stanu programu Word.

? nowa aplikacja pomocy ?Pomoc SuperNova?

Zawsze dostępny system pomocy kontekstowej, zapewniający wsparcie dla różnych aplikacji, uruchamiany jest przez naciśnięcie klawiszy CAPS LOCK + F1. Można w nim znaleźć gorące klawisze dla Word XP/2003, SuperNovy, a także porady na temat korzystania z oprogramowania Dolphin dla wybranej aplikacji. Nowy system pomocy będzie wraz z upływem czasu poszerzany o nowe treści, materiały i wsparcie szerokiego wachlarza aplikacji.

? odświeżony wygląd panelu sterowania

Dla użytkowników używających wzroku: nowe ikony przycisków natychmiast informują, co każdy z nich oznacza. Nie ma też znaczenia, jakiego rozmiaru powiększenia się używa, nowe ikony pozostają gładkie i ostre, zapewniając dostateczną widoczność. Dodatkowo każdy przycisk posiada również czytelne etykiety tekstowe.

Dla użytkowników używających udźwiękowienia: nowy panel sterowania zapewnia łatwe lokalizowanie funkcji. Wciskane zakładki menu są tak logicznie rozmieszczone, aby w większym stopniu odzwierciedlać najczęściej używane funkcje.

? jasny, mniej techniczny język

Dzięki modyfikacji słownika łatwiej wywnioskować, już z samej nazwy, do czego służy każda funkcja. Nowa terminologia dokładnie opisuje każdą funkcję, zapewniając nowym i dotychczasowym użytkownikom oprogramowania Dolphin maksimum wygody.

Przykładowe zmiany terminologii: Kursor Dolphin zamiast Wirtualnego Fokusa, Tryb Formularzy zamiast Trybu Interaktywnego, Czytaj Tutaj zamiast Czytania Dokumentów.

? przycisk uruchamiania trybu Przeglądania Liniowego

W wersji 11, użytkownik może myszką kliknąć na nowy przycisk Przeglądania Liniowego. Spowoduje to automatyczne uruchomienie funkcji Przeglądania Liniowego dla przeglądanej aplikacji. Tryb liniowy pozwoli na przeglądanie aktualnie aktywnego okna jako pojedynczej linii przemieszczającej się w poprzek ekranu.

Można szybko zmienić domyślne ustawienie Przeglądania Liniowego na Przeglądanie Liniowe Całego Dokumentu, Przeglądanie Liniowe Dokumentu lub na Przeglądanie Liniowe Dokumentu od Kursora przez wciśnięcie kontrolki znajdującej się blisko przycisku Przeglądania Liniowego na panelu kontrolnym.

? przycisk uruchamiania Doc Reader

Wersja 11 pozwala użytkownikom powiększania na uruchomienie funkcji Doc Reader z panelu sterowania przy pomocy Doc Reader.

Doc Reader umożliwia użytkownikowi utworzenie własnego środowiska do czytania. Można do niego załadować dokumenty, strony Web i inne formy danych tekstowych. Doc Reader daje możliwość zamiany czcionki, jej rozmiaru, kolorów pierwszego i drugiego planu dokumentu oraz zawijania linii.

Nowy Dolphin Pen II

Nowy Dolphin Pen II wprowadza na rynek technologię zapewniającą ochronę przed uszkodzeniem i złośliwym oprogramowaniem.

Dolphin Pen II dystrybuowany jest na dysku USB, podzielonym na partycje. Na pierwszej partycji, posiadającej artybut "tylko do odczytu", znajdują się krytyczne składniki programu powiększającego i programu udźwiękawiającego, które są zabezpieczone przed uszkodzeniem. Druga partycja jest partycja zapisywalną i pozwala użytkownikowi zapisywać własne ustawienia programu i przenosić je z komputera do komputera.

? nowy SAM dla Zarządzania Mową i Urządzeniami Brajlowskimi

SAM (Synthesiser Access Manager) w wersji 2.50 pozwala z łatwością odznaczyć odpowiednie sterowniki niebędące w użyciu lub działające niepoprawnie. Użytkownicy mogą również wyłączyć sterowniki, które nie będą używane, co wpłynie na przyspieszenie uruchamiania programu SuperNova.

? raportowanie o błędach

Jeśli oprogramowanie generuje błąd, użytkownik ma możliwość opcjonalnego i anonimowego wysyłania informacji o tym błędzie do firmy Dolphin. Producent infromuje, że nie są zbierane jakiekolwiek dane osobowe, a raporty służą jedynie pracom zmierzającym do poprawy skuteczności i niezawodności programów Dolphin.

Źródło: Altixhelp, Dolphin Computer Access

ZoomText MagReader z Ivoną

ZoomText z Ivoną

Firma Harpo - dystrybutor programu ZoomText, poinformowała, że do jego wersji z częściowym udźwiękowieniem - ZoomText MagReader, dodawany będzie polski syntezator Ivona - głos Jacek. To zmiana jakościowa - wcześniej polską syntezę do programu ZoomText trzeba było dokupic osobno.

Więcej na stronie Harpo

Źródło: Harpo

Artykuł: Skuteczne skanowanie tekstu

Skanowanie tekstuSkaner_fot. QiLux

Osoby z dysfunkcją wzroku od wielu lat korzystają z różnorodnych dobrodziejstw technologicznych, gdyż na wielu płaszczyznach użytkowania mniej lub bardziej skutecznie, kompensują one brak wzroku. Niezależnie jednak od tego, czy mówimy o najprostszych elektronicznych czujnikach poziomu cieczy w naczyniu, czy też o zaawansowanych rozwiązaniach, łączących w sobie wyspecjalizowane wykorzystanie komputerów i oprogramowania, cechą wspólną technologicznych ułatwień rehabilitacyjnych jest dostarczanie osobie niewidomej lub słabowidzącej informacji z otoczenia, które w inny sposób byłyby dla niej trudno lub całkowicie niedostępne.Patrząc na sprawę z tej perspektywy, można śmiało zaryzykować twierdzenie, że technologia, którą przedstawię w niniejszym artykule, należy do klasyki narzędzi, umożliwiających samodzielny odczyt przez osobę niewidomą tekstu zapisanego czarnym drukiem na papierze, a zatem książek, czasopism, ulotek itp.

Skanowanie tekstu, bo o nim tu mowa, odbywa się w dwóch etapach. Pierwszy z nich, to wprowadzenie do komputera elektronicznego obrazu tekstu drukowanego, które dokonywane jest za pomocą skanera. Urządzenie to, przetwarzając obraz kartki na sekwencję bitów, które mogą być przechowane w pamięci komputera lub zapisane na jego dysku twardym, wykonuje więc pracę analogiczną do ludzkiego oka.

Od cyfrowego obrazu daleka droga do jego odczytu przez program czytający ekran , gdyż aby stało się to możliwe, konieczne jest przetworzenie tego obrazu na zestaw rozumianych przez maszynę znaków, czyli tzw. tekst edytowalny. Tym etapem zajmuje się wyspecjalizowane oprogramowanie typu OCR (z ang. optical character recognition, czyli optycznego rozpoznawania znaków). Rolę skanera porównałem wcześniej do pracy ludzkiego oka, kontynuując to porównanie - program OCR, pełni w tym procesie rolę analogiczną do ludzkiego mózgu, który widziany obraz musi zinterpretować jako drukowany tekst.

Stosując inne porównanie, skanowanie i rozpoznawanie tekstu, jeżeli chodzi o efekt końcowy, jest podobne do przeczytania tego tekstu przez człowieka z kartki papieru i jego ręcznego wpisania z klawiatury w programie edycji tekstu np. MS Word. Są jednak conajmniej dwie istotne różnice między tymi metodami wprowadzania tekstu do komputera: czas trwania i dokładność.

Człowiek czytający tekst z kartki i wpisujący go z klawiatury będzie najprawdopodobniej dokładny, czyli nie popełni zbyt wielu błędów podczas przepisywania tekstu, jednak czas trwania tej operacji, nawet dla kilku stron, będzie długi.

Podczas gdy ręczne wpisywanie tekstu będzie trwało godzinę, komputerowe skanowanie i rozpoznawanie tego samego dokumentu odbędzie się w kilka minut, choć w procesie rozpoznawania tekstu mogą pojawić się pewne błędy.

Maszyna nie podlega zmęczeniu, nie ulega zmiennym nastrojom i nie doświadcza spadków formy w zależności od pogody i osobistych problemów, poza kosztami energii elektrycznej i konserwacji nie generuje żadnych innych, ponadto jest zawsze gotowa do pracy już w kilka sekund lub najwyżej minut od włączenia.

Oczywiście współpraca z człowiekiem ma wiele plusów i bynajmniej nie próbuję w tym miejscu udowodnić, że żywy lektor nie jest lepszy od komputera, warto jednak zauważyć ogromne zasługi maszyn cyfrowych w procesie rehabilitacji i samodzielnego dostępu do tekstu drukowanego.

Jak to działa?

Skaner jest płaskim urządzeniem o wymiarach nieco większych od maksymalnego formatu dokumentu, który może wczytywać, obecnie najczęściej formatu A4, i wysokości kilku centymetrów.

Wskazówka praktyczna: Skaner formatu A4 jest wygodnym i relatywnie niewielkim rozwiązaniem, jednak skanowanie książek, które po rozłożeniu mają większy od A4 rozmiar, wymagać będzie skanowania osobno każdej pojedynczej strony, zamiast dwóch stron jednocześnie, co oczywiście wydłuża czas tej operacji.

Pod pokrywą, znajdującą się w górnej płaszczyźnie urządzenia, umieszczona jest szyba, na której kładziemy dokument do zeskanowania.

Proces skanowania dokonywany jest przez przesuwającą się pod szybą głowicę o szerokości całego dokumentu, składającą się z lampy, emitującej równomierny strumień światła, oraz elementów przechwytujących odbite od skanowanego dokumentu promienie. Badając jakość i natężenie odbitych od dokumentu impulsów świetlnych, procesor skanera buduje na tej podstawie cyfrowy obraz skanowanego dokumentu, który następnie przesyłany jest do komputera.

Wskazówka praktyczna: skanując dokument ,warto dokładnie zamykać pokrywę skanera, aby uniknąć docierania do jego elementów światłoczułych promieni z zewnętrznych źródeł, takich jak oświetlenie w pomieszczeniu lub światło słoneczne.

Przy opisanej metodzie odwzorowania obrazu napotkamy na problemy w przypadku skanowania dokumentów drukowanych na papierze świecowym - właściwości tego nośnika powodują bowiem zaburzenia w odbiciu światła.

Skaner_fot.Pablo Eder Warto również zadbać o równomierne rozłożenie dokumentu na szybie skanera - w przypadku zwykłej kartki jest to dość proste do osiągnięcia, jednak w przypadku książki zwłaszcza nowej lub wielostronicowej, druk znajdujący się w pobliżu grzbietu może odchylać się od szyby skanera, przez co dokładność jego zeskanowania będzie mniejsza. Istnieją jednak na rynku skanery o kształcie szyby specjalnie profilowanym dla skanowania książek.

Technologia użyta do budowy skanera (CIS - tańsza i bardziej miniaturowa, CCD - droższa i dokładniejsza lub PMT - stosowana w drogich skanerach o zastosowaniach profesjonalnych) to kolejny czynnik, mający wpływ na jakość skanu, czyli cyfrowego odwzorowania obrazu analogowego.

A skoro o jakości skanu mowa, nie sposób pominąć rozdzielczości skanowanego obrazu, która jest jej najistotniejszym czynnikiem. Rozdzielczość skanu wyrażana jest w jednostkach DPI (ang. dots per inch, czyli plamki na cal). Oprogramowanie rozpoznawania tekstu wymaga rozdzielczości 300 DPI - zbyt mała rozdzielczość, ale uwaga - również zbyt duża - może negatywnie wpłynąć na jakość rozpoznawania tekstu. Im większa rozdzielczość, tym dłuższy jest czas skanowania pojedynczej strony dokumentu.

Jeszcze jednym czynnikiem wpływającym na dokładność skanu, jest jakość odwzorowania kolorów - dla potrzeb rozpoznawania tekstu drukowanego jest to jednak sprawa drugorzędna, a sugerowana optymalna jakość to, w tym przypadku, odcienie szarości.

Dlaczego warto dołożyć starań dla osiągnięcia optymalnej jakości obrazu skanowanego dokumentu? Ma to kluczowe znaczenie na etapie rozpoznawania tekstu.

Wskazówka praktyczna: często, mimo ustawienia prawidłowych parametrów skanera, jakość skanu okazuje się niewystarczająca. Może to wynikać z samego materiału źródłowego, więc np. słabej jakości druku, lecz także zabrudzeń, które w toku użytkowania mogą się pojawić na szybie skanera. Warto więc dbać o czystość szyby skanera, zamykać jego pokrywę po zakończonym skanowaniu, konserwować szybę urządzenia według wskazówek podanych w jego instrukcji obsługi. Należy również unikać bezpośredniego kontaktu palców z szybą skanera, co jednak w przypadku osób niewidomych może okazać się trudne, a zatem przed rozpoczęciem skanowania warto dokładnie umyć ręce, co powinno wykluczyć powstawanie na szybie zanieczyszczeń, które pogorszą jakość skanu.

Całkowicie niedopuszczalne jest także stawianie jakichkolwiek przedmiotów, zwłaszcza ciężkich lub posiadających ostre kanty lub krawędzie, bezpośrednio na szybie skanera - o ile ślady opuszków palców relatywnie łatwo da się z tej szyby usunąć, to jej trwałe mechaniczne uszkodzenia i zarysowania są w praktyce, bez naprawy serwisowej, nieusuwalne.

Rozpoznawanie tekstu, dokonywane jak już wspomniano, przez oprogramowanie typu OCR, to złożony proces, na który składa się badanie ogólnej struktury każdej zeskanowanej strony, wyodrębnienie z niej fragmentów tekstowych i graficznych, następnie podział obrazu tekstu na pojedyncze znaki i zamiana każdego takiego znaku na jego numeryczny odpowiednik w komputerowej tabeli znaków.

Czasem na tym właśnie etapie pojawia się problem, jeżeli tekst źródłowy wydrukowany jest bardzo nietypową czcionką, mocno odbiegającą od przyjętych standardów, program OCR nie będzie potrafił prawidłowo identyfikować rozpoznawanych znaków. Kłopot może rozwiązać mechanizm tzw. douczania wzorców, które polega na jednorazowym wskazaniu przez użytkownika jakiegoś błędnie rozpoznawanego elementu i określeniu, jaki to na prawdę znak. Rozwiązanie to, choć skuteczne, jest niestety całkowicie niedostępne dla osób niewidomych, gdyż wymaga precyzyjnego zaznaczenia obszaru jakiegoś znaku, co przy pomocy oprogramowania czytającego ekran jest niemożliwe.

Innym wbudowanym w OCR mechanizmem eliminacji błędów w rozpoznawanym tekście są słowniki, które pozwalają programowi wprowadzać korekty źle rozpoznanych słów.

Program Finereader, stanowiący obecnie najskuteczniejsze i z każdą wersją coraz bliższe doskonałości narzędzie OCR, posiada wbudowane słowniki dla ponad 100 języków w tym sztucznych, takich jak np. języki programowania.

Każdy dokument, skanowany i rozpoznawany w programie Finereader, nazywany jest wiązką. Pojęcie to, często zniechęcające początkujących użytkowników do rozpoczęcia pracy z aplikacją, oznacza serię ułożonych w określonej kolejności stron skanowanego dokumentu, np. książki. Każda strona przechowywana jest w wiązce pod dwoma postaciami: jako zeskanowany obraz dokumentu i, rozpoznany na podstawie tego obrazu, tekst.

Skanowanie pierwszej i każdej następnej strony dokumentu oznacza dodanie tej strony na końcu wiązki. Każda strona w wiązce może być następnie edytowana - zarówno w warstwie graficznej, gdzie edycji można poddać zeskanowany obraz, jak również w warstwie tekstowej.

Wskazówka praktyczna: screenreadery mają czasem problem z odczytywaniem tekstowej zawartości strony wiązki w oknie Finereadera. By podglądnąć rozpoznany tekst, można posłużyć się metodą ?zaznacz wszystko, kopiuj, wklej?, co pozwoli na dostęp do zawartości z poziomu Worda czy Notatnika. Taką operację warto wykonać na kilku pierwszych stronach skanowanego dokumentu, aby ustalić, czy rozpoznaje się on w stopniu wystarczająco dokładnym.

Po zeskanowaniu i rozpoznaniu całego interesującego nas dokumentu - np. książki, istnieje kilka możliwości przetworzenia tekstu na postać wygodniejszą i bardziej uniwersalną w użytkowaniu od wiązki, np. dokumentu Word lub pliku tekstowego.

W Finereaderze służy do tego narzędzie Kreatora Eksportu, które pozwala zapisać rozpoznany tekst w pliku (obsługiwane jest wiele formatów dokumentów) lub wykonać inne czynności, np. wysłać go do aplikacji Word.

Na etapie zapisu do pliku rozpoznanego tekstu, można ustalić, w jakim formacie ma być on zapisany (txt, doc i wiele innych), czy obiekty graficzne, jak zdjęcia i rysunki, mają być także zapisywane oraz, jak dalece program ma odwzorowywać formatowanie oryginału.

Zapisywanie grafiki w eksportowanym dokumencie nie oznacza zapisywania skanu każdej strony wraz z jej tekstowym odpowiednikiem, choć na podstawie powyższego opisu możnaby wysnuć taki wniosek. Istotnym wstępnym etapem rozpoznawania tekstu jest - jak wspomniano ? ustalenie, co w obrazie strony jest tekstem, a co grafiką np. zdjęciem. Próba rozpoznawania zdjęcia jako tekst, co czasem zdarzało się w starszych programach OCR, prowadziła do powstania w tekście serii całkowicie niezrozumiałych i nielogicznych znaków - program Finereader w najnowszych wersjach nie popełnia już jednak takich błędów lub zdarzają się one sporadycznie.

Optymalnym dla osób niewidomych ustawieniem kreatora eksportu jest pomijanie grafiki w eksportowanym dokumencie - zmniejsza to znacznie objętość końcowego dokumentu.

Docelowy poziom odzwierciedlenia formatowania jest już zależny od charakteru skanowanego dokumentu, ale najczęściej dla zmniejszenia objętości eksportowanego tekstu można je pominąć, co powinno również ustrzec nas przed, mogącymi się czasem pojawić, problemami z czytaniem przez screenreadery tekstu o zbyt bogatym formatowaniu.

Skanowanie to proces tworzenia elektronicznego obrazu dokumentu, a OCR to proces jego rozpoznawania. Co jednak, jeżeli posiadamy już elektroniczny obraz dokumentu, który chcemy przeczytać mową syntetyczną, a który ze względu na swój graficzny charakter jest dla programów odczytu ekranu niedostępny? Mam tu na myśli np. dokument w postaci graficznego pliku .pdf lub serię obrazu stron zapisanych jako obrazy np. JPEG.

Program Finereader umożliwia import takich obrazów do wiązki - zamiast mechanicznej czynności skanowania kolejnych stron. Funkcja "Otwórz obraz" pozwala wczytać jeden lub więcej plików zapisanych na dysku. Proces rozpoznawania i eksportu tekstu z takich obrazów odbywa się analogicznie do dokumentów skanowanych.

Problemem może się okazać zbyt niska, mniejsza niż 300 DPI, rozdzielczość obrazu dokumentu. Do pewnego stopnia można sobie z tym poradzić, korzystając z narzędzia konwersji rozdzielczości obrazu, wbudowanego w aplikację, które automatycznie przetworzy obrazy w wiązce do wskazanej rozdzielczości. Warto zauważyć, że program Finereader posiada wiele wbudowanych mechanizmów poprawy jakości obrazu, jak wykrywanie orientacji obrazu, usuwanie zabrudzeń tła, prostowanie linii tekstu, konwersja do odcieni szarości, które można stosować automatycznie.

Inne często spotykane utrudnienie, to pytanie o hasło dostępu do pliku PDF. Pytanie to pojawia się w przypadku, gdy program próbuje wydobyć tekstową warstwę z zabezpieczonego dokumentu PDF. Rozwiązaniem może okazać się wówczas włączenie w opcjach programu funkcji "Wczytaj PDF jako obraz".

A jeśli nie Finereader, to co?

Poza programem Finereader, istnieją oczywiście również inne alternatywy skanowania i rozpoznawania tekstu - na uwagę zasługują także programy i urządzenia lektorskie.

Programy lektorskie to aplikacje przygotowane specjalnie dla niewidomych użytkowników, zoptymalizowane pod kątem powiększania i/lub czytania tekstu mową syntetyczną. Zaletą takich rozwiązań jest prostota obsługi, dzięki czemu program może być używany nawet przez bardzo początkujących użytkowników komputera, oraz fakt, iż aplikacja lektorska posiada wbudowany syntezator mowy, który w pełni udźwiękawia, zarówno jego obsługę, jak i czytany tekst, nie wymaga zatem dodatkowego czytnika ekranu.

Wady to mniejsza od profesjonalnych aplikacji OCR funkcjonalność oraz możliwość konfiguracji, a także wyższa od OCR cena.

Przykładem programu lektorskiego jest np. Cicero Text Reader firmy Dolphin Computer Access.

Urządzenia lektorskie to rozwiązania integrujące komputer, skaner, program rozpoznawania tekstu i syntezę mowy w jednym urządzeniu. Rozwiązanie to posiada maksymalnie uproszczoną obsługę, a w związku z tym mniejszą od komputera funkcjonalność, choć na ogół daje się przełączyć w tryb pracy, w którym zachowuje się jak zwykły komputer PC - przy zamiarze korzystania w przyszłości z tej funkcji, warto zorientować się, jakich dodatkowych komponentów wymaga urządzenie, dla w pełni dostępnej dla niewidomych pracy w trybie PC. Oprogramowanie czytające tekst, zainstalowane w urządzeniu, może być zintegrowane z programem rozpoznawania znaków i nie oferować możliwości pełnego udźwiękowienia systemu operacyjnego. Warto także zwrócić uwagę na parametry sprzętowe takie, jak ilość pamięci, procesor i dostępna przestrzeń dysku twardego, oraz możliwość ewentualnej rozbudowy.

Ze względu na prostotę obsługi urządzenie lektorskie nadaje się dla osób starszych, które nie zamierzają poznawać tajników obsługi komputera, a jednocześnie chcą korzystać z możliwości automatycznego, bezwzrokowego odczytu tekstów drukowanych.

Poważną wadą tego rozwiązania jest jednak bardzo wysoka cena, sięgająca kilku lub kilkunastu tys. zł.

Przykładami, dostępnych w Polsce, urządzeń lektorskich mogą być: Autolektor firmy Harpo, Multilektor firmy Altix, Poet Compact firmy Baum Retec AG lub Sara firmy Freedom Scientific.

Na zakończenie warto wspomnieć o interesującym rozwiązaniu, które niedawno pojawiło się na polskim rynku - programie KNFB Reader. Jest to aplikacja na telefony komórkowe z systemem Symbian trzeciej edycji, umożliwiająca mobilny odczyt materiałów drukowanych, jak zapewnia producent - nie tylko książek, ale także np. etykiet na opakowaniach, kart menu i innych. Więcej na temat tego rozwiązania możecie przeczytać w Tyfloświecie nr 1 (3) 2009

Grzegorz Złotowicz

Mobile Speak Touch

Mobile Speak Touch

Firma Code Factory, wraz z operatorem Vodafone, podczas Konferencji Techschare w Londynie 17 września 2009, ma zaprezentować nowy produkt - Mobile Speak Touch.

Program ma współpracować z Nokią N97 oraz HTC Touch. Trudno powiedzieć, czy obecność firmy Vodafone na prezentacji pociągnie za sobą wyłączność produktu dla telefonów sieci Vodafone.

Na razie nie wiadomo, kiedy program będzie dostępny w Polsce, jaka będzie jego cena oraz, co najważniejszy, czy będzie umożliwiał pracę z polskimi syntezatorami, szczególnie na HTC Touch. Czekamy na wiadomości od polskiego dystrybutora, firmy Altix.

Źródło: Altix, Code Factory

 

Projekt współfinansowany ze środków Państwowego Funduszu Rehabilitacji Osób Niepełnosprawnych oraz Gminy Miejskiej Kraków