PenFriend - nowy etykietownik głosowy w RNIB

PenFriend - etykietownikEtykietownik Pen Friend_fot. RNIB

Royal National Institute of Blind People wprowadził na rynek nowy etykietownik głosowy ? PenFriend. Urządzenie ma spore szanse stać się przebojem roku. Jego pojawienie się dobrze rokuje dla rozwoju rynku tyflotechnologicznego - wreszcie dostępne zaczynają być praktyczne rozwiązania w przystępnej cenie.

Za około 60 funtów dostajemy aparat, w którym możemy zachować do 70 godzin nazw głosowych, przypisywanych do samoprzylepnych etykiet, przy czym długość poszczegółnego nagrania nie jest ograniczona.

W paczce z PenFriendem otrzymujemy 127 etykiet z nadrukowanym mikroskopijnym kodem paskowym. Dodatkowy zestaw 380 etykiet to koszt około 10 funtów.

Sam PenFriend wyposażony jest w skaner i oprogramowanie do rozpoznawania kodu. Producent ? firma Mantra Lingua i RNIB ? informują, że obsługa urządzenia jest bardzo prosta. Naklejamy etykietę na produkt żywnościowy, lek, płytę czy jakikolwiek inny przedmiot, który chcemy oznaczyć, przykładamy PenFrienda i tworzymy nagranie głosowe. Później, przykładając PenFrienda do etykiety, możemy odsłuchać nagraną informację.

Urządzenie, zasilane dwoma bateriami AAA, można dodatkowo wykorzystywać jako odtwarzacz MP3.

Więcej informacji na temat urządzenia ukaże się niebawem w portalu, po przeprowadzeniu testów.

Drzwi do kultury. Audiodeskrypcja szansą na zwiększenie dostępu osób niewidomych i słabowidzących do sztuk wizualnych

Audiodeskrypcja - szansa na dostęp do sztuki

Fundacja Audiodeskrypcja oraz Fundacja Prawo i Partnerstwo rozpoczęły 24 września,cykl szkoleń w ramach projektu: ?Drzwi do kultury. Audiodeskrypcja szansą na zwiększenie dostępu osób niewidomych i słabowidzących do sztuk wizualnych.? Projekt dofinansowany jest ze środków Ministerstwa Pracy i Polityki Społecznej, z Programu Operacyjnego Fundusz Inicjatyw Obywatelskich.

Do udziału w szkoleniach zaproszone zostały osoby, które uczestniczą w planowaniu i realizowaniu strategii udostępniania dóbr kultury i edukacji kulturowej w instytucjach kulturalnych z województwa podlaskiego. Uczestnicy szkolenia zostaną zapoznani z informacjami na temat rodzajów niepełnosprawności wzrokowej, specyfiki możliwości percepcyjnych osób niewidomych i słabowidzących. Dowiedzą się też, na czym polega tworzenie opisów audiodeskrypcyjnych dzieł plastycznych, scenicznych, filmowych, jakie obowiązują przy tym zasady, jakie są możliwości zastosowania technik multisensorycznych w udostępnianiu dóbr kultury osobom niewidomym i słabowidzącym. Uczestnicy szkolenia pozyskają też informacje na temat dostępnych rozwiązań technologicznych, które umożliwiają stosowanie audiodeskrypcji w galerii, muzeum, teatrze czy operze. W czasie szkolenia analizowane będą także przykłady i formy stosowania audiodeskrypcji w placówkach kulturalnych na świecie.

Do udziału w szkoleniu swoich przedstawicieli (w sumie czternaście osób) zgłosiło dziewięć instytucji:

1. Muzeum Rzeźby Alfonsa Karnego,

2. Galeria im. Sleńdzińskich w Białymstoku,

3. Wojewódzki Ośrodek Animacji Kultury w Białymstoku,

4. Muzeum Przyrody w Drozdowie,

5. Wigierski Park Narodowy,

6. Muzeum Ikon w Supraślu,

7. Muzeum Wojska Polskiego w Białymstoku,

8. Muzeum Podlaskie w Białymstoku,

9. Białostockie Muzeum Wsi.

Szkolenia potrwają 8 dni i obejmą 4 dwudniowe zjazdy (czwartek-piątek) w terminach: 24-25 września, 8-9 października, 22-23 października, 5-6 listopada. Szkolenia są bezpłatne. Odbędą się w hotelu ZEJER, w Barszczewie koło Białegostoku.

Wszelkich dodatkowych informacji udzielają:

Tomasz Strzymiński ? prezes Fundacji Audiodeskrypcja, tel. 500 269 391

Barbara Szymańska ? wiceprezes Fundacji Audiodeskrypcja, tel. 500 093 090

Katarzyna Dziedzik ? członek zarządu Fundacji Audiodeskrypcja, koordynator projektu, tel. 605 580 766

Logo fundacji AudiodeskrypcjaLogo fundacji Prawo i PartnerstwoLogo FIO

Projekt dofinansowany ze środków Programu Operacyjnego Fundusz Inicjatyw Obywatelskich

Produkty firmy Dolphin w wersji 11

Nowe wersje produktów Dolphin 11

Produkty firmy Dolphin Computer Access w wersji 11 zostały zaprezentowane wiosną bieżącego roku, lecz z informacją o nowościach czekaliśmy, aż dowiemy się czegoś więcej o spolszczeniu. Wszystko wskazuje jednak na to, że w chwili obecnej produkty Dolphin w najnowszej wersji nie będą dostępne po polsku.

Poniżej zamieszczamy listę wybranych nowości, wprowadzonych do produktów Dolphin w wersji 11:

? wsparcie dla 64-bitowej wersji Windows Vista (w chwili obecnej mocno niedopracowane, wraz z nowymi aktualizacjami będzie zapewne funkcjonowało coraz lepiej)

? wsparcie dla Windows 7 (wersja publiczna beta)

? możliwość instalacji programu dla wszystkich użytkowników danego komputera - ustawienia osobiste są teraz zapisane w profilu użytkownika

? wsparcie dla MS Internet Explorer 8

? podstawowe wsparcie dla iTunes

? komptybilność z programem Skype w wersji 4

? "gorący klawisz" w przeglądarce internetowej Mozilla Firefox, wyświetlający listę wszystkich zakładek (CAPSLOCK + Q)

? poprawka ogłaszania funkcji paska stanu w programach Word XP & Word 2003

Wersja 11 wykrywa i ogłasza stany takie, jak: "Zastępowanie", "Śledzenie zmian", "Rozszerzanie zaznaczenia" i "Zarejestruj nowe makro", które znajdują się na pasku stanu programu Word.

? nowa aplikacja pomocy ?Pomoc SuperNova?

Zawsze dostępny system pomocy kontekstowej, zapewniający wsparcie dla różnych aplikacji, uruchamiany jest przez naciśnięcie klawiszy CAPS LOCK + F1. Można w nim znaleźć gorące klawisze dla Word XP/2003, SuperNovy, a także porady na temat korzystania z oprogramowania Dolphin dla wybranej aplikacji. Nowy system pomocy będzie wraz z upływem czasu poszerzany o nowe treści, materiały i wsparcie szerokiego wachlarza aplikacji.

? odświeżony wygląd panelu sterowania

Dla użytkowników używających wzroku: nowe ikony przycisków natychmiast informują, co każdy z nich oznacza. Nie ma też znaczenia, jakiego rozmiaru powiększenia się używa, nowe ikony pozostają gładkie i ostre, zapewniając dostateczną widoczność. Dodatkowo każdy przycisk posiada również czytelne etykiety tekstowe.

Dla użytkowników używających udźwiękowienia: nowy panel sterowania zapewnia łatwe lokalizowanie funkcji. Wciskane zakładki menu są tak logicznie rozmieszczone, aby w większym stopniu odzwierciedlać najczęściej używane funkcje.

? jasny, mniej techniczny język

Dzięki modyfikacji słownika łatwiej wywnioskować, już z samej nazwy, do czego służy każda funkcja. Nowa terminologia dokładnie opisuje każdą funkcję, zapewniając nowym i dotychczasowym użytkownikom oprogramowania Dolphin maksimum wygody.

Przykładowe zmiany terminologii: Kursor Dolphin zamiast Wirtualnego Fokusa, Tryb Formularzy zamiast Trybu Interaktywnego, Czytaj Tutaj zamiast Czytania Dokumentów.

? przycisk uruchamiania trybu Przeglądania Liniowego

W wersji 11, użytkownik może myszką kliknąć na nowy przycisk Przeglądania Liniowego. Spowoduje to automatyczne uruchomienie funkcji Przeglądania Liniowego dla przeglądanej aplikacji. Tryb liniowy pozwoli na przeglądanie aktualnie aktywnego okna jako pojedynczej linii przemieszczającej się w poprzek ekranu.

Można szybko zmienić domyślne ustawienie Przeglądania Liniowego na Przeglądanie Liniowe Całego Dokumentu, Przeglądanie Liniowe Dokumentu lub na Przeglądanie Liniowe Dokumentu od Kursora przez wciśnięcie kontrolki znajdującej się blisko przycisku Przeglądania Liniowego na panelu kontrolnym.

? przycisk uruchamiania Doc Reader

Wersja 11 pozwala użytkownikom powiększania na uruchomienie funkcji Doc Reader z panelu sterowania przy pomocy Doc Reader.

Doc Reader umożliwia użytkownikowi utworzenie własnego środowiska do czytania. Można do niego załadować dokumenty, strony Web i inne formy danych tekstowych. Doc Reader daje możliwość zamiany czcionki, jej rozmiaru, kolorów pierwszego i drugiego planu dokumentu oraz zawijania linii.

Nowy Dolphin Pen II

Nowy Dolphin Pen II wprowadza na rynek technologię zapewniającą ochronę przed uszkodzeniem i złośliwym oprogramowaniem.

Dolphin Pen II dystrybuowany jest na dysku USB, podzielonym na partycje. Na pierwszej partycji, posiadającej artybut "tylko do odczytu", znajdują się krytyczne składniki programu powiększającego i programu udźwiękawiającego, które są zabezpieczone przed uszkodzeniem. Druga partycja jest partycja zapisywalną i pozwala użytkownikowi zapisywać własne ustawienia programu i przenosić je z komputera do komputera.

? nowy SAM dla Zarządzania Mową i Urządzeniami Brajlowskimi

SAM (Synthesiser Access Manager) w wersji 2.50 pozwala z łatwością odznaczyć odpowiednie sterowniki niebędące w użyciu lub działające niepoprawnie. Użytkownicy mogą również wyłączyć sterowniki, które nie będą używane, co wpłynie na przyspieszenie uruchamiania programu SuperNova.

? raportowanie o błędach

Jeśli oprogramowanie generuje błąd, użytkownik ma możliwość opcjonalnego i anonimowego wysyłania informacji o tym błędzie do firmy Dolphin. Producent infromuje, że nie są zbierane jakiekolwiek dane osobowe, a raporty służą jedynie pracom zmierzającym do poprawy skuteczności i niezawodności programów Dolphin.

Źródło: Altixhelp, Dolphin Computer Access

ZoomText MagReader z Ivoną

ZoomText z Ivoną

Firma Harpo - dystrybutor programu ZoomText, poinformowała, że do jego wersji z częściowym udźwiękowieniem - ZoomText MagReader, dodawany będzie polski syntezator Ivona - głos Jacek. To zmiana jakościowa - wcześniej polską syntezę do programu ZoomText trzeba było dokupic osobno.

Więcej na stronie Harpo

Źródło: Harpo

Artykuł: Skuteczne skanowanie tekstu

Skanowanie tekstuSkaner_fot. QiLux

Osoby z dysfunkcją wzroku od wielu lat korzystają z różnorodnych dobrodziejstw technologicznych, gdyż na wielu płaszczyznach użytkowania mniej lub bardziej skutecznie, kompensują one brak wzroku. Niezależnie jednak od tego, czy mówimy o najprostszych elektronicznych czujnikach poziomu cieczy w naczyniu, czy też o zaawansowanych rozwiązaniach, łączących w sobie wyspecjalizowane wykorzystanie komputerów i oprogramowania, cechą wspólną technologicznych ułatwień rehabilitacyjnych jest dostarczanie osobie niewidomej lub słabowidzącej informacji z otoczenia, które w inny sposób byłyby dla niej trudno lub całkowicie niedostępne.Patrząc na sprawę z tej perspektywy, można śmiało zaryzykować twierdzenie, że technologia, którą przedstawię w niniejszym artykule, należy do klasyki narzędzi, umożliwiających samodzielny odczyt przez osobę niewidomą tekstu zapisanego czarnym drukiem na papierze, a zatem książek, czasopism, ulotek itp.

Skanowanie tekstu, bo o nim tu mowa, odbywa się w dwóch etapach. Pierwszy z nich, to wprowadzenie do komputera elektronicznego obrazu tekstu drukowanego, które dokonywane jest za pomocą skanera. Urządzenie to, przetwarzając obraz kartki na sekwencję bitów, które mogą być przechowane w pamięci komputera lub zapisane na jego dysku twardym, wykonuje więc pracę analogiczną do ludzkiego oka.

Od cyfrowego obrazu daleka droga do jego odczytu przez program czytający ekran , gdyż aby stało się to możliwe, konieczne jest przetworzenie tego obrazu na zestaw rozumianych przez maszynę znaków, czyli tzw. tekst edytowalny. Tym etapem zajmuje się wyspecjalizowane oprogramowanie typu OCR (z ang. optical character recognition, czyli optycznego rozpoznawania znaków). Rolę skanera porównałem wcześniej do pracy ludzkiego oka, kontynuując to porównanie - program OCR, pełni w tym procesie rolę analogiczną do ludzkiego mózgu, który widziany obraz musi zinterpretować jako drukowany tekst.

Stosując inne porównanie, skanowanie i rozpoznawanie tekstu, jeżeli chodzi o efekt końcowy, jest podobne do przeczytania tego tekstu przez człowieka z kartki papieru i jego ręcznego wpisania z klawiatury w programie edycji tekstu np. MS Word. Są jednak conajmniej dwie istotne różnice między tymi metodami wprowadzania tekstu do komputera: czas trwania i dokładność.

Człowiek czytający tekst z kartki i wpisujący go z klawiatury będzie najprawdopodobniej dokładny, czyli nie popełni zbyt wielu błędów podczas przepisywania tekstu, jednak czas trwania tej operacji, nawet dla kilku stron, będzie długi.

Podczas gdy ręczne wpisywanie tekstu będzie trwało godzinę, komputerowe skanowanie i rozpoznawanie tego samego dokumentu odbędzie się w kilka minut, choć w procesie rozpoznawania tekstu mogą pojawić się pewne błędy.

Maszyna nie podlega zmęczeniu, nie ulega zmiennym nastrojom i nie doświadcza spadków formy w zależności od pogody i osobistych problemów, poza kosztami energii elektrycznej i konserwacji nie generuje żadnych innych, ponadto jest zawsze gotowa do pracy już w kilka sekund lub najwyżej minut od włączenia.

Oczywiście współpraca z człowiekiem ma wiele plusów i bynajmniej nie próbuję w tym miejscu udowodnić, że żywy lektor nie jest lepszy od komputera, warto jednak zauważyć ogromne zasługi maszyn cyfrowych w procesie rehabilitacji i samodzielnego dostępu do tekstu drukowanego.

Jak to działa?

Skaner jest płaskim urządzeniem o wymiarach nieco większych od maksymalnego formatu dokumentu, który może wczytywać, obecnie najczęściej formatu A4, i wysokości kilku centymetrów.

Wskazówka praktyczna: Skaner formatu A4 jest wygodnym i relatywnie niewielkim rozwiązaniem, jednak skanowanie książek, które po rozłożeniu mają większy od A4 rozmiar, wymagać będzie skanowania osobno każdej pojedynczej strony, zamiast dwóch stron jednocześnie, co oczywiście wydłuża czas tej operacji.

Pod pokrywą, znajdującą się w górnej płaszczyźnie urządzenia, umieszczona jest szyba, na której kładziemy dokument do zeskanowania.

Proces skanowania dokonywany jest przez przesuwającą się pod szybą głowicę o szerokości całego dokumentu, składającą się z lampy, emitującej równomierny strumień światła, oraz elementów przechwytujących odbite od skanowanego dokumentu promienie. Badając jakość i natężenie odbitych od dokumentu impulsów świetlnych, procesor skanera buduje na tej podstawie cyfrowy obraz skanowanego dokumentu, który następnie przesyłany jest do komputera.

Wskazówka praktyczna: skanując dokument ,warto dokładnie zamykać pokrywę skanera, aby uniknąć docierania do jego elementów światłoczułych promieni z zewnętrznych źródeł, takich jak oświetlenie w pomieszczeniu lub światło słoneczne.

Przy opisanej metodzie odwzorowania obrazu napotkamy na problemy w przypadku skanowania dokumentów drukowanych na papierze świecowym - właściwości tego nośnika powodują bowiem zaburzenia w odbiciu światła.

Skaner_fot.Pablo Eder Warto również zadbać o równomierne rozłożenie dokumentu na szybie skanera - w przypadku zwykłej kartki jest to dość proste do osiągnięcia, jednak w przypadku książki zwłaszcza nowej lub wielostronicowej, druk znajdujący się w pobliżu grzbietu może odchylać się od szyby skanera, przez co dokładność jego zeskanowania będzie mniejsza. Istnieją jednak na rynku skanery o kształcie szyby specjalnie profilowanym dla skanowania książek.

Technologia użyta do budowy skanera (CIS - tańsza i bardziej miniaturowa, CCD - droższa i dokładniejsza lub PMT - stosowana w drogich skanerach o zastosowaniach profesjonalnych) to kolejny czynnik, mający wpływ na jakość skanu, czyli cyfrowego odwzorowania obrazu analogowego.

A skoro o jakości skanu mowa, nie sposób pominąć rozdzielczości skanowanego obrazu, która jest jej najistotniejszym czynnikiem. Rozdzielczość skanu wyrażana jest w jednostkach DPI (ang. dots per inch, czyli plamki na cal). Oprogramowanie rozpoznawania tekstu wymaga rozdzielczości 300 DPI - zbyt mała rozdzielczość, ale uwaga - również zbyt duża - może negatywnie wpłynąć na jakość rozpoznawania tekstu. Im większa rozdzielczość, tym dłuższy jest czas skanowania pojedynczej strony dokumentu.

Jeszcze jednym czynnikiem wpływającym na dokładność skanu, jest jakość odwzorowania kolorów - dla potrzeb rozpoznawania tekstu drukowanego jest to jednak sprawa drugorzędna, a sugerowana optymalna jakość to, w tym przypadku, odcienie szarości.

Dlaczego warto dołożyć starań dla osiągnięcia optymalnej jakości obrazu skanowanego dokumentu? Ma to kluczowe znaczenie na etapie rozpoznawania tekstu.

Wskazówka praktyczna: często, mimo ustawienia prawidłowych parametrów skanera, jakość skanu okazuje się niewystarczająca. Może to wynikać z samego materiału źródłowego, więc np. słabej jakości druku, lecz także zabrudzeń, które w toku użytkowania mogą się pojawić na szybie skanera. Warto więc dbać o czystość szyby skanera, zamykać jego pokrywę po zakończonym skanowaniu, konserwować szybę urządzenia według wskazówek podanych w jego instrukcji obsługi. Należy również unikać bezpośredniego kontaktu palców z szybą skanera, co jednak w przypadku osób niewidomych może okazać się trudne, a zatem przed rozpoczęciem skanowania warto dokładnie umyć ręce, co powinno wykluczyć powstawanie na szybie zanieczyszczeń, które pogorszą jakość skanu.

Całkowicie niedopuszczalne jest także stawianie jakichkolwiek przedmiotów, zwłaszcza ciężkich lub posiadających ostre kanty lub krawędzie, bezpośrednio na szybie skanera - o ile ślady opuszków palców relatywnie łatwo da się z tej szyby usunąć, to jej trwałe mechaniczne uszkodzenia i zarysowania są w praktyce, bez naprawy serwisowej, nieusuwalne.

Rozpoznawanie tekstu, dokonywane jak już wspomniano, przez oprogramowanie typu OCR, to złożony proces, na który składa się badanie ogólnej struktury każdej zeskanowanej strony, wyodrębnienie z niej fragmentów tekstowych i graficznych, następnie podział obrazu tekstu na pojedyncze znaki i zamiana każdego takiego znaku na jego numeryczny odpowiednik w komputerowej tabeli znaków.

Czasem na tym właśnie etapie pojawia się problem, jeżeli tekst źródłowy wydrukowany jest bardzo nietypową czcionką, mocno odbiegającą od przyjętych standardów, program OCR nie będzie potrafił prawidłowo identyfikować rozpoznawanych znaków. Kłopot może rozwiązać mechanizm tzw. douczania wzorców, które polega na jednorazowym wskazaniu przez użytkownika jakiegoś błędnie rozpoznawanego elementu i określeniu, jaki to na prawdę znak. Rozwiązanie to, choć skuteczne, jest niestety całkowicie niedostępne dla osób niewidomych, gdyż wymaga precyzyjnego zaznaczenia obszaru jakiegoś znaku, co przy pomocy oprogramowania czytającego ekran jest niemożliwe.

Innym wbudowanym w OCR mechanizmem eliminacji błędów w rozpoznawanym tekście są słowniki, które pozwalają programowi wprowadzać korekty źle rozpoznanych słów.

Program Finereader, stanowiący obecnie najskuteczniejsze i z każdą wersją coraz bliższe doskonałości narzędzie OCR, posiada wbudowane słowniki dla ponad 100 języków w tym sztucznych, takich jak np. języki programowania.

Każdy dokument, skanowany i rozpoznawany w programie Finereader, nazywany jest wiązką. Pojęcie to, często zniechęcające początkujących użytkowników do rozpoczęcia pracy z aplikacją, oznacza serię ułożonych w określonej kolejności stron skanowanego dokumentu, np. książki. Każda strona przechowywana jest w wiązce pod dwoma postaciami: jako zeskanowany obraz dokumentu i, rozpoznany na podstawie tego obrazu, tekst.

Skanowanie pierwszej i każdej następnej strony dokumentu oznacza dodanie tej strony na końcu wiązki. Każda strona w wiązce może być następnie edytowana - zarówno w warstwie graficznej, gdzie edycji można poddać zeskanowany obraz, jak również w warstwie tekstowej.

Wskazówka praktyczna: screenreadery mają czasem problem z odczytywaniem tekstowej zawartości strony wiązki w oknie Finereadera. By podglądnąć rozpoznany tekst, można posłużyć się metodą ?zaznacz wszystko, kopiuj, wklej?, co pozwoli na dostęp do zawartości z poziomu Worda czy Notatnika. Taką operację warto wykonać na kilku pierwszych stronach skanowanego dokumentu, aby ustalić, czy rozpoznaje się on w stopniu wystarczająco dokładnym.

Po zeskanowaniu i rozpoznaniu całego interesującego nas dokumentu - np. książki, istnieje kilka możliwości przetworzenia tekstu na postać wygodniejszą i bardziej uniwersalną w użytkowaniu od wiązki, np. dokumentu Word lub pliku tekstowego.

W Finereaderze służy do tego narzędzie Kreatora Eksportu, które pozwala zapisać rozpoznany tekst w pliku (obsługiwane jest wiele formatów dokumentów) lub wykonać inne czynności, np. wysłać go do aplikacji Word.

Na etapie zapisu do pliku rozpoznanego tekstu, można ustalić, w jakim formacie ma być on zapisany (txt, doc i wiele innych), czy obiekty graficzne, jak zdjęcia i rysunki, mają być także zapisywane oraz, jak dalece program ma odwzorowywać formatowanie oryginału.

Zapisywanie grafiki w eksportowanym dokumencie nie oznacza zapisywania skanu każdej strony wraz z jej tekstowym odpowiednikiem, choć na podstawie powyższego opisu możnaby wysnuć taki wniosek. Istotnym wstępnym etapem rozpoznawania tekstu jest - jak wspomniano ? ustalenie, co w obrazie strony jest tekstem, a co grafiką np. zdjęciem. Próba rozpoznawania zdjęcia jako tekst, co czasem zdarzało się w starszych programach OCR, prowadziła do powstania w tekście serii całkowicie niezrozumiałych i nielogicznych znaków - program Finereader w najnowszych wersjach nie popełnia już jednak takich błędów lub zdarzają się one sporadycznie.

Optymalnym dla osób niewidomych ustawieniem kreatora eksportu jest pomijanie grafiki w eksportowanym dokumencie - zmniejsza to znacznie objętość końcowego dokumentu.

Docelowy poziom odzwierciedlenia formatowania jest już zależny od charakteru skanowanego dokumentu, ale najczęściej dla zmniejszenia objętości eksportowanego tekstu można je pominąć, co powinno również ustrzec nas przed, mogącymi się czasem pojawić, problemami z czytaniem przez screenreadery tekstu o zbyt bogatym formatowaniu.

Skanowanie to proces tworzenia elektronicznego obrazu dokumentu, a OCR to proces jego rozpoznawania. Co jednak, jeżeli posiadamy już elektroniczny obraz dokumentu, który chcemy przeczytać mową syntetyczną, a który ze względu na swój graficzny charakter jest dla programów odczytu ekranu niedostępny? Mam tu na myśli np. dokument w postaci graficznego pliku .pdf lub serię obrazu stron zapisanych jako obrazy np. JPEG.

Program Finereader umożliwia import takich obrazów do wiązki - zamiast mechanicznej czynności skanowania kolejnych stron. Funkcja "Otwórz obraz" pozwala wczytać jeden lub więcej plików zapisanych na dysku. Proces rozpoznawania i eksportu tekstu z takich obrazów odbywa się analogicznie do dokumentów skanowanych.

Problemem może się okazać zbyt niska, mniejsza niż 300 DPI, rozdzielczość obrazu dokumentu. Do pewnego stopnia można sobie z tym poradzić, korzystając z narzędzia konwersji rozdzielczości obrazu, wbudowanego w aplikację, które automatycznie przetworzy obrazy w wiązce do wskazanej rozdzielczości. Warto zauważyć, że program Finereader posiada wiele wbudowanych mechanizmów poprawy jakości obrazu, jak wykrywanie orientacji obrazu, usuwanie zabrudzeń tła, prostowanie linii tekstu, konwersja do odcieni szarości, które można stosować automatycznie.

Inne często spotykane utrudnienie, to pytanie o hasło dostępu do pliku PDF. Pytanie to pojawia się w przypadku, gdy program próbuje wydobyć tekstową warstwę z zabezpieczonego dokumentu PDF. Rozwiązaniem może okazać się wówczas włączenie w opcjach programu funkcji "Wczytaj PDF jako obraz".

A jeśli nie Finereader, to co?

Poza programem Finereader, istnieją oczywiście również inne alternatywy skanowania i rozpoznawania tekstu - na uwagę zasługują także programy i urządzenia lektorskie.

Programy lektorskie to aplikacje przygotowane specjalnie dla niewidomych użytkowników, zoptymalizowane pod kątem powiększania i/lub czytania tekstu mową syntetyczną. Zaletą takich rozwiązań jest prostota obsługi, dzięki czemu program może być używany nawet przez bardzo początkujących użytkowników komputera, oraz fakt, iż aplikacja lektorska posiada wbudowany syntezator mowy, który w pełni udźwiękawia, zarówno jego obsługę, jak i czytany tekst, nie wymaga zatem dodatkowego czytnika ekranu.

Wady to mniejsza od profesjonalnych aplikacji OCR funkcjonalność oraz możliwość konfiguracji, a także wyższa od OCR cena.

Przykładem programu lektorskiego jest np. Cicero Text Reader firmy Dolphin Computer Access.

Urządzenia lektorskie to rozwiązania integrujące komputer, skaner, program rozpoznawania tekstu i syntezę mowy w jednym urządzeniu. Rozwiązanie to posiada maksymalnie uproszczoną obsługę, a w związku z tym mniejszą od komputera funkcjonalność, choć na ogół daje się przełączyć w tryb pracy, w którym zachowuje się jak zwykły komputer PC - przy zamiarze korzystania w przyszłości z tej funkcji, warto zorientować się, jakich dodatkowych komponentów wymaga urządzenie, dla w pełni dostępnej dla niewidomych pracy w trybie PC. Oprogramowanie czytające tekst, zainstalowane w urządzeniu, może być zintegrowane z programem rozpoznawania znaków i nie oferować możliwości pełnego udźwiękowienia systemu operacyjnego. Warto także zwrócić uwagę na parametry sprzętowe takie, jak ilość pamięci, procesor i dostępna przestrzeń dysku twardego, oraz możliwość ewentualnej rozbudowy.

Ze względu na prostotę obsługi urządzenie lektorskie nadaje się dla osób starszych, które nie zamierzają poznawać tajników obsługi komputera, a jednocześnie chcą korzystać z możliwości automatycznego, bezwzrokowego odczytu tekstów drukowanych.

Poważną wadą tego rozwiązania jest jednak bardzo wysoka cena, sięgająca kilku lub kilkunastu tys. zł.

Przykładami, dostępnych w Polsce, urządzeń lektorskich mogą być: Autolektor firmy Harpo, Multilektor firmy Altix, Poet Compact firmy Baum Retec AG lub Sara firmy Freedom Scientific.

Na zakończenie warto wspomnieć o interesującym rozwiązaniu, które niedawno pojawiło się na polskim rynku - programie KNFB Reader. Jest to aplikacja na telefony komórkowe z systemem Symbian trzeciej edycji, umożliwiająca mobilny odczyt materiałów drukowanych, jak zapewnia producent - nie tylko książek, ale także np. etykiet na opakowaniach, kart menu i innych. Więcej na temat tego rozwiązania możecie przeczytać w Tyfloświecie nr 1 (3) 2009

Grzegorz Złotowicz

Mobile Speak Touch

Mobile Speak Touch

Firma Code Factory, wraz z operatorem Vodafone, podczas Konferencji Techschare w Londynie 17 września 2009, ma zaprezentować nowy produkt - Mobile Speak Touch.

Program ma współpracować z Nokią N97 oraz HTC Touch. Trudno powiedzieć, czy obecność firmy Vodafone na prezentacji pociągnie za sobą wyłączność produktu dla telefonów sieci Vodafone.

Na razie nie wiadomo, kiedy program będzie dostępny w Polsce, jaka będzie jego cena oraz, co najważniejszy, czy będzie umożliwiał pracę z polskimi syntezatorami, szczególnie na HTC Touch. Czekamy na wiadomości od polskiego dystrybutora, firmy Altix.

Źródło: Altix, Code Factory

Nowe iPody

Premiera nowych iPodów

Firma Apple, na odbywającej się 9 września w San Francisko imprezie ?It?s only rock and roll, but we like it?, zaprezentowała nowe odtwarzacze: iPod Nano z kamerą oraz iPod Touch  z nowym procesorem. Odświeżono również linię kolorystyczną iPodów Shuffle oraz zmodernizowano iPoda Classic.

IPod Nano doczekał się kamery o rozdzielczości 640×480. Nagrywa filmy, nie pozwala jednak na robienie zdjęć. Ponadto doposażono go w większy ekran, radio FM, podręczny dyktafon oraz krokomierz. VoiceOver działa już teraz w polskiej wersji językowej i, jak w najnowszym Shuffle, opiera się na menu i komunikatach generowanych przez iTunes podczas synchronizacji z urządzeniem i nagrywaniu nowej zawartości.

iPod Touch w wersji 32 i 64 GB wyposażony został w oprogramowanie VoiceOver. Najmniejszy 8-gigowy model, z uwagi na słabszy procesor, niestety nie przemówi.

Zmodernizowany iPod Classic, który powrócił z pojemnością 160 GB, ze względu za zastosowanie starych technologii, również nie doczekał się udźwiękowienia.

Sugerowane ceny:

iPod shuffle 2GB ? 229zł

iPod shuffle 4GB ?329zł

iPod nano 8GB ? 599zł

iPod nano 16GB ? 729zł

iPod classic 160GB ? 979zł

iPod touch 8GB ? 899zł

iPod touch 32GB ? 1,199zł

iPod touch 64GB ? 1,599zł.

Źródło: Apple, Appleblog, Mojejabluszko, Makowisko

Nowe oprogramowanie 3.1 dla telefonu Apple IPhone 3GS

Aktualizacja oprogramowania iPhone'a

Firma Apple, na odbywającej się 9 września w San Francisko imprezie ?It?s only rock and roll, but we like it?, zaprezentowała nowe iPhone'y.

Poniżej lista funkcjonalności systtemu ułatwień dostępu, wprowadzonych do oprogramowania 3.1 dla iPhone 3 GS:

? trzykrotne naciśnięcie klawisza ?home? wykonuje zadaną funkcję, dotyczącą uruchamiania/przełączania opcji dostępności takich jak zoom, VoiceOver, czerń i biel itd. - co dokładnie się stanie, można zdefiniować w opcjach uniwersalnego dostępu,

? ćwiczenia z gestów - dostępne również w opcjach uniwersalnego dostępu,

? zaznaczanie, kopiowanie i wklejanie tekstu - opcja już aktywna,

? potrząśnięcie urządzeniem umożliwia wybranie czynności, którą chcemy odwołać,

? wklejanie numerów telefonu - dla tych, których nudzi wpisywanie ich z klawiatury,

Opcje ułatwień dostępu_fot. Apple? ustawianie punktu wstawiania w polu edycji,

? nawigowanie po listach,

? otwieranie linków w wiadomościach e-mail,

? edycja wideo i wideo-memo,

? przycinanie wideo,

? przycinanie wiadomości wideo-memo,

? wsparcie dla załączników PDF,

? Voice Control ze wsparciem Bluetooth,

? poprawki w opcjach posługiwania się mapami,

? usprawnienie kompasu,

? rozszerzone funkcje odtwarzania (dotąd niedostępne).

Apple nie zapomniał również o tych, którzy nie korzystają z ułatwień dostępu i dodał:

? porządkowanie ikon na pulpicie iPhone'a (działa z iTunes 9),

 

? zapisywanie filmów przesłanych mailem i MMS-em do pamięci telefonu,

? możliwość zapisywania nowego klipu podczas przycinania filmów bezpośrednio w iPhone'ie/iPodzie Touch,

 

? poprawiona obsługa WiFi podczas pracy Bluetooth,

? anti-phishing w Safari,

 

? poprawiona współpraca z Microsoft Exchange (w szczególności synchronizacja kalendarzy).

Na polskich stronach Apple znalazł się dział poświęcony opcjom dostępności IPhone 3 GS.

Źródło: Apple, Mojejabluszko, Makowisko

Wolne miejsca na szkoleniach z języka angielskiego oraz informatyki

Fundacja Instytut Rozwoju Regionalnego zaprasza na kursy informatyki (podstawowej i zawansowanej) oraz języka angielskiego (poziom podstawowy).

Zapisy już trwają.

Wszystkie zajęcia odbywają się w siedzibie Fundacji przy ul. Wybickiego 3a w Krakowie.

Udział jest całkowicie bezpłatny, wszystkie kursy rozpoczynają się we wrześniu 2009.

Dla osób spoza Krakowa istnieje możliwość zwrotu kosztów dojazdu. Zapewniamy pomoc w dotarciu do miejsca zajęć z dworca PKP/PKS w Krakowie.

Wszelkich informacji udziela i zapisy przyjmuje Karolina Grzebieniowska pod numerem telefonu 0663883337, email: Karolina.Grzebieniowska@firr.org.pl

Poniżej zamieszczamy informację na temat każdego z kursów.

1. ANGIELSKI PODSTAWOWY

Kurs trwa 60 godzin dydaktycznych. Zajęcia odbywają się w soboty w godzinach 9:00 - 14:30 i trwają do końca listopada.

Program kursu obejmuje naukę od "od zera".

Warunkiem uczestnictwa jest posiadanie aktualnego orzeczenia o niepełnosprawności wzroku.

2. INFORMATYKA ZAAWANSOWANA

Kurs trwa 40 godzin dydaktycznych. Zajęcia odbywają się w piątki w godzinach 9:00 - 14:30 i trwają do końca października.

Zajęcia informatyczne obejmują (w dużym skrócie):

  • MS Word: przypomnienie podstawowych informacji z Worda - (zakładki, słowniki, wyszukiwanie, przeskoki do strony, hiperłącza itp.),

  • MS Excel: przypomnienie podstawowych infomacji z Excela, tworzenie arkuszy i skoroszytów, poruszanie się między arkuszami i skoroszytami, specjalne funkcje edycyjne, formaty i rodzaje komórek, formuły i odwołania, funkcje, parametryzacja wydruków, możliwe zastosowania programu,

  • Internet: wyszukiwanie informacji i bezpłatnego oprogramowania w Internecie, przeglądarki internetowe, zagrożenia w internecie, wiarygodność informacji, korzystanie z Outlook Express itp.

  • bankowość internetowa: wygoda i zagrożenia związane z dostępem do konta bankowego za pomocą nowoczesnych kanałów dostępu, zabezpieczenia stosowane przez banki, bezpieczeństwo własnego komputera, programy typu firewall, antywirusowe i antyspyware a ich dostępność dla programów czytających, logowanie się do banku i korzystanie z dostępnych usług itp.,

  • zakupy przez Internet: serwisy, bezpieczeństwo, wiarygodność sprzedawcy itp.

W przypadku zainteresowania grupy innym zagadnieniem związanym z obsługą komputerów, jest możliwość wprowadzenia go do programu szkolenia.

Warunkiem uczestnictwa jest posiadanie aktualnego orzeczenia o niepełnosprawności wzroku.

3. INFORMATYKA PODSTAWOWA

Kurs trwa 40 godzin dydaktycznych. Zajęcia odbywają się w niedziele w godzinach 9:00 - 14:30 i trwają do końca października.

Program kursu przewiduje naukę całkowicie "od zera" - czyli, aby w nim uczestniczyć, nie trzeba potrafić nawet włączyć komputera. Wszystkiego można się nauczyć na kursie. Prowadzi fundacyjny instruktor Marcin. W programie MS Windows, oprogramowanie udźwiękawiające (Jaws), powiększające, pakiet MS Office, poczta elektroniczna, Internet itp.

Warunkiem uczestnictwa jest posiadanie aktualnego orzeczenia o niepełnosprawności wzroku oraz zamieszkanie na terenie miasta Krakowa.

 

Projekt współfinansowany ze środków Państwowego Funduszu Rehabilitacji Osób Niepełnosprawnych oraz Gminy Miejskiej Kraków