Artykuł: RoboBraille - darmowa konwersja tekstu na mowę

Książki elektroniczne, któż z nas z tego nie korzysta? Metoda cyfrowego zapisu tekstu, początkowo przydatna tylko i wyłącznie niewidomym, budzi coraz większe uznanie wśród w pełni sprawnych użytkowników komputerów, a także innych elektronicznych urządzeń, nierzadko dedykowanych tylko i wyłącznie czytaniu elektronicznych publikacji. Idąc krok dalej, powstawać zaczęły tzw. audiobooki, czyli książki dźwiękowe. I tak, jak w przypadku e-booków, początki tego typu wydawnictw to główne zastosowanie ich przez inwalidów wzroku. Niegdyś nagrywane na kasetach, dźwiękowe książki wraz z postępem technologicznym ewoluowały, przybierając również cyfrową formę. Z biegiem czasu zmieniła się także metoda przygotowywania takich materiałów.

Kiedyś, do nagrania audiobooka niezbędne było profesjonalne studio, wyposażone w drogi sprzęt, a także lektor, który również liczył sobie nie mało. W XXI wieku, z profesjonalnych lektorów bynajmniej nie zrezygnowano, rośnie im jednak niemała konkurencja, w postaci lektorów komputerowych. Głos syntetyczny mimo, że jeszcze sporo brak mu do naturalności głosu ludzkiego, z powodzeniem jest już od kilku lat wykorzystywany w tworzeniu dźwiękowych wersji książek. Synteza staje się coraz lepsza, bo też i komputery przyspieszają, a co za tym idzie umożliwiają przetwarzanie znacznych ilości danych, nie wdając się bowiem w techniczne szczegóły nadmienię jedynie, że ludzko brzmiące syntezatory mowy wymagają wykonania wielu skomplikowanych obliczeń w czasie rzeczywistym, na co trzeba wielu taktów zegara procesora i megabajtów pamięci.

Osoba niewidoma zwykle wyposażona jest w odpowiednie oprogramowanie, które umożliwia odczytywanie tekstu, znajdującego się na ekranie komputera. Jednak i w tym przypadku zachodzi niekiedy konieczność, by wspomóc się książką zapisaną w postaci pliku MP3. Przykładem niech będzie choćby wielogodzinna podróż, w której skazani jesteśmy tylko i wyłącznie na to, co zmieścimy na naszym, niekoniecznie udźwiękowionym, odtwarzaczu MP3.

By przetworzyć plik tekstowy na mowę syntetyczną, niezbędne okażą się dwa komponenty:

- Syntezator mowy ? to właśnie dzięki niemu wygenerujemy głos, którego będziemy mogli później posłuchać jako pliku MP3,

- Odpowiednie oprogramowanie konwertujące ? tak, jak podstawowy warsztat niewidomego oprócz syntezy składa się także z czytnika ekranu, tak i w tym przypadku niezbędne jest oprogramowanie, które pokieruje całym procesem.

Jeśli chodzi o dobrze brzmiącą mowę syntetyczną w wersji darmowej, sytuacja nie przedstawia się zbyt różowo. Syntezatory, których głosy zbliżone są do ludzkich to produkty komercyjne, za które trzeba uiścić mniejszą lub większą opłatę. Oczywiście, jeśli ktoś chce, może zawsze skorzystać z darmowego syntezatora eSpeak, którego mowa jest zrozumiała, choć głos nie należy do najprzyjemniejszych dla ucha. Jeśli chodzi o drugą część duetu, czyli oprogramowanie do tworzenia audiobooków, można posłużyć się darmowym narzędziem o nazwie DSpeech.

RoboBraille, bo można prościej

Tym z czytelników, którym powyższy wstęp wydał się zanadto skomplikowany, uprzejmie donoszę, że od jakiegoś czasu na rynku funkcjonuje zdecydowanie prostsza, a przede wszystkim darmowa alternatywa.

Serwis RoboBraille.org, bo o nim mowa, to darmowa, dla niekomercyjnego użytku, usługa, dzięki której przetworzymy nasz dokument tekstowy na mowę syntetyczną.

Wystarczy wysłać e-mail.

Konto poczty elektronicznej, z którego skorzystamy w kontaktach z RoboBraille, to w obecnych czasach dobro powszechne. Aby przetworzyć plik tekstowy na mowę, wystarczy załączyć go do wiadomości e-mail, którą wysyłamy na adres: mowa@robobraille.org

Podany adres wygeneruje plik wynikowy w języku polskim, jednak RoboBraille potrafi konwertować tekst na mowę w wielu językach, pełna ich lista dostępna jest w tym miejscu. Po wysłaniu pliku, wystarczy już tylko odczekać (uwaga, w przypadku dużych dokumentów nawet i kilka godzin!), a rezultat w postaci odsyłacza do naszego dokumentu w dźwiękowej postaci zostanie nam dostarczony mailem zwrotnym.

Zalety serwisu

Do niewątpliwych zalet RoboBraille należy prostota. Cóż skomplikowanego bowiem jest w wysłaniu maila i poczekaniu na wynik przetworzenia? Nic, i gdyby wszystko działało tak pięknie, nie miałbym najmniejszych zastrzeżeń.

Niestety, RoboBraille ma kilka wad

Najpewniej jest dostarczać pliki wejściowe w postaci dokumentów MS Word. W przypadku zwykłych plików tekstowych, niektóre polskie znaki nie są interpretowane prawidłowo. Serwis teoretycznie interpretuje także i inne formaty dokumentów, np. RTF, mi jednak, mimo kilku prób, nie udało się zmusić RoboBraille?a do przekształcenia na mowę pliku o takim rozszerzeniu.

Niestabilność serwisu to jego kolejna wada. Kilka razy zdarzyła mi się sytuacja, w której wysłane do niego pliki zwyczajnie nie zostały przekonwertowane, bez jakiegokolwiek komunikatu o błędzie. Być może to wina mojej skrzynki pocztowej lub problemów z łącznością, fakt pozostaje jednak faktem, że w przypadku innych serwisów nie miewałem takich kłopotów.

RoboBraille to usługa wykorzystująca pocztę elektroniczną, a zatem aż się prosi o dodanie choćby podstawowej możliwości sterowania syntezatorem za pomocą np. pola ?temat wiadomości?. Przede wszystkim chodzi mi o prędkość mowy, która, moim zdaniem, może być zbyt duża dla początkującego użytkownika. Osobiście nie mam problemów z rozumieniem tekstów generowanych przez serwis, na ile to jednak efekt wieloletniego obcowania z głosem syntetycznym, a na ile przystępność mowy, ciężko mi obiektywnie ocenić.

Co jeszcze potrafi RoboBraille?

W polskiej wersji językowej niewiele. Użytkowników urządzeń lektorskich, zainteresuje pewnie możliwość tworzenia książek DAISY.

Więcej umożliwiają zagraniczne narzędzia, które, pozostaje mieć nadzieję, niebawem okażą się dostępne także dla polskich użytkowników.

Podsumowanie

Idea serwisu, od kiedy tylko została zaprezentowana, jawi się jako bardzo prosta, wręcz oczywista. Można jedynie zadawać sobie pytanie, dlaczego nikt tego wcześniej nie wymyślił? Skoro jednak mamy takie narzędzie, które mimo kilku wad wydaje się być całkiem użyteczne, nie pozostaje mi nic innego, jak zachęcić czytelników do korzystania z niego. Książki audio to bardzo przyjemna rzecz, która w wielu przypadkach może umilić nam spędzanie wolnego czasu. Dzięki RoboBraille stworzenie dźwiękowych dokumentów okazuje się jeszcze prostsze, o ile, rzecz jasna, serwis w danym momencie nie zapragnie zrobić sobie przerwy.

 

 

Projekt współfinansowany ze środków Państwowego Funduszu Rehabilitacji Osób Niepełnosprawnych oraz Gminy Miejskiej Kraków