Programowa strona dźwięku – Tomasz Bilecki

Obserwując zmiany w coraz to nowych systemach operacyjnych, możemy się dowiedzieć, jak piękna, prosta i użyteczna według producenta ma być najnowsza wersja okienek. Z drugiej strony czujni użytkownicy przy niemal każdej zmianie zwracają uwagę na wszelkiego rodzaju marketing, który ma odwrócić uwagę od ewentualnych niedociągnięć, prób pozyskania jak największej ilości danych od użytkowników itd. W całym zamieszaniu, związanym ze zmianą wyglądu, sposobu działania, zwiększeniem lub zmniejszeniem używanych zasobów, bądź wolności dla użytkownika, prawie nikt nie zwraca uwagi na to, co się dzieje z obsługą kart dźwiękowych, a przez lata działo się sporo.
Artykuły w najnowszym Tyfloświecie pozwolą obalić kilka mitów, które w świadomości użytkowników pecetów zagościły dawno temu i z których producenci tacy jak Creative czy Asus czerpią sporo korzyści. Chodzi mianowicie o przekonanie, że aby w miarę przyzwoicie nagrać ludzki głos, na potrzeby choćby podcastu czy radia internetowego, konieczna jest niemała inwestycja w dodatkowe oprzyrządowanie. Drugi mit opiera się na przekonaniu, że wbudowane w płyty główne karty dźwiękowe nie nadają się absolutnie do niczego więcej niż obsługa komunikatorów internetowych. Pomijając fałsz powyższych twierdzeń, należy w tym miejscu dodać, że i programowo w obecnych czasach można nie mało poprawić. Takie programy jak Skype co jakiś czas podnoszą jakość rozmów i dzięki temu stawiają coraz większe wymagania dla używanych mikrofonów, głośników czy też kamer internetowych, jeśli oczywiście użytkownik chce wykorzystać pełnię ich możliwości. Dodatkowym bodźcem do poprawy jakości wysyłanego w globalną sieć dźwięku może być fakt, że mniej więcej półtora roku temu Internet Engineering Task Force, czyli organizacja tworząca standardy sieciowe zaakceptowała nowy kodek dźwiękowy – OPUS, który znacząco poprawia jakość przesyłanego głosu w programach typu VOIP. Oznacza to, że w niedalekiej przyszłości niektóre aplikacje do komunikacji głosowej będą przesyłały dźwięk o jakości bliskiej spotykanej na płytach kompaktowych. W tym artykule zajmę się stroną programową wysyłanego dźwięku, tj. takim ustawieniem systemu, aby jak najlepiej wykorzystać potencjał posiadanego sprzętu audio.

WASAPI – mała rewolucja

Zacznijmy od faktu, że wraz z pojawieniem się Windows Vista Microsoft wprowadził nowy protokół obsługi audio pod nazwą WASAPI (Windows Audio Session API), który pozwala na znacznie bardziej elastyczne zarządzanie sygnałem audio. W związku z tym przebudowanych zostało kilka aplikacji systemowych, zajmujących się obsługą dźwięku takich jak “Regulacja głośności” czy aplet “Dźwięk” w „Panelu sterowania”.

Poprawiamy to, co producent zepsuł

Na początku warto zająć się ustawieniami karty tak, aby jak najlepiej wykorzystać potencjał posiadanego sprzętu. W tym celu najlepiej odwiedzić „Panel sterowania” i odszukać pozycję “Dźwięk”. Można to zrobić, wpisując w pole wyszukiwania, które otwiera się domyślnie po wciśnięciu klawisza “Windows” wyraz “Dźwięk” i wyszukać w wynikach “Panel sterowania, dźwięk”. Kiedy już otworzymy wspomniany wyżej aplet, znajdziemy wewnątrz cztery zakładki.
Pierwsza z nich służy poprawie odtwarzania i zawiera listę urządzeń, przy czym nie chodzi tutaj o karty dźwiękowe, a raczej o wszystkie widoczne możliwości wyprowadzenia dźwięku, np. w większości chipów Realtek urządzeniem jest wyjście słuchawkowe, a osobno widoczne jest wyjście cyfrowe. Ponadto, jeśli nasz komputer wyposażony jest w kartę graficzną, posiadającą wyjścia HDMI, każde z nich będzie widoczne jako osobne urządzenie. Tak samo będzie ze słuchawkami na USB, ponieważ takie słuchawki mają wbudowaną kartę dźwiękową. Każda z pozycji na liście ma swoje menu kontekstowe, w którym interesujących jest kilka pozycji, przede wszystkim “Ustaw jako urządzenie domyślne” oraz “Ustaw jako domyślne urządzenie komunikacyjne”. Pierwsza opcja ustawia wszystkie dźwięki systemowe, muzykę, dźwięki w przeglądarce itd. na wybraną na liście kartę. Druga opcja kieruje dźwięki z aplikacji w rodzaju Skype i podobnych na wybrane urządzenie. Warto odwiedzić jeszcze pozycję “Właściwości”, gdzie można czasami całkiem nieźle podrasować dźwięk wychodzący z komputera, albo przeciwnie, wyłączyć denerwujące nas ulepszenia.

Zacznijmy wreszcie coś zmieniać

Właściwości to kolejne okno dialogowe z zakładkami. Pierwsza z nich, najmniej ciekawa jeśli chodzi o jakość dźwięku, to “Ogólne”. Można tu zmienić nazwę, pod którą wyświetlana jest karta, włączyć ją lub wyłączyć i w zasadzie tyle. Dalej pojawiają się przysłowiowe schody, ponieważ w przeciwieństwie do Win XP w siódmej wersji okienek producenci sterowników mogą ingerować w zawartość okna. Jeśli deweloper nic swojego nie dodał, następna zakładka to “Poziomy”, czyli nieco zmieniony odpowiednik regulacji głośności z Windows XP i starszych. W zależności od karty, regulować głośność wychodzących dźwięków syntezatora MIDI. W przypadku niektórych kart możemy podsłuchiwać mikrofon itd. Kolejna zakładka to “Ulepszenia”. Tutaj możemy dość mocno ingerować w dochodzący do naszych uszu dźwięk. Pierwszym elementem w zakładce jest lista wielokrotnego wyboru z wyszczególnionymi efektami, które będą wysyłane do naszych głośników bądź słuchawek. Microsoft zaimplementował kilka efektów w systemie i, jeśli karta nie posiada własnych, pojawią się tutaj właśnie te wbudowane w Windows. Klawiszem spacji zaznaczamy bądź odznaczamy każdy efekt, przy czym możliwe jest użycie kilku efektów jednocześnie. Następna kontrolka to pole wyboru “Wyłącz wszystkie ulepszenia”. Jak sama nazwa wskazuje dezaktywuje ono wszystkie efekty, przy czym ciekawostką jest fakt, że odznaczenie na liście wszystkich efektów nie zawsze wyłącza faktycznie wszystko. Prócz tego, jeśli to pole wyboru jest nieoznaczone, odrobinę zwiększa się responsywność syntezatorów mowy, właśnie z uwagi na wyłączenie mechanizmu generowania efektów, który potrzebuje chwili na działanie. Ostatnia zakładka to “Zaawansowane”. Ustawia się tutaj częstotliwość próbkowania i głębię bitową dźwięku. Warto wspomnieć, że nie ma jednego, dobrego ustawienia. Niektóre aplikacje działają lepiej, gdy mamy np. 44,1kHz, inne nie mają problemów przy 48kHz. Trudności mogą objawiać się trzeszczeniem, nagłym pogorszeniem jakości, czasem brakiem dźwięku, a w ekstremalnych sytuacjach program przy nie odpowiadającej mu częstotliwości próbkowania, względnie głębi bitowej może się zawiesić. Ostatnie pole wyboru w tej zakładce, które umożliwia aplikacjom przejmowanie wyłącznej kontroli nad kartą, lepiej odznaczyć, ponieważ w przypadku odpowiednio napisanego programu wszystko inne wraz z syntezatorem mowy, o ile nie jest to syntezator sprzętowy, jak np. Apollo, może zamilknąć do wyłączenia tego programu.

Nie wszyscy lubią standardy

Wspomniałem już, że producenci mogą ingerować w wygląd tego okna, np. niektóre karty firmy Creative dodają swoje zakładki jak na przykład “Tonowo”, gdzie możemy regulować zawartość niskich i wysokich tonów lub “Soundblaster”, która pozwala na ustawienia specyficzne dla kart z rodziny SB. Creative usuwa również zakładkę “Ulepszenia”.

Poprawiamy dźwięk z mikrofonu

Jedną z zakładek apletu jest “Dźwięk”, tzn. “Nagrywanie”. Tutaj mamy chyba najwięcej zmian w stosunku do poprzednich wersji Windows. Pierwszą kontrolką jest, tak samo jak w zakładce „Odtwarzanie”, lista urządzeń. Tutaj każde wejście karty jest traktowane jako osobna pozycja i tak jeśli jesteśmy posiadaczami chipsetu Realteka, na liście zobaczymy np. „wejście liniowe”, „wejście mikrofonowe” itd. Mało tego. Każdy program, który ma możliwość wyboru urządzenia, z którego będzie nagrywać, również widzi każde wejście jako osobne urządzenie. Daje to naprawdę duże możliwości, które są nie do osiągnięcia chociażby w Win XP. Możemy na przykład jednym programem nagrywać mikrofon, drugim dźwięki systemu, syntezator itd. Wyłączone urządzenia nie będą widoczne na liście. Tak stanie się na pewno w przypadku znaczącej większości chipsetów Realteka, gdzie stereomix, czyli możliwość nagrywania tego, co słychać w głośnikach jest wyłączona. Aby pokazać wszystkie urządzenia, należy ustawić zaznaczenie na jakiejkolwiek pozycji listy, wejść w menu kontekstowe i nacisnąć Enter na pozycji “Pokaż wyłączone urządzenia”. Jak by tego było mało, część kart dźwiękowych potrafi zasygnalizować systemowi operacyjnemu, czy do wejścia mikrofonowego rzeczywiście jest coś podłączone. Jeśli nie, to urządzenie pokazuje się jako odłączone. Aby pokazać również te odłączone urządzenia, np. żeby ustawić ich właściwości, należy w tym samym menu kontekstowym włączyć opcję “Pokaż odłączone urządzenia”. Często również bywa tak, że podłączenie nawet względnie dobrego mikrofonu do gniazda karty dźwiękowej skutkuje dźwiękiem dość wątpliwej jakości. Dzieje się tak dlatego, że w tych kartach domyślnie jest włączona opcja redukcji szumów. Niestety kilka nowszych kart wbudowanych w płyty główne ma przetworniki tak słabej jakości, że w tym przypadku odszumienie ma sens. Aby pozbyć się tego algorytmu w Windows XP, trzeba było wchodzić w niejednokrotnie niedostępny panel zarządzający kartą dźwiękową i w zależności od urządzenia przejść w odpowiednie miejsce i wyłączyć stosowną opcję. Na szczęście nowe wersje systemu, tak samo jak w przypadku odtwarzania dźwięku mogą również ingerować w nagrywanie. Aby wyłączyć ewentualne odszumianie, bądź inne quasi ulepszenia, wchodzimy w menu kontekstowe i tak jak w poprzedniej zakładce uruchamiamy właściwości.

Właściwości

Okno „Właściwości” to również okno dialogowe z zakładkami, z których pierwsza wygląda niemal tak samo jak we właściwościach dowolnego urządzenia odtwarzającego. Następną zakładką jest “Nasłuchiwanie”, gdzie możemy odtworzyć w czasie rzeczywistym to, co się nagrywa przez wybrane urządzenie. Trzecia zakładka nosi nazwę “Poziomy”. Tutaj można wyregulować poziom głośności nagrywania. Do dyspozycji mamy suwak oraz dodatkowo listę rozwijaną, dzięki której można jeszcze bardziej wzmocnić głośność nagrywania, o ile maksymalne ustawienie suwaka nie daje wystarczającej głośności. Zakładka „Ulepszenia” oferuje możliwość wyłączenia efektów nałożonych na mikrofon. Na marginesie warto odnotować, że niejednokrotnie można się bardzo pozytywnie zdziwić, jak dobrej jakości mikrofony są wbudowywane w laptopy i jak ta jakość jest dosłownie masakrowana przez algorytmy redukcji szumów. W tym miejscu druga uwaga, czasami pole wyboru “Wyłącz wszystkie ulepszenia” powoduje problemy np. z kanałami i autorowi znany jest komputer, w którym trzeba było odznaczyć wszystkie pozycje z listy efektów, ale zostawić niezaznaczone pole wyboru wyłączające ulepszenia. Innym razem trafił się laptop, w którym odznaczenie pozycji z listy nie dawało zbyt wielkiej poprawy jakości, za to pole wyboru wyłączające efekty dokonywało wręcz cudów. Ostatnia zakładka “Zaawansowane” działa, praktycznie rzecz biorąc, tak samo jak analogiczna pozycja we właściwościach odtwarzania.
Warto wspomnieć jeszcze o regulacji głośności w Windows 7 i wyżej. W starszych wersjach Okienek, by ją odnaleźć, należało wejść w menu „Start-Programy-Rozrywka-Akcesoria”. Windows 7 uprościł sprawę i w tzw. szufladzie systemu jest coś, co screenreadery nazywają różnie, np. „Głośnik”. Otwarcie menu kontekstowego na tej pozycji i wybranie “Otwórz mikser głośności” skutkuje pokazaniem zmodyfikowanej wersji regulacji głośności. Główna zmiana polega na tym, że możemy modyfikować głośność każdej aplikacji. W związku z tym, jeśli denerwują nas głośne reklamy na stronie, które zagłuszają syntezator, zwyczajnie zmniejszamy głośność przeglądarki lub zwiększamy poziom głośności screenreadera.

Nie samym Windowsem człowiek żyje

Na samym końcu warto jeszcze wspomnieć o systemie Android, który mimo różnych niedociągnięć dostępnościowych zdobywa coraz więcej zwolenników. Jak wiadomo, aplikacji typu dyktafon na telefony komórkowe jest dość sporo. Część z nich umożliwia wybór mikrofonu. Tutaj można by się zapytać, po co? Okazuje się, że Android, w przeciwieństwie do systemu od Microsoftu nie daje użytkownikowi pełnego dostępu do karty dźwiękowej. Zamiast tego posiada kilka trybów dostępu do mikrofonu, które sugerują wykorzystanie go w różnych scenariuszach. Takimi trybami są m.in. „Voice”, „Mic”, „Cam”, „Default” czy „Call”. W zależności od producenta smartfonu stosowanie różnych trybów powoduje nakładanie różnych efektów na mikrofon. Jakby tego było mało, każdy producent może zastosować inne efekty na ten sam tryb. przykładowo bardzo tani telefon Kazam 3 w trybie „Cam” stosuje algorytm odszumiania oraz lekkie wyrównanie głośności. Samsung Galaxy S3, który posiada dwa mikrofony korzysta z obu na raz w konfiguracji stereo, bez żadnych algorytmów odszumiających, ale również włącza wyrównywanie głośności. Nexus 4 nie stosuje praktycznie żadnego wyrównywania głośności, nie używa też algorytmów niwelujących szumy. W wielu telefonach tryb “Default” powoduje wyłączenie wszelkich algorytmów ulepszających dźwięk, ale mało która aplikacja służąca do rejestracji dźwięku ten tryb wspiera. W przypadku iOS to sprawa jeszcze prostsza. Mikrofonu można użyć albo w jakości telefonicznej z włączonym odszumiaczem, albo bez odszumiacza, w jakości CD, za to z użyciem algorytmu odcinającego niskie częstotliwości. Krążą legendy, że ten filtr da się wyłączyć i faktycznie powstała jedyna, o ile mi wiadomo, aplikacja, która ten algorytm pomija. Nazywa się Fire2 i kosztuje kilka Euro. Niestety od jakiegoś czasu nie jest dobrze dostępna dla VoiceOver.

Na zakończenie

Podsumowanie nie będzie nazbyt optymistyczne. Patrząc na tendencje panujące w systemach mobilnych, również i producenci desktopowych systemów operacyjnych będą raczej dążyć do minimalizacji opcji. Świadczyć o tym może fakt, że w Windows 7 nie odnajdziemy nigdzie możliwości zmiany domyślnego syntezatora MIDI, który dało się zmienić jeszcze w Windows XP. W systemie od Google w ogóle nie mamy opcji odnoszących się do dźwięku w ustawieniach systemowych i producenci aplikacji sami muszą zatroszczyć się o odpowiednie ustawienia, jeśli chcą dać użytkownikowi możliwość zmian. Na obecną chwilę, przynajmniej w systemach z rodziny Windows, chętni, by poprawić jakość swojego dźwięku na szczęście mogą tego dokonać. Pozostaje mieć nadzieję, że sytuacja ta nie ulegnie zmianie.

Programowa strona dźwięku – Tomasz Bilecki

WASAPI – mała rewolucja

Poprawiamy to, co producent zepsuł

Zacznijmy wreszcie coś zmieniać

Nie wszyscy lubią standardy

Poprawiamy dźwięk z mikrofonu

Właściwości

Nie samym Windowsem człowiek żyje

Na zakończenie

Partnerzy

REDAKTOR NACZELNY

REDAKTORZY

SIEDZIBA REDAKCJI