Artykuł: Odszumiamy

Jeszcze do niedawna żyłem w przeświadczeniu, że odszumianie zapisów ścieżek dźwiękowych programami kosztującymi mniej niż 1000 zł, zwłaszcza bez odpowiedniej wprawy, nie ma najmniejszego sensu. Moje przekonanie wzięło się chyba stąd, że do tej pory, moje doświadczenie w tej materii opierało się jedynie na narzędziu WaveEditor, dostarczanym z pakietem Nero. O programie tym można powiedzieć wszystko, lecz z pewnością nie to, że efekt odszumiania jest zadowalający. Słyszałem kilkukrotnie od różnych osób, że dobre rezultaty w odszumianiu daje stosunkowo niedrogi, a przy tym, dzięki skryptom iplikom konfiguracyjnym, dostępny dla nas, edytor Goldwave. Początkowo nie chciałem wierzyć, bo kto przy zdrowych zmysłach umieszczałby zaawansowany technicznie algorytm w programie za tak niewielką cenę? Postanowiłem to sprawdzić!

Zdjecie przedstawia Audacity pod Windowsem_fot. ProducentUruchomiłem Goldwave?a, zapoznałem się z dostępnymi opcjami, wcisnąłem ?F4?, czyli ?preview? (podgląd), i... siła moich argumentów nieco osłabła? Goldwave okazał się być wyposażony w całkiem przyzwoity algorytm.

Odszumianie zaczyna się od tzw. bramki szumów. Pewnie niejeden czytelnik pamięta magnetofony z takimi funkcjami, jak Dolby b/c czy s, ewentualnie DBX. Funkcja ta polegała na tym, że dźwięk, jeśli jego głośność była niższa niż zadana wartość, był całkowicie wyciszany. Istnienie takiej procedury opierano na założeniu, że na tym poziomie głośności, na którym występuje szum, nie ma wielu użytecznych sygnałów, więc można te elementy wyciszyć. Oczywiście nie jest to takie proste, jak by się wydawało, gdyż nie tak łatwo oddzielić dwa dźwięki, nagrane w różnej głośności, kiedy odtwarzane są równocześnie.

Potem ktoś wpadł na pomysł, że przecież można ten sygnał podzielić na kilka pasm tak, jak to robią korektory graficzne, których ubogie wersje znajdują się w niemal każdym magnetofonie średniej klasy. W ten sposób da się już nieco dokładniej oddzielić szum od sygnału, ponieważ mają one różną głośność na różnych częstotliwościach. Zdarza się, że, z różnych przyczyn, przez jakiś czas w nagraniu nie występują wysokie tony. Czasem jest to spowodowane uszkodzeniem kasety, a czasem nagranymi odgłosami typu ?pod wodą?.

Okno główne programu Goldwave_fot. ProducentStopniowo zwiększano ilość tych pasm, ale i tak najbardziej zaawansowane Dolby A, które miało cztery takie pasma zostało już dość dawno wycofane. Rozpoczęła się era techniki cyfrowej i niemal wszystkie programy odszumiające wyposażono w FFT - Fast Fourier Transform. Na FFT oparta jest większość kodeków kompresji stratnej, czyli MP3, WMA itd. Najprościej zasadę działania FFT można opisać w następujący sposób: sygnał dzielony jest, nie jak w korektorze na pięć, piętnaście albo trzydzieści pasm, ale np. na tysiąc pasm. Dzięki temu istnieje możliwość operowania na bardzo wąskich pasmach częstotliwości i dokładnego ustawienia pasma szumu (o ile decybeli szumy mają być wyciszane, przy jakim poziomie głośności itd.) Duże możliwości, prawda? Chciałbym jednak zobaczyć kogoś, kto ustawi wszystkie te tysiąc pasm, sprawdzając równocześnie, gdzie słychać szum, o ile należy go wyciszyć, jak ustawić bramkę... Skoro człowiek nie dałby sobie z tym rady, zrzucono całą odpowiedzialność na komputery.

Tu jednak pojawił się kolejny problem. Skąd komputer ma wiedzieć, co jest szumem, co zaś muzyką? Na początku, zwłaszcza w tanich, bądź darmowych algorytmach, ustalało się głośność, przy której wszystkie pasma miały być wyciszane. Teoretycznie pomysł nie głupi, bo szum to szum, jednakże na przykładzie algorytmu z Nero doskonale widać, że jeżeli coś jest do wszystkiego, to jest do niczego.

Technologia cały czas się rozwija i to, co jeszcze kilka lat temu było dostępne jedynie w bardzo drogich programach, wyposażonych w funkcje o bardzo dziwnie brzmiących nazwach i jeszcze dziwniejszym wyglądzie, stało się dostępne dla zwykłych, szarych obywateli.

Po pierwsze, można przy pomocy myszki narysować krzywą takiego szumu, co nie wydaje się być złym pomysłem, zwłaszcza gdy mamy do dyspozycji wykresy, spektrogramy i inne narzędzia wizualizujące sygnał audio. Metoda ta dla niewidomych jest jednak raczej mało przydatna.

Redukcja szumów w programie Audacity_fot. ProducentPo drugie, upowszechnił się dostęp do narzędzia, wykorzystywanego z powodzeniem w komunikatorach głosowych, analizującego przez cały czas pochodzący z karty sygnał i eliminującego stale pojawiający się dźwięk jako szum. Zaletą tego algorytmu jest łatwość obsługi, ponieważ komputer sam jest w stanie zanalizować wchodzący sygnał i automatycznie oddzielić szum od muzyki i głosu. Użytkownik, który chce uzyskać zadowalające rezultaty nie musi zagłębiać się w gąszczu ustawień i opcji, wystarczy zdać się na maszynę.

Trzecia metoda, na której chciałbym się skupić, polega na wykorzystaniu próbki szumu. Chodzi o to, aby dostarczyć programowi taki fragment nagrania, w którym jest tylko i wyłącznie szum. Taka próbka jest analizowana, dzięki czemu nie zdarza się później sytuacja, w której użyteczny dźwięk, trwający na tyle długo, że program potraktuje go jako element niepożądany, zostanie usunięty.

Jak to się robi?

Na warsztat wziąłem dwa tanie i dostępne dla screenreaderów programy: kosztujący 30 dolarów Goldwave w wersji 5.23 oraz całkowicie darmowy Audacity v 1.37 beta.

Oba nieco różnią się koncepcją przetrzymywania próbki i algorytmem.

W Goldwave?ie próbkę szumu należy skopiować do schowka, co oczywiście powoduje, że jest on w czasie trwania pracy z programem niedostępny dla innych operacji. Z drugiej strony zarządzanie znacznikami jest bardzo intuicyjne i można je bardzo precyzyjnie ustawić w pożądanym miejscu nawet na kilka sposobów: nawiasami kwadratowymi, kombinacją ?SHIFT+e? i ręcznym ustawieniem punktu początkowego i końcowego w formacie hh:mm:ss (hh ? godziny, mm ? minuty, ss - sekundy). Dodatkowo program pozwala na korektę punktu ustawienia znaczników przy pomocy kombinacji ?STRZAŁKI+SHIFT+CTRL? oraz umożliwia regulację szybkości odtwarzania, dzięki czemu możemy, przesłuchując nagranie w zwolnionym kilkunastokrotnie tempie, sprawdzić, czy prawidłowo wstawiliśmy znaczniki.

Okno, w którym ustawiamy opcje redukcji szumów, jest dosyć funkcjonalne. Mamy tu dostęp do kilku proponowanych konfiguracji. Preset ?Clipboard noise print? oferuje odpowiednie dla większości nagrań parametry, za wyjątkiem parametru Scale, który odpowiada za ilość usuniętego szumu. Standardowo jest ustawiony na 100%, czyli odszumienie permanentne. Wydawać by się mogło, że to wartość idealna, należy jednak pamiętać o tym, że im więcej usunie się szumu, tym większe ryzyko zniszczenia dźwięku użytecznego, co nie pozostanie niezauważone przez słuchającego. Osobiście ustawiam Scale w przedziale 40 - 60%. Takie ustawienie powoduje wyczuwalną redukcję szumu przy znikomym ubytku dla materiału. Oczywiście, jeżeli efekt będzie dla nas niezadowalający, zawsze możemy zastosować w stosunku do fragmentów, w których nie ma wartościowych treści, dodatkową bramkę.

Redukcja szumów w programie Goldwave_fot. ProducentDziałanie Audacity nieco odbiega od algorytmu Goldwave?a. Przede wszystkim próbka szumu nie jest przechowywana w schowku. Aby Audacity przetworzył próbkę, trzeba ją, podobnie jak w Goldwave?ie, zaznaczyć, co w przypadku tego oprogramowania jest trochę trudniejsze, gdyż w spolszczeniu ktoś przetłumaczył również informację przeznaczoną dla programu, mówiącą o tym, jaki skrót klawiszowy ma być przypisany do ustawiania markerów, wobec czego należy samodzielnie ustawić działające skróty.

Precyzja ustawiania znaczników, w porównaniu z Goldwavem, wypada niezbyt dobrze. Duży wpływ na to ma brak funkcji regulacji prędkości odtwarzania nagrania.

Niewątpliwą zaletą Audacity jest całkowicie spolszczony interfejs.

Po otwarciu okna ?Odszumianie?, wciskamy przycisk "pobierz próbkę szumu", po czym zaznaczamy całość. Gdy to zrobimy, jeszcze raz wchodzimy do odszumiacza, ustawiamy wszystkie parametry i wciskamy przycisk ?OK?.

Jeżeli chodzi o oferowane suwaki i konfiguracje odszumiania, Audacity przedstawia się nieco ciekawiej niż Goldwave. Przede wszystkim warto przetestować suwak do tzw. wygładzania częstotliwości. Na uwagę zasługuje również suwak do ustawiania ataku bramki ? czegoś w rodzaju bezwładności efektu. Im wyższa wartość, tym więcej czasu musi upłynąć od ściszenia sygnału do wyciszenia częstotliwości.

Sposób podglądu korygowanego materiału, przed zapisaniem zmian do pliku, różni się w przypadku omawianych aplikacji. W Goldwave można w każdym oknie efektu wcisnąć F4 i program na bieżąco przetwarza plik i odtwarza go. W Audacity mamy do czynienia z przyciskiem "Podgląd", który nie ma swojego skrótu klawiszowego. Poza tym program najpierw przetwarza zdefiniowany w preferencjach fragment nagrania i dopiero potem go odtwarza, co przedłuża czas dokładnego ustawienia parametrów, gdyż nie jest możliwa ich zmiana w czasie odsłuchu. Kolejnym mankamentem jest to, że niezależnie, jaki fragment chcemy przesłuchać, przetwarzana jest całość.

Z pewnością niewątpliwą zaletą Audacity jest możliwość wygładzania częstotliwości, ponieważ Goldwave przy odszumianiu powoduje przydźwięk, jaki można określić mianem ?ćwierkania?, które jest na dłuższą metę nieco uciążliwe. Wygładzanie częstotliwości dość skutecznie to eliminuje, jednak dzieje się to kosztem selektywności i wycinane jest nieco więcej użytecznego materiału niż powinno. Wygładzanie częstotliwości bardzo dobrze sprawdza sie przy odszumianiu np. książek, a ogólniej mowy.

Kolejna różnica to jednostki. Goldwave, nie wiem dlaczego, posiada wskaźnik procentowy. W Audacity zastosowano bardziej profesjonalny wskaźnik decybelowy. Taka rozbieżność powoduje trudności przy porównywaniu obu algorytmów, bo jak tu porównać decybele z procentami?

Podsumowując, opisane algorytmy dość dobrze się uzupełniają i warto posiadać oba programy, co, zważywszy na to, że jeden z nich jest bezpłatny, nie powinno być problemem.

Czy efekt pracy przedstawionych przeze mnie programów jest satysfakcjonujący? Czy znacząco odbiega jakością od brzmienia dźwięków poddanych obróbce w zaawansowanych i drogich programach do redukcji szumów? Oceńcie to sami, wysłuchując załączonych materiałów.

Tomasz Bilecki

ZałącznikRozmiar
mowa_oryginal.ogg797.92 KB
muzyka_oryginał.ogg754.87 KB
szum_mowa.ogg13.08 KB
szum_muzyka.ogg37.02 KB
mowa_audacity_12db.ogg816.59 KB
mowa_audacity_18db.ogg830.41 KB
mowa_goldwave_40.ogg792.62 KB
muzyka_goldwave_100.ogg770.23 KB
muzyka_goldwave_40.ogg746.58 KB
muzyka_audacity_12db.ogg755.29 KB
muzyka_audacity_18db.ogg757.19 KB
 

Projekt współfinansowany ze środków Państwowego Funduszu Rehabilitacji Osób Niepełnosprawnych oraz Gminy Miejskiej Kraków