Autorem artykułu jest Łukasz Igor Kruszewski. Materiał opublikowany za jego zgodą.
Zapewne nie raz spotkaliście się z pojęciami takimi jak zapas dynamiki (znany także pod nazwą "headroom") oraz zakres dynamiki i mniemam, że prawdopodobnie natrafiliście na kłopoty z interpretacją czy właściwym rozumieniem obu tych terminów. Wysnuwam takie wnioski, bo już kilka osób prosiło mnie o wyjaśnienie zależności między tymi pojęciami. Dlatego zamierzam przybliżyć Wam, cóż takiego się za nimi kryje i do czego może nam się przydać wiedza o nich podczas pracy z dźwiękiem. Żeby lepiej zrozumieć jak te dwa określenia mają się do naszych nagrań, przydatnym będzie cofnięcie się do czasów zapisu analogowego, co uczynimy w drugiej części artykułu. Przybliżę Wam jak należy stosować wiedzę o tych pojęciach w dwóch kluczowych dla realizacji procesach, czyli nagrywaniu i miksowaniu.
Zacznijmy od zakresu dynamiki
Jest to nic innego, jak różnica między najgłośniejszym a najcichszym sygnałem, jaki dane urządzenie jest w stanie przetworzyć lub dane źródło dźwięku wytworzyć - zależy o jakiej sytuacji mówimy, miksowaniu czy nagrywaniu. Zarówno poziom najwyższy, jak i najniższy (w przypadku poziomu emitowanego dźwięku) są wyrażane w dBSPL, więc różnicę między nimi, czyli zakres dynamiki (powiedzmy ludzkiego słuchu) wyrażamy w samych decybelach.
Jeśli próg słyszalności słuchu wynosi 0 dBSPL, a najgłośniejszy dźwięk, jaki jesteśmy w stanie znieść przed pojawieniem się bólu, wynosi 120 dBSPL, to nietrudno policzyć, że zakres dynamiki ludzkiego słuchu równy jest 120 dB - jest to jak najbardziej wartość uśredniona, bo należałoby jeszcze wziąć pod uwagę stopień "zużycia" słuchu u poszczególnych jednostek czy hałas otoczenia itp., ale przykład ten ma służyć jedynie zrozumieniu całej koncepcji i często stanowi dobry punkt odniesienia dla rozumienia tej wartości w innych przypadkach.
Może więc przytoczę drugi przykład - zakres dynamiki orkiestry symfonicznej. Najcichszy emitowany przez nią dźwięk to 10 dBSPL, a maksimum jej możliwości to okolice 100 dBSPL. Wniosek poparty bardzo skomplikowanym działaniem matematycznym jest taki, że zakres dynamiki orkiestry w pełnym składzie wynosi 90 dB. Dzięki wiedzy o zakresie ludzkiego słuchu, rozumiemy więc, że ludzkie ucho jest w stanie dokładnie przetworzyć to, co słyszy na koncercie w filharmonii.
Kolejny przykład to zakres dynamiki mikrofonów. Większość tych używanych w warunkach studyjnych plasuje się ze swoim zakresem w okolicach 110 dB, co z kolei rozumiemy tak, że bez kłopotu zarejestrują one to, co serwują im instrumenty, nawet na koncercie wspomnianej orkiestry.
Jak konkretnie ma się ta wiedza do praktyki?
W teorii wygląda to bardzo prosto, łatwo i przyjemnie, ale w rzeczywistości w grę wchodzą też takie elementy jak szumy mikrofonu, przedwzmacniacza, konwerterów analogowo-cyfrowych. Szumy z wszystkich tych ogniw sumują się (co będzie jeszcze wyraźniejsze przy bardzo cichych pasażach) i mogą wpłynąć negatywnie na jakość nagrywanego sygnału. Nie bez powodu więc do rejestracji wykonań orkiestrowych stosuje się najwyższej jakości mikrofony, preampy czy konwertery, a dźwięk zapisuje się w rozdzielczości 24-bitowej.
Dlaczego 24 bity a nie 16?
Obecnie niemal każdy interfejs, jaki mamy w domowym studiu daje nam możliwość rejestracji z głębią 24-bitową - jeśli dysponujemy takim, który oferuje tylko 16 bit, to albo powinniśmy rozważyć upgrade, albo będziemy musieli być bardzo skrupulatni, dokładni i wiecznie martwiący się o poziomy i szumy, czyli w skrócie mówiąc - o zakres dynamiki. Nie mówię, że przy 24 bitach mamy o tych aspektach nie myśleć, ale wyższa rozdzielczość daje nam większy komfort i spokojniejszą głowę. Jeśli chodzi o konkretne różnice techniczne to:
- 24 bit oferuje aż 144 dB zakresu dynamiki (przy 96 dB w systemie 16 bit)
- przy 24 bit nie musimy się aż tak bardzo martwić o odstęp sygnału właściwego od szumów, te "mieszkają" o wiele niżej niż w systemie 16 bit
- przy 24 bit nie musimy nagrywać śladów bardzo głośno, co było wskazane w środowisku 16-bitowym
- minus rejestrowania w 24 bit (choć marginalny) to konieczność stosowania ditheringu (losowego szumu) w ostatniej fazie produkcji utworu - po masteringu, aby dostosować miks do konkretnego nośnika (płyty CD), ale dzięki jego zastosowaniu nie słyszymy skutków ubocznych pozbycia się tych 8 bitów
- drugi minus to większy rozmiar plików audio rejestrowanych w 24 bit, ale nie oszukujmy się, w dzisiejszych czasach, gdzie dyski twarde kosztują grosze, nie jest to jakiś wielki mankament
Wiemy o tym, że aby utwór był ekscytujący, dynamiczny i oddychający, a nie był zduszony, stłumiony i bez kopa, musimy zachować pewien odstęp między skokami sygnału a poziomem bazowym, na którym utrzymuje się reszta nagrania. Jednym z podstawowych sposobów na zachowanie odpowiedniej dynamiki podczas miksu jest umiejętne stosowanie kompresji, nie używanie zbyt krótkiego ataku, zachowywanie transjentów, etc. Te właśnie aspekty będą w głównej mierze stanowiły o tym, że nasz kawałek nie będzie odbierany jako spłaszczony, pozbawiony energii i po prostu mało dynamiczny.
W sytuacji miksowania lub masteringu zakres dynamiki również będziemy opisywać za pomocą decybeli, aczkolwiek punktem odniesienia nie będzie wartość SPL (ciśnienia akustycznego - jak to miało miejsce w przypadku nagrywania), a pełna skala cyfrowa (FS). Dla przykładu, jeśli sygnał w miksie osiąga wartości szczytowe (peak) w okolicach -3 dBFS, a wskaźnik RMS oscyluje gdzieś w granicy -15 dBFS, to mówimy o zakresie dynamiki równym 12 dB (czasem określanym jako x dB DR - od ang. Dynamic Range).
Zapewne chcielibyście wiedzieć gdzie leży granica, powyżej której miks (już po masteringu) przestaje być dynamiczny, a my wkraczamy na terytorium spłaszczonej pulpy. Zdania w tej kwestii są mocno podzielone - jedni twierdzą, że zdrowy zakres dynamiki to minimum 14 dB, inni uważają, że 8 dB jest jak najbardziej akceptowalne, a jeszcze inni bez krzty wstydu masakrują swoje nagrania do 2-4 dB. Zabiegi te mają oczywiście miejsce dopiero podczas masteringu i są zależne od kilku czynników. Czasem decyzje są podejmowane przez samych muzyków, a czasem przez producentów, inżynierów masteringu, wytwórnie czy szefów sprzedaży. Dzieje się tak dlatego, że jednym z najszybszych i najprostszych sposobów na osiągnięcie bardzo głośnych utworów jest spłaszczenie ich dynamiki (ściszenie szczytów), przez co można wyżej podnieść poziom średni, czyli uczynić piosenkę głośniejszą.
Nie chcę tu wchodzić w dyskusję o tzw. wojnach głośności, chcę Was po prostu uczulić na to, abyście polegali w tej kwestii na własnych uszach i nie dali się ponieść panującej obecnie modzie na super-głośne nagrania. Cierpi na tym sama muzyka i to w tym właśnie miejscu zatraca się często charakter utworu, nad którym ciężko pracowaliście podczas wszystkich poprzednich etapów produkcji swojego dzieła. Odpowiedni zakres dynamiki uzależniony jest także od gatunku muzycznego, w którym się obracamy - inny będzie dla muzyki klasycznej czy jazzu (o wiele większy), a inny dla elektroniki czy rocka (znacznie mniejszy).
Podsumowanie
W sytuacji nagraniowej najprościej myśleć o zakresie dynamiki jak o użytecznym przedziale, w którym mieści się sygnał, gdzie dolną granicą będzie moment pojawienia się szumów a górną - miejsce, powyżej którego wystąpi przesterowanie czyli 0 dBFS w systemach cyfrowych. W sytuacji miksowania i masteringu możemy o nim myśleć jak o różnicy między sygnałem szczytowym (Peak) a poziomem średnim nagrania (RMS). W drugiej części porozmawiamy o zapasie dynamiki i jego charakterystyce i różnicach - tak w świecie analogowym, jak i cyfrowym.