Sokat töprengtem, vajon leírjam-e ezt ide, mert ez a terület elsősorban a pro felhasználók felé irányuló témakör, de úgy gondolom, hogy a mastering könyvemben akad egy olyan terület, amelyben tényként közöltem olyan információt, amelyről erősen megoszlanak a vélemények. Ez a téma kapcsolódik a Nyquist Shannon tételhez, illetve az egyes zeneszerkesztő szoftverek közötti minőségbeli eltéréshez is, de köze van az Alias és a Jitter témaköréhez is.

Sokakban felmerül a kérdés, hogy mi a különbség a 44.1 és a 48 kHz mintavételi frekvenciával rögzített hanganyag között hangminőségben? Nos a könyvben egyértelmű különbséget könyveltem el a 48. kHz javára, de sajnos ez a tény nem minden esetben állja meg a helyét és hibás következtetéssorozatot vázoltam fel. Matematikailag ugyanis teljesen mindegy, hogy 44.1 kHz vagy 48 kHz-es jellel dolgozunk. A mintavételezett jelből akkor állítható vissza információ veszteség nélkül az eredeti analóg jel, ha a mintavételi frekvencia több mint kétszerese az analóg jelben előforduló legmagasabb frekvenciának. Ez az oly sokat emlegetett Nyquist Shannon tétel. Tehát az emberi fül a 20 és a 20.000 Hz között tud hallani hangokat. Itt a legmagasabb tartomány a 20.000 Hz. Azaz, ha mondjuk a jelünk egy szinuszgörbe, akkor ez a szinuszgörbe egy másodperc alatt 20.000 alkalommal fog megszólalni és ez a legmagasabb rezgésszám amit még képesek vagyunk hallani. Ha ezt a legmagasabb frekvencián megszólaló jelet másodpercenként 44.100 mintavételezési ponton rögzítjük, akkor teljes mértékben képesek vagyunk visszaállítani az eredeti jel hullámformáját. Matematikailag tehát kimondható, hogy teljesen mindegy, hogy 44.1 kHz-es sűrűséggel veszünk mintát, vagy 48 kHz sűrűséggel.

Mi akkor hát a buktató? Miért van az, hogy a 48 kHz jobbnak tűnik? A válasz az, hogy a hiba nem a hangmintában keresendő, hanem az azt feldolgozó hangkártyában. Az AD/DA, azaz a digitálisról analógra alakító berendezésen múlik minden. Az ezekben található konverterek nagyon sok esetben eltérőek és a felhasznált alkatrészektől függ, hogy mennyire pontosak. Ez egyúttal megmagyarázza azt is, hogy miért érzékelhető hatalmas különbség egyes hangkártyák hangminőségében is. Képzeljük el, hogy ülünk egy autóban, vezetünk a tempomattal, beálltunk egy szép 90 kilométeres sebességre. Ilyenkor az autó valójában nem kereken 90 kilométer/óra sebességgel halad, lehet, hogy egyik időpillanatban 90.1, másik pillanatban 89.9 a sebessége. Most pedig képzeljük el, hogy a hangkártya nem képes tökéletes pontossággal leadni a 44.100 jelet és bár a másodpercenkénti jelfeldolgozás 44.1 kHz lesz, de több megjeleníteni kívánt jel impulzusa között nem pontos az időbeli távolság. Ez a pontatlanság elvezet a Jitter elnevezésű hibához. Azaz a kimenő jel roncsolódik, mert nem abban az időpillanatban lett rögzítve, mint ahogy le lett adva. Jobb hangkártyába természetesen bele van építve visszaellenőrző rendszer, amely kiküszöböli ezt a hibát, több kevesebb sikerrel. A digitális jel megszólaltatásáig egy tucat feladatnak kell végrehajtódnia amelynek jórésze módosíthatja a jelet. Tehát ki kell jelentenem, hogy a hiba forrása nem a hanganyag, hanem a hangkártya. A könyvemben a Jitter jelenségéről úgy írtam, mint egy általános folyamatról, amely minden körülmények között jelentkezik, ha mondjuk a digitális szintetizátorunk 48 kHz-es frekvencián üzemel, a felvevő egységünk pedig 44.1kHz-es frekvencián. De valójában ez csak akkor igaz, ha a szintetizátor átalakítója nem pontos, illetve a felvevő egységünk sem a hangkártyák gyöngye. Ezt a problémát elkerülendő továbbra is érdemes master clock, azaz órajel generátorral szinkronba hozni a két egységet.

Van azonban valami más, ami befolyásolja a hangzást. Egy korábbi videómban már kitértem rá, hogy ha 44.1-es hangmintákkal dolgozunk, de 48 kHz-es végeredményt akarunk produkálni, a zeneszerkesztő szoftver valamilyen szinten meg fogja változtatni a jelet. Hogy ezt pusztán csak egy egyszerű változásnak, vagy hangminőség romlásnak tekintsem, ezt őszintén megvallom, nem tudom megállapítani. Hajlok rá, hogy roncsolja az eredeti állapotot azzal, hogy olyan frekvenciákat is megjelenít az új jelben, ami az eredetiben nem volt jelen és ez tekinthető hangminőség romlásnak. Ez viszont felvet egy másik kérdést. Most akkor van különbség DAW és DAW között hangminőségben? A válaszom az, hogy ha 44.100 kHz-es hanganyagot keverünk és a végeredményt is ebben exportáljuk ki, akár egy Cubase rendszerben, vagy egy FL Studio-ban, a végeredmény ugyanaz lesz. A különbség akkor keletkezik, ha mi 44.100-ba exportálunk, de alapvetően 48 kHz-es hanganyaggal dolgozunk, vagy fordítva. Ekkor ugyanis a DAW maga próbálja elvégezni azt a számítást, hogy a digitalizált jel hova essen, milyen értékkel az eltérő mintavételi frekvencián. Ebben pedig minden szoftver eléggé eltérő minőséget mutat fel. Ableton 9.1-től felfelé mindenki megnyugodhat, ez a szoftver ugyanis határozottan jól teljesít.

Van egyáltalán bármilyen előnye akkor a 48 kHz-nek? Nos, ha a hangkártyánk nem a legjobb, de 48 kHz-en futtatjuk, a hanganyagunk minősége nem lesz jobb, de a nagyobb mintavételezési ráta kevesebb szélsőséges elcsúszást enged a megszólaltatáskor, ezért sanszos, hogy a hangfalból pontosabb végeredményt hallunk. A 48 kHz másik előnye kérdőjeles, és a zeneszerkesztőben megnyitható effektek pontosságán múlik. Némely effekt szoftver, VSTi talán pontosabb módon jeleníti meg a hangot, ha nagyobb frekvencián dolgozunk, de erre nem lehet pontos kutatást végezni, annyi szoftver van, hogy képtelenség ezeket tesztelni. Ami tehát lényeg, hogy balgaság volt azt írnom, hogy a 48 kHz, vagy az annál is nagyobb mintavételi frekvencián garantált a jobb minőség. Ha jó hangkártyánk van, nem érdemes 48 kHz-nél nagyobb frekvencián dolgozni, felvenni, mert nem lesz értelme. A problémát alapból nem a hangmintában kell keresni, hanem az azt kezelendő folyamatok között találhatjuk meg. Inkább az a fontos, hogy ha eltérő mintavételezésű anyagokon dolgozunk egyszerre, akkor a DAW miként teljesíti a hanganyag kezelését. Talán a legegyszerűbb példa erre, a Melodyne, amely egyértelműen hallható, jobb minőséget produkál, ha nem 44.1-es hanganyagon dolgozunk vele, hanem 48 kHz-en. Ez pedig azt jelenti, hogy a 48 kHz-es hanganyaggal pontosabb számítást tud végezni.

Mindezek végén tehát azt tudom mondani, hogy bizonyos esetekben jobb a 48 kHz, de az annál nagyobb mintavételi frekvencia felesleges, illetve érdemes exportálás előtt áttekinteni, hogy az egyes szoftverek hogyan teljesítenek eltérő mintavételi frekvencia kezelésekor.

További cikkek

Comment Form is loading comments...