[ MÕTTED ]
[ Ajaviite-
tehnika ] [ Helitöötlus ]
|
Digitaalne
helitöötlus
Kuna selle teema all on hetkel vaid
üks jutt (neid tuleb äärmiselt suure tõenäosusega
kohevarsti juurde, ja tõenäoliselt ka sektsioone, kuid
seda hiljem -- kõigepealt tahan neid kahte teemat
korralikult täita), siis jääb seisukord sedapuhku
ära. Olgu aga järgnev bulletiga lõik vihjeks
sellest, et kunagi saab see index.html olema hoopis
sisukord.
- PAKITUD MUUSIKA erinevate digitaalsete
muusika pakkimisalgoritmide pakutavast
tegelikulst helikvaliteedist.
Pakitud muusika
Digitaalkujul muusika pakkimine on viimasel ajal
tõhusalt arenenud ja seeläbi ka inimestele käeulatusse
jõudnud. Kellele arvutite maailmas ja Internetis .MP2 ja
.MP3 failide näol, kellele koduses ja professionaalses
tehnikas MiniDiskide kujul, kellele digitaalse video ja
digitaalse satelliittelevisiooni osana. Enamik inimesi,
kes sellega põgusalt kokku puutuvad, räägivad sellest
vaimustunult kui iga ilmaga praktiliselt "CD
kvaliteediga" muusikat andvast süsteemist. Ja
sellest, kui viimasepeal hea kvaliteedi neist uusim
arvutitele kättesaadav MPEG Audio Layer 3 annab. Pärast
nimetatud vahendite ohjeldamatut uudishimulikku
võrdlemist erinevates oludes, on mul igatahes tekkinud
kõva tahtmine mõningaid muusika pakkimisega seotud
müüte ümber lükata.
Müüt nr.1
nimetatud pakkimisalgoritmid annavad
praktiliselt CD kvaliteediga heli
Nii pealiskaudselt öeldud väitele vaidlen igatahes
kategooriliselt vastu. Alles praegu, mil uusimad
MiniDisk-i pakkijad (ATRAC-4 ja uuemad) suudavad pakkida
nii piisavalt hästi, et audiofiilid hakkavad alles
nüüd tunnistama, et MiniDisk kvalifitseerub millekski
paremaks kui kompakt-kassett, siis tasub ehk natuke
rääkida sellest, mis see siis on, mis pakkimiste puhul
kaotsi läheb ja millal seda kuulda on. Seda enam, et
MiniDisk-i ATRAC-4 on subjektiivselt tasemelt ikka
peajagu üle suvalisest MPEG Audio pakkijast arvutitel.
Esimene ja olulisim, mis kõikide pakkimisalgoritmide
juures väheneb on ruumitunnetus,
"kohalolekutunne". See tunne, mis lubab silmade
kinnipanekul ette kujutada, et oled saalis ja su ees
laval mingid sellid mängivad mingeid pille ja keegi toob
suuga kummalisi helisid kuuldavale. Et kus keegi midagi
teeb, mis laadi ruumis sa tunned end olevat. See kõik
väheneb. MiniDisk-i ATRAC-4 korral mitte eriti
oluliselt. MPEG Audio Layer 3 puhul, kui kasutada
soovituslikke pakkimistihedusi, ikka päris oluliselt.
Tuleneb see efekt sellest, et nimetatud
pakkimisalgoritmid kõik sisaldavad loogikat, et igal
ajahetkel ignoreeritakse mingist piirist nõrgemaid
helisid, mis klassikalises tähenduses kõrvale
kuuldamatud peaksid olema (What HiFi ütles pakkimise
kohta andeka lause: "[data compression] removes
signals, its designers think you cant
hear"). Suvalises reaalses musikaalses helis on aga
terve müriaad kõiksugu seintelt peegeldunud helide
komponente, mis on kõrvale vaevalt kuuldavad ja kui
täpne olla, siis nende olemasolu inimene endale
täielikult ei teadvustagi. Talle tekib ainult
vaevaltmärgatav tunne, et seal kandis on vist sein.
Pakkimine lõikab välja arvestatava osa sellist
informatsiooni kandvatest helidest.
Jah loomulikult, seda vahet ei kuule, kui ühendada
mingid väikesed plastmassist valjuhääldid arvuti
helikaardi sisemise võimendi väljundisse. Kui aga sama
muusikat kuulata vähegi normaalse võimendi taga
(normaalsust hakkab leidma umbes 2.4KEEK-i kandist)
normaalsetest kõlaritest (normaalsust hakkab leidma
umbes 1.8KEEK-i kandist), siis hakkab vahe välja kostma.
Muidugi ei panda seda enamasti ka siis tähele, kuna
võrdlusmomenti ei teki või siis ei vaevuta lihtsalt
võrdlema.
Ülejäänud erinevused on juba
algoritmispetsiifilisemad.
Viimastel MiniDisk-idel (ATRAC-4), ainus häda peale
eelmainitu, mida mina olen pärast hoolikat kuulamist
suutnud tuvastada on, et ta küll taastab kõrgete helide
kõla meeldivalt täpselt, aga ei suuda alati täpselt
taastada kõrgete helide ärske algusi ja lõppe.
Kujutame näiteks ette, et muusikas lüüakse metalse
asjaga metalltaldriku pihta. Tekkiv heli on suhteliselt
harilik metalse kõlaga taldriku "tsahh". Selle
tsahhi alguses on originaalis aga spetsiifiline kõlks,
mis tekkis taldriku vastu puutumise hetkel. Need järsud
üleminekuhetked aga ühtlustab ATRAC-4 natuke ära. Nii,
et see krõps sealt algusest kaoks nagu märksa vähemaks
ja see "tsahh" jääb nagu põhiliseks mis
välja kostab.
Jah, ma annan aru, et ka see, on tegelikult vägagi
minimaalne erinevus. See on ka tegelikult üks mu pointe,
et MiniDiski viimased inkarnatsioonid on tõesti peaaeegu
saavutanud selle müstilise CD-kvaliteedi, nii et vahed
on väga väikesed. Isegi ruumitaju vähenemine on väga
vähe tajutav.
Teiste algoritmidega pole aga asi nii roosiline.
MPEG Audio Layer 2 salvestajaga (CoolEdit96) kajastub
välja jäetud info esmajärjekorras selles, et kõrged
helid muutuvad ebatäpseks, ehk maakeeli öeldes
moonutuvad. Subjektiivne kommentaar selle kohta oleks, et
kõrged hakkavad hästi kummaliselt sufisema. Kusjuures
muutlikult susisema. Lisanduvad moonutused ka muusse
helisse.
MPEG Audio Layer 3 salvestajaga (L3Enc) kajastub
välja jäetud info aga kõige vastikumalt - kui kõik
soovitud inff ära ei mahu, lõigatakse kõrged lihtsalt
mingist piirist alates maha. Järsku ja nulliga. Lihtsalt
ignoreeritakse mingist piirist kõrgemaid sagedusi. Samas
aga väheneb ka signaali dünaamika. Kogu helipilt muutub
kuidagi häguseks ja "paksuks". Kõige jubedam
on veel aga see, et see piir millest kõrgemaid sagedusi
ignoreeritakse muutub pidevalt vastavalt sellele,
kuipalju vaba ruumi kodeerimiseks on. Ehk siis sellest,
mis muud helis toimub. Üldmulje on kui lihtsalt ära
lõigatud ja lisaks veel kummaliselt susisevad
kõrged. Ja ahenenud dünaamika.
Müüt nr.2
MPEG Audio Layer 3 annab iga ilmaga
Layer 2-st kvaliteetsema heli
... eriti madalamate bitrate-de korral. Müüt, mis
müüt. See müüt peab vett juhul, kui MPEG Audio Layer
3 kasutab "joint stereo" kodeerimist ja
Layer 2 ei kasuta. By default Layer 2 tõesti ei
kasuta "joint stereo" kodeerimist. Keegi ei
keela seda aga kasutada - CoolEdit96 MPEG Audio Layer 2
salvestaja optionite all on igatahes võimalik vajutada
ristike checkboxi "joint stereo". Tulemust
mängivad ikka suvalised share- ja freeware MPEG Audio
Layer 2 pleierid. Ja kui tulemust näiteks maPlay v1.2+
-ga mängida, on tulemus suvalise stereotööks mõeldud
bitratega minu arvates oluliselt parem kui praegu
kättesaadava Fraunhoferi instituudi MPEG Audio Layer 3
pakkijaga.
Kui soovite kuulda võrdlust, siis imege endale
näiteks lugu "Bolshie Boy" ansamblilt
Dreamphish. Dream4.mp2
ja Dream4.mp3.
Konkreetne lugu on mõlemas formaadis kodeeritud 112 kb/s
tihedusega joint stereo reziimis. Tähelepanuväärne on
see, et kui Layer 3 mehed ennast kiidavad, väidavad nad,
et Layer 2 sureb juba alla 160-192 kb/s tihedustel
täielikult. Mina väidan, et isegi 112 kb/s tihedusega
on Layer 2 praeguses inkarnatsioonis tasemelt täiesti
võrreldav Layer 3-ga ja kontekstides kus sellist
tihedust üldse pruukida tasub (muusika üle Interneti),
mõnevõrra paremgi. Märgiks veel ka seda, et .mp3
versioonide pakkimisel keerasin ma kõrgeid
"ekvalaiseriga" natuke üleski, et
"poolkõrgetega" veidigi kompenseerida
totaalselt ära lõigatud päris kõrgeid helisid. Ilma
selle liigutuseta, tundus .mp3 päris mannetu. Kui tahate
kuulda, kuidas originaal kõlas, kuulake Dream4.mp3.
See on 320 kb/s maksimaalse kvaliteediga pakitud
versioon.
Nii. Konkreetne lugu oli pakitud 112kb/s. WinPlay3
readme-s kuulutatakse, et 96 kb/s tihedusega saadakse
"near-CD" kvaliteet ja et selle 112 kb/s ja 128
kb/s tihedustega saadakse "CD" kvaliteet. No
kui see on CD kvaliteet, olen mina pizza. Jah ma tean, et
see lugu on mõlema pakkimisalgoritmi vaatevinklist üks
jubedamaid võimalikke. Sellegipoolest.
Pärast pikki katsetusi erinevate tihedustega on minu
praegune arvamus MPEG Audio Layer 3 pakkimisvõimest
(eeldusel, et originaaliks oli digitaalselt salvestatud
lugu) järgmine:
- 96 kb/s - kesklaine-raadio-st
veidi parem, ainult et stereo.
- 112 kb/s - hakkab meenutama
ULL-raadiot, aga ikka kehvem veel
- 128 kb/s - "peaaegu Uuno
raadio", ainult et vähegi keerulised
susinad rikub ära
- 160 kb/s - ULL-raadiost parem,
võhik ei tee CD-ga praktiliselt vahet,
nõudlikuma kuulaja jaoks rahuldab, kuigi vahe on
korraliku tehnikaga kuuldav
- 192 kb/s - digitaalse originaali
korral pole vahet praktiliselt kuulda
Kui originaal on analooglindilt pärit, siis võib
öelda, et 160kb/s rikub susisevad kõrged ikka
põhjalikult ära; 192 kb/s on peaaegu rahuldav (kui
analoogmakk on korralik) ja 256kb/s annab korraliku
tulemuse, mida originaalist praktiliselt ei erista.
Kogu selle pildi juures on nukker see, et MPEG Audio
Layer 2 korral on minu subjektiivne mulje erinevate
pakkimistiheduste korral umbes sama. Erinevalt Layer 2
pakkijatest on aga Layer 3 pakkijad sellised, et 160
kb/s, 192 kb/s ja 224 kb/s tihedusi kasutada ei lasta.
Registreerimata programmi korral ei lasta 128 kb/s
tihedustki kasutada.
Minu isiklik hinnang kogu süsteemile on aja jooksul
kujunenud selliseks, et arvuti kõrval olevate
plastik-kõlarite tarbijatele on Fraunhoferi Instituudi
pakutav MPEG Audio Layer 3 hea küll - üle interneti
muusika kantimiseks 128 kb/s tihedusega näiteks. Samas
aga oleks Layer 2 ka selleks mõistlikum kuna selle eest
ei pea keegi Fraunhofer-ile üüratuid rahasid maksma
(l3enc registreerimine eeldab >2000EEK tasu mis on
metsikult kõrge nii jaburate piirangutega programmi
kohta) ja kuulamisprogrammid on täiesti tasuta.
|