Lietuvių

Tyrinėkite psichoakustiką, mokslą apie garso suvokimą, ir jos svarbą suvokimu pagrįstam garso kodavimui, kuris užtikrina efektyvų garso glaudinimą ir aukštą klausymosi kokybę.

Psichoakustika ir suvokimu pagrįstas garso kodavimas: kaip mūsų smegenys formuoja garsus, kuriuos girdime

Pasaulis pilnas garsų – tai gyvybinga dažnių ir amplitudžių simfonija, nuolat atakuojanti mūsų ausis. Tačiau tai, ką mes *girdime*, yra ne tik tai, kas patenka į mūsų ausis; tai taip pat ir mūsų smegenų interpretacijos rezultatas. Ši žavinga sąveika tarp fizinių garso savybių ir mūsų subjektyvaus suvokimo sudaro psichoakustikos – mokslo apie tai, kaip suvokiame garsą – pagrindą. Psichoakustikos supratimas nėra tik akademinis siekis; tai raktas į aukštos kokybės garso patirtis, nuo muzikos transliavimo jūsų telefone iki įtraukiančio garso kino teatre.

Kas yra psichoakustika?

Psichoakustika yra mokslas, tiriantis ryšį tarp fizinių garso savybių ir mūsų subjektyvaus jo suvokimo. Ji sujungia objektyvų garso bangų pasaulį su subjektyviu mūsų klausos patirties pasauliu. Ši sritis apjungia akustikos, psichologijos ir neuromokslų aspektus, siekiant ištirti, kaip žmonės suvokia garsą, įskaitant garsumą, aukštį, tembrą ir erdvinę vietą.

Pagrindinės psichoakustikos tyrimų sritys:

Žmogaus klausos sistema

Prieš gilinantis į konkrečius psichoakustikos principus, svarbu suprasti pagrindinę žmogaus klausos sistemos struktūrą. Garso bangas surenka išorinė ausis, jos nukreipiamos į ausies kanalą ir priverčia ausies būgnelį vibruoti. Šias vibracijas sustiprina vidurinės ausies kauliukai (plaktukas, priekalas ir kilpa) ir perduoda į vidinę ausį, konkrečiai į sraigę. Sraigėje, skysčio pripildytoje, sraigės formos struktūroje, yra tūkstančiai mažyčių plaukuotųjų ląstelių, kurios mechanines vibracijas paverčia elektriniais signalais. Šie signalai klausos nervu siunčiami į smegenis, kur jie apdorojami ir interpretuojami kaip garsas.

Šis sudėtingas procesas atskleidžia, kokia jautri gali būti žmogaus ausis. Ausis gali aptikti platų dažnių diapazoną, paprastai nuo 20 Hz (ciklų per sekundę) iki 20 000 Hz. Tačiau šis diapazonas skiriasi priklausomai nuo žmogaus ir mažėja su amžiumi (presbiakuzija). Ausis taip pat yra neįtikėtinai jautri intensyvumo pokyčiams, galinti suvokti garsus nuo tyliausio šnabždesio iki reaktyvinio variklio griausmo.

Pagrindiniai psichoakustikos principai

Keletas pagrindinių principų padeda mums suprasti, kaip suvokiame garsą:

1. Garsumas ir fonų skalė

Garsumas yra subjektyvus garso intensyvumo suvokimas. Fonų skalė naudojama garsumui matuoti. Vienas fonas apibrėžiamas kaip 1 kHz tono garsumas, esantis tam tikrame decibelų lygyje. Žmogaus ausis nesuvokia visų dažnių vienodu garsumo lygiu; mes jautriausi garsams vidutinių dažnių diapazone (apie 2–5 kHz). Garso lygį galima matuoti decibelų (dB) skale, tačiau garsumas yra subjektyvus, todėl fonų skalė yra naudinga.

2. Aukštis ir melų skalė

Aukštis yra subjektyvus garso dažnio suvokimas. Melų skalė yra suvokiamoji aukščių skalė, kurią klausytojai vertina kaip vienodai nutolusią vieną nuo kitos. Melų skalė pagrįsta tuo, kad ryšys tarp suvokiamo aukščio ir tikrojo dažnio nėra tiesinis. Nors mūsų aukščio suvokimas tiesiogiai susijęs su garso bangos dažniu, šis ryšys nėra paprastas „vienas su vienu“ atitikimas. Pavyzdžiui, esame jautresni aukščio pokyčiams žemesniuose dažniuose nei aukštesniuose. Melų skalė naudojama kalbos atpažinimo ir kitose srityse.

3. Kritinės juostos

Sraigė veikia kaip dažnių analizatorius, efektyviai skaidydama sudėtingus garsus į jų sudedamąsias dažnių dalis. Pamatinė membrana sraigėje vibruoja skirtingose vietose, reaguodama į skirtingus dažnius. Šis procesas padalija girdimąjį dažnių spektrą į eilę persidengiančių dažnių juostų, vadinamų kritinėmis juostomis. Kiekviena kritinė juosta atitinka dažnių diapazoną, kuris suvokiamas kaip vienas klausos įvykis. Šių juostų plotis kinta priklausomai nuo dažnio: žemesniuose dažniuose juostos yra siauresnės, o aukštesniuose – platesnės. Kritinių juostų supratimas yra labai svarbus suvokimu pagrįstam garso kodavimui, nes leidžia efektyviai glaudinti duomenis, atmetant informaciją, kurią mažiau tikėtina suvokti.

4. Maskavimas

Maskavimas yra fundamentalus psichoakustikos reiškinys, kai vieno garso (maskuotojo) buvimas apsunkina ar padaro neįmanomu išgirsti kitą garsą (taikinį). Šis efektas priklauso nuo dažnio; garsesnis garsas, esantis panašiame dažnyje kaip ir taikinys, jį užmaskuos efektyviau nei garsas, esantis žymiai skirtingame dažnyje. Maskavimas yra vienas iš svarbiausių principų, kuriuo naudojasi suvokimu pagrįsti garso kodekai. Analizuodamas garso signalą ir identifikuodamas užmaskuotus dažnius, kodekas gali selektyviai atmesti informaciją, kuri yra nepastebima klausytojui, taip žymiai sumažindamas failo dydį, nepakenkiant suvokiamai garso kokybei. Maskavimo tipai:

5. Laikinieji efektai

Mūsų garso suvokimą taip pat gali paveikti įvykių laikas. Pavyzdžiui, pirmumo efektas apibūdina reiškinį, kai mes suvokiame garso šaltinio kryptį remdamiesi pirmuoju atsklidusiu garsu, net jei vėlesni atspindžiai atsklinda iš skirtingų krypčių. Šis efektas leidžia mums lokalizuoti garsus sudėtingose akustinėse aplinkose.

Suvokimu pagrįstas garso kodavimas: psichoakustikos panaudojimas glaudinimui

Suvokimu pagrįstas garso kodavimas, dar žinomas kaip psichoakustinis garso kodavimas, yra metodas, kuris išnaudoja žmogaus klausos ribotumus efektyviam garso duomenų glaudinimui. Užuot tiesiog mažinę failo dydį atmesdami informaciją, suvokimu pagrįsti garso kodekai naudoja psichoakustikos principus, kad nustatytų ir atmestų garso informaciją, kuri yra nepastebima ar mažiau svarbi klausytojui. Tai leidžia pasiekti didelį glaudinimo laipsnį, išlaikant aukštą suvokiamą garso kokybę. Pavyzdžiai – MP3, AAC, „Opus“ ir kiti.

Bendras suvokimu pagrįsto garso kodavimo procesas apima kelis pagrindinius etapus:

  1. Signalo analizė: Garso signalas analizuojamas, siekiant nustatyti jo spektrinę sudėtį ir laiko charakteristikas.
  2. Psichoakustinis modeliavimas: Naudojamas psichoakustinis modelis, kuris analizuoja signalą ir nustato, kurios garso dalys yra suvokiamai svarbios ir kurias galima atmesti, žymiai nepaveikiant klausymosi patirties. Šis modelis paprastai atsižvelgia į tokius veiksnius kaip maskavimas ir kritinės juostos.
  3. Kvantavimas ir kodavimas: Likusios, suvokiamai svarbios, garso signalo dalys yra kvantuojamos ir koduojamos. Kvantavimas apima garso duomenų tikslumo sumažinimą, o kodavimas paverčia duomenis į suglaudintą formatą.
  4. Dekodavimas: Atkūrimo metu suglaudinti duomenys dekoduojami, siekiant atkurti artimą originalaus garso signalo versiją.

Kaip maskavimas leidžia glaudinti duomenis

Maskavimas yra suvokimu pagrįsto garso kodavimo kertinis akmuo. Kadangi garsesnis garsas gali užmaskuoti tylesnį, kodekai tai išnaudoja:

Praktiniai pavyzdžiai: MP3 ir AAC

Du populiariausi suvokimu pagrįsti garso kodekai yra MP3 (MPEG-1 Audio Layer III) ir AAC (Advanced Audio Coding). Šie kodekai naudoja skirtingus psichoakustinius modelius ir kodavimo metodus, tačiau abu remiasi tais pačiais pagrindiniais principais. Abu formatai analizuoja garsą, kad nustatytų maskuojamus komponentus ir pašalintų arba žymiai sumažintų šių užmaskuotų dažnių tikslumą. MP3 naudojamas dešimtmečius ir pakeitė tai, kaip žmonės vartoja garso turinį. AAC yra modernesnis ir dažnai laikomas teikiančiu aukštesnę kokybę esant panašiam ar mažesniam bitų srautui, ypač esant sudėtingiems garso signalams. Abu kodekai ir toliau plačiai naudojami visame pasaulyje įvairiose srityse – nuo muzikos transliavimo paslaugų, tokių kaip „Spotify“ ir „Apple Music“, iki transliacijų (podcast) ir skaitmeninio transliavimo.

Štai supaprastinta iliustracija:

Psichoakustinio garso kodavimo taikymas ir poveikis

Suvokimu pagrįstas garso kodavimas pakeitė garso turinio vartojimo ir platinimo būdus. Jis lėmė daugybę technologinių pažangų ir pagerino milijardų žmonių garso patirtis visame pasaulyje:

Psichoakustinio garso kodavimo poveikis yra labai platus – nuo sklandžios komunikacijos tarp žemynų palengvinimo iki aukštos kokybės pramogų patirčių teikimo.

Iššūkiai ir ateities kryptys

Nors suvokimu pagrįstas garso kodavimas pasiekė nepaprastos pažangos, vis dar yra iššūkių ir sričių ateities plėtrai:

Išvada

Psichoakustika suteikia fundamentalų supratimą apie tai, kaip žmonės suvokia garsą. Šios žinios yra būtinos kuriant veiksmingas garso kodavimo strategijas. Suprasdami žmogaus klausos sistemą, psichoakustinius modelius ir tokius metodus kaip maskavimas, inžinieriai sukūrė suvokimu pagrįstus garso kodekus, kurie užtikrina nepaprastai efektyvų glaudinimą ir gerina patirtis visame pasaulyje. Technologijoms toliau tobulėjant, psichoakustikos ir garso kodavimo sinergija ir toliau bus lemiama formuojant mūsų garso patirtį ateityje. Nuo mažiausių ausinukų iki didžiausių koncertų salių, psichoakustika atlieka gyvybiškai svarbų vaidmenį, leisdama mums efektyviau ir maloniau mėgautis muzika, filmais ir visomis garso turinio formomis.