Bittejä pakettiin

Tekijät:

Kari Hautio <Kari.Hautio@hut.fi>

Teemu Heino <toheino@cc.hut.fi>

Äänen pakkaus menetelmiä

Miten?

Kuten kuvaakin ääntä voidaan pakate sekä häviöllisillä että häviöttömillä pakkaus menetelmillä. Häviöttömillä pakkausmenetelmillä (kuten LZW tai huffman) ei päästä lähellekkään hyviä pakkaus suhteita äänen sisältäessä paljon 'satunnaiselta näyttävää' informaattiota.Tämän vuoksi äänelle on kehitetty häviöllisiä pakkaus menetelmiä jotka käyttävät hyväkseen ihmisen kuulon luonnetta (esim MPEG (layer 1-3)) tai pyrkivät mallintamaan ääntöväylän jolloin saadaan hyvin ihmisäänelle sopivia tehokkaita algoritmeja kuten esim GSM-halfrate/fullrate/EFR.

Häviötön äänenpakkaus
Häviötön äänenpakkaus perustuu lähinnä yleisiin häviöttömiin datan pakkaus menetelmiin joita sovelletaan PCM-muotoiseen dataan. Yleisesti häviöttömän äänen pakkauksen merkitys on vähäinen äänen ollessa luonteeltaan analogista ja näytteyttyksessä menetetään jo informaatiota.

Häviölliset menetelmät
Pääsääntöisesti häviöllisiä menetelmiä kehitetään kahdelta eri kannalta. Ensimmäinen perustuu ihmisen kuulon mallintamiseen ja saadun informaation avulla voidaan äänestä poistaa informaatiota jota ei voida kuulla, tähän perustuvat yleiseen käyttöön (musiikki + laulu + puhe) pakkaukseen tarkoitetut koodekit. Näitä kutsutaan myös ns. psykoakustisiksi pakkausmenetelmiksi. Toinen lähestymistapa perustuu ihmisen ääntöväylän (äänihuulet, kieli, suu, huulet) mallintamiseen matemaattisella mallilla, jolloin saadaan tehokkaita puheelle optimoituja koodekkeja (esim GSM-koodekit).

Yleisimpiä standardeja / koodekkeja

MPEG - layer 1,2,3 Kuulon mallintamista hyväksi käyttäviä pakkaus menetelmiä. Alunperin kehitetty pakatun videokuvan mukaan laitettavan äänen pakkaukseen mutta myöhemmin käytetty yleisesti myös pelkän äänen pakkaamiseen. Layer 1 on elokuva äänen pakkausformaatti joka pakkaa ääntä suhteessa 4:1. Layer 2 on edellisen 5.1 kanava laajennus surround käyttöön, pakkausuhteella 1:6 - 1:8. Layer 3 on monipuoliolisempi ja kykenee suureen joukkoon erilaisia pakkausuhteita välillä 4:1 - 96:1.

ATRAC - koodaus
ATRAC koodaus on MiniDisc järjestelmässä käytetty pakkaus menetelmä joka säilyttää äänen CD-tasoisena pakkaus suhteella noin 5:1. Menetelmänä on kehittynyt psykoakustinen pakkausalgoritmi.

GSM - HR, FR, EFR
GSM-koodekeille on yhteistä niiden perustuminen ääntöväylän mallinnukseen. Ne pystyvät pakkaamaan puhetta suht hyvä laatuisena jopa 7200bps:n nopeuteen virheenkorjauksella varustettuna(GSM/HalfRate). Hyvä laatuiset koodekit toimivat kuitenkin FullRate:na eli 14400bps nopeudella. Ominaisuuksiin kuuluvat myös hyvät virheen korjaus mahdollisuudet, mahdollisuus epä jatkuvaan lähetykseen (jos ei ole pakattavaa ääntä ei tule ei myöskään lähetetä dataa vasta päähän). Tästä syystä dekooderi puoleen on myös integroitu mukavuus kohinaa jotta kuulostaisi siltä kuin puheyhteys olisi jatkuva.

Tietoverkkolaboratorio on nyt osa Tietoliikenne- ja tietoverkkotekniikan laitosta. Tällä sivulla oleva tieto voi olla vanhentunutta.

Kurssien ajantasainen tieto on MyCourses-palvelussa.

Tämä sivu on tehty oppilaiden harjoitustyönä. Tietoverkkolaboratorio ei vastaa sivun oikeellisuudesta, ajantasaisuudesta tai ylläpidosta. Vakavissa tapauksissa yhteyshenkilöinä toimivat ja Webmaster.
Sivua on viimeksi päivitetty 29.11.1998 20:23.
URI: http://www.netlab.tkk.fi/opetus/s38118/s98/htyo/38/aanen.shtml
[ TKK > Sähkö- ja tietoliikennetekniikan osasto > Tietoverkkolaboratorio > Opetus ]