Kari Risberg

45173 M

kari.risberg@yle.fi

MAANPÄÄLLINEN DIGITAALI TV

SISÄLLYSLUETTELO

Lyhenneluettelo 3

1. Johdanto 4

2. Nykyisen TV-järjestelmän rajoitukset 4

2.1 PAL 4

2.2 Paikkavaihtelu 4

2.3 Monitie-eteneminen 4

2.4 Signaalin aikavaihtelu 4

2.5 Saman ja viereisen kanavan häiriöt 4

3. Eroja analogisen ja digitaalisen järjestelmän välillä 5

4. Komponenttivideo 5

4.1 Rinnakkaisliitäntä 6

4.2 Sarjaliitäntä 6

5. Videon kompressointi 7

5.1 Kompressoinnin tarve ja periaatteet 7

6. MPEG 8

6.1 Transformikoodaus 9

6.2 Diskreetti kosinimuunnos 9

6.3 Kvantisointi 10

6.4 Juoksunpituuskoodaus 10

6.5 Vaihtuvanmittainen koodaus 10

6.6 Hybridi-DCT-koodaus 11

6.7 Liikkeenkompensoitu hybridikoodaus 11

7. Digitaalinen audio 11

7.1 ISO/MPEG-2 audio 11

7.2 Bittireduktion perusteet 12

8. Modulaatiomenetelmät 12

9. Yhteenveto 13

10. Lähdeluettelo 14

LYHENNELUETTELO

HDMAC High Definition Multiplexed Analog Component, Analoginen HDTV

PAL Phase Alternate Line, nykyinen analoginen TV-järjestelmä

NTSC National Television System Committee, lähinnä amer. Anal. TV-järj.

DVB-T Digital Video Broadcasting Terrestrial, maanp. Digit. TV

RGB Red, Green, Blue, Väri TV:n perusvärit

Y luminanssi, kuvan mustavalko informaatio

B-Y,Cb sininen värierosignaali

R-Y,Cr punainen värierosignaali

SAV Start of Active Video, digitaalivideon juovan alun synkronointisana

EAV End of Active Video, digitaalivideon juovan lopun synkronointisana

NRZI Non Return Zero Inverted, johtokoodi

HDTV High Definition Television, teräväpiirtotelevisio

MPEG Moving Picture Expert Group, liikkuvan kuvan kompressointijärjestö

GOP Group Of Pictures, Intra kehysten välinen kuvasekvenssi MPEG:ssä

RLC Run Length Coding, juoksunpituuskoodaus

DCT Discrete Cosine Transform, diskreetti kosimuunnos

VLC Variable Length Coding, vaihtuvanmittainen koodaus

AES/EBU Audio Engineering Society/European Broadcasting Union, digitaalinen äänistandardi

QAM Quadrature Amplitude Modulation, digitaalinen modulointi menetelmä

COFDM Coded Orthogonal Frequency Division Multiplex

PALplus analoginen 16:9 sivusuhteen mahdollistava jakelujärjestelmä

1. JOHDANTO

Analogiset TV-lähetysjärjestelmät kehitettiin jo ennen toista maailmansotaa. Myöhemmin on signaaliin lisätty värit, teksti-TV ja NICAM-digitaaliääni. Viime vuosikymmenellä kehitettiin aivan uutta analogista MAC-järjestelmää, jonka piti olla välivaihe siirryttäessä teräväpiirtotelevisioon (HDMAC). Tämän vuosikymmenen alkuvuosina kuitenkin todettiin, että kokonaan digitaalisilla järjestelmillä on kuitenkin niin selviä etuja että MAC-järjestelmä jäi historiaan jo ennen kuin sitä missään otettiin laajempaan käyttöön.

Vuoden 93 syyskuussa alettiin virallisesti kehittämään eurooppalaisia digitaalisia standardeja satelliitti-, kaapeli maanpäälliseen TV-jakeluun. Maanpäällinen standardi saatiin valmiiksi viimeisenä vuoden 95 marraskuussa.

2. NYKYISEN TV-JÄRJESTELMÄN RAJOITUKSET

2.1 PAL

Analoginen väri-TV (PAL) kehitettiin kompatiibeliksi mustavalkoTV:n kanssa, jolloin jouduttiin kompromissiratkaisuihin. Väri-informaatio (värierosignaalit B-Y, R-Y) AM moduloidaan mustavalkoinformaatioon taajuuskaistan yläpäähän apukantoaallon ollessa n. 4,43 MHz:iä. Apukantoaalto on valittu niin että se mahdollisimman vähän häiritsee mustavalkoinformaatiota. Käytännössä värin ja luminanssi-informaation täydellinen erottaminen on mahdotonta ja seurauksena on ristiväri ja ristiluminanssi nimillä tunnetut häiriöt.

2.2 Paikkavaihtelu

Joskus vastaanottopaikan ja lähetysaseman välillä on niin korkeita maastoesteitä, ettei signaalin voimakkuus normaalisti ole riittävä. Silloin on mahdollista parantaa vastaanottoa joko nostamalla vastaanottoantenni korkeammalle tai rakentamalla alilähetin, jonka teho on suunnattu ongelma-alueelle.

2.3 Monitie-eteneminen

Monitie-etenemisellä tarkoitetaan sitä, että suoraan lähetysantennista tulevaan signaaliin summautuu heijastunut signaali. Heijastunut signaali on viivästynyt ja aiheuttaa haamukuvan vastaanottimeen. Monitie-eteneminen on ongelma etenkin kannettavilla vastaanottimilla, joissa on ympäri säteilevä antenni.

2.4 Signaalin aikavaihtelu

Kiinteälläkin vastaanotolla signaalin voimakkuus vaihtelee sääolosuhteiden mukaan merkittävästi. Yleisradion mittausasemalla on käynnissä tutkimus aikavaihtelun selvittämiseksi UHF taajuuksilla. Mitä kauempana lähetysasemasta ollaan, sitä suurempi on aikavaihtelu.

2.5 Saman ja viereisen kanavan häiriöt

Suomessa TV-verkot on suunniteltu siten, etteivät saman tai naapurikanavan häiriöt normaalisti haittaa. Tietyillä säätyypeillä kuitenkin ilmakehän taitekerroin muuttuu merkittävästi ja esiintyy ylipitkää etenemistä, jolloin häiriöitä syntyy.

3. EROJA ANALOGISEN JA DIGITAALISEN JÄRJESTELMÄN VÄLILLÄ

Tuotantotekniikassa siirrytään analogisesta PAL tuotantoympäristöstä digitaalisen komponenttiympäristöön. Tämä poistaa ristiväri ja -luminanssi ilmiöt ja antaa paremman luminanssi- ja väriresoluution.

Digitaalisessa järjestelmässä kuva kompressoidaan, joka mahdollistaa yhteen 8 MHZ:N rasteriin 4-6 TV ohjelmaa yhden asemasta.

TV-kuvan laatua arvioidaan subjektiivisella skaalalla 1-5. Analogisessa järjestelmässä kuvan laatu heikkenee tasaisesti, kun signaalin voimakkuus pienenee, heijastuksia esiintyy tai muut saman tai naapurikanavan asemat häiritsevät. Digitaalisella järjestelmällä kuvan laatu on hyvä tai sitten ei näy eikä kuulu mitään, kun kriittinen kynnys alitetaan. Siksi aikavaihtelun hallitseminen on ensiarvoisen tärkeätä DVB-T verkkoja suunniteltaessa.

Maanpäällistä järjestelmää ei monitie-eteneminen häiritse, vaan heijastuksista on jopa hyötyä. Koko maan tai pienempien alueiden synkroniverkkojen rakentaminen on mahdollista

4.KOMPONENTTIVIDEO

Komponenttivideossa kolmen perusvärisignaalin eli RGB-signaalien (Red, Green,Blue) sisältämä luminanssi eli mustavalkoinformaatio sekä väri-informaatio on erotettu toisistaan ja videon kaistanleveys sopeutettu vastaamaan ihmissilmän värinäköä. Silmän heikon värierottelukyvyn ansiosta väri-informaatio voidaan koodata luminanssin (Y) sekä perusvärisignaalin erotuksesta muodostettuihin kapeakaistaisiin (R-Y ja B-Y) värierosignaaleihin.

Komponenttivideo soveltuu hyvin studiotuotantoon, koska erillisten luminanssi- ja värierokomponenttien prosessointi on helpompaa kuin koodattujen PAL- (Phase Alternation Line tai NTSC-(National Television System Committee) signaalien. Myös standardimuunnokset eri TV-järjestelmien välillä ovat yksinkertaisempia kuin koodatuilla TV-signaaleilla. Tämän johdosta komponenttivideolle on määritelty kansainvälinen digitointistandardi, jossa näytteenottotajuuksia valittaessa on huomioitu eri TV-järjestelmien juovalukujen ja kenttätaajuuksien suhde toisiinsa.

Komponenttivideon digitaalinen koodausstandardi on nimeltään ITU-R 601, joka käsittää sekä 525/60 että 625/50 TV-järjestelmät. Luminanssin näytteenottotaajuudeksi on määritelty 13,5 MHz, mikä on molempien TV-järjestelmien juovataajuuksien kerrannainen. Värierosignaaleille tarvittavan pienemmän kaistanleveyden vuoksi niiden näytteenottotaajuudeksi riittää 6,75 MHz eli puolet luminanssin näytteenottotaajuudesta. Näytteenottorasteri on suorakulmainen ja värieronäytteet sijaitsevat parittomien luminanssinäytteiden kohdalla. Komponenttivideon digitointistandardi tunnetaan myös nimellä “4:2:2", missä numerot edustavat luminanssin (ensimmäinen numero) näytteenottotaajuuden suhdetta kahteen värierosignaaliin (jälkimmäiset numerot). Videosignaali kvantisoidaan 10-bitillä.

Tahdistuspulsseja ei tarvitse digitoida, koska tahdistustieto voidaan koodata erillisenä. Näin videon digitoinnille saadaan laajempi dynaaminen alue ja tarkempi kvantisointi. Digitoitavalle videosignaalille on jätetty myös hieman valkoisen tason ylitysvaraa sekä mustan tason alitusvaraa.

4.1 Rinnakkaisliitäntä

Kolmen 10-bittisen signaalin rinnakkainen siirtäminen olisi hankalaa laitteiden välillä, joten luminanssi- ja värierosignaalit multipleksoidaan eli lomitellaan ajassa yhdeksi rinnakkaismuotoiseksi näytejonoksi. Datasanat lähetetään järjestyksessä Cb,Y,Cr,Y,Cb... jne. Koska värieronäytteiden yhteinen määrä on sama kuin luminanssinäytteiden, nousee multipleksoidun signaalin siirtonopeus 27 Mword/s.

Jokaisella juovalla oleva data paketoidaan, jotta näytteet olisivat tunnistettavissa, kun signaalit puretaan jälleen erilliseksi. Ainoastaan aktiivinen juovan osa digitoidaan ja juovan alkuun lisätään tahdistussana Sav (Start of Active Video) ja loppuun EAV (End of Active Video). Kumpikin tahdistussana koostuu neljästä datasanasta. Ensimmäinen sana on FF,x ja seuraavat kaksi ovat nollia. Nämä datasanat ovat siis varattuja tahdistukseen, eivätkä saa siten esiintyä juovan aktiivisella osalla. Neljäs datasana sisältää informaatiota:ensimmäisen ja toisen kenttien tunnistamisesta, kenttäsammutuksen tilasta ja juovasammutuksen alun ja lopun tunnistamisesta.

Click here for Picture

Koska perinteisiä tahdistussignaaleja ei digitoida, voidaan käyttämättä jääneiden kenttä- ja juovasammutusten aikana siirtää ylimääräistä dataa. Tällä alueella siirretään monikanava ääntä ja videon jälkikäsittelyssä tarvittavaa data informaatiota.

4.2 Sarjaliitäntä

Rinnakkaisliitäntää voidaan käyttää ainoastaan silloin, kun laitteiden välimatka on alle 50 metriä. Myös 25-nastaisten rinnakkaisliittimien ja kaapeleiden asennus sekä monikanavaisten kuvasekoittimien valmistaminen on hankalaa ja kallista.

Nämä ongelmat poistuvat sarjaliitännässä, jossa rinnakkaismuotoinen videodata muunnetaan sarjamuotoiseksi bittijonoksi. Sarjamuunnoksen jälkeen bittijonosta poistetaan pitkät “0" ja “1" sekvenssit scrambling-menetelmällä, jossa bittivirta tehdään satunnaisemmaksi sekoittamalla data sovitun algoritmin mukaisesti. Näin signaalista poistuu DC-komponentti ja samalla datan ilmaisu vastaanotossa helpottuu. Johtokoodaus tehdään NRZI-menetelmällä (Non Return to Zero Inverse). Sarjamuotoisessa siirrossa ei tarvita erillistä linjaa kellosignaalille, vaan se ilmaistaan itse datasignaalista.

Sarjamuotoisen signaalin siirtonopeus on peräti 270 Mbittiä/s (13,5 MHz*10 bittiä +6,75 Mhz*10 bittiä +6,75 MHz*10 bittiä) ja sitä siirretään koaksiaalikaapelissa. Kaapeli voi olla 300-500 metriä pitkä ja liittimenä käytetään BNC-liitintä.

5. VIDEON KOMPRESSOINTI

Videon kompressointi ei ole mikään uusi ajatus, vaan sitä on sovellettu jo analogiatekniikassakin. Komponenttivideossa analogisten RGB-signaaleiden sisältämä mustavalko- ja väri-informaatio on erotettu toisistaan ja väri-informaation kaistanleveyttä on rajoitettu. Näin RGB-signaaleiden vaatima 3*5 MHz videokaista on supistettu yhteen 5,0 MHz luminanssikaistaan ja kahteen 2,5 MHz värikaistaan. Vieläkin suurempaan kompressioon päästään PAL-signaalissa väri on moduloitu mustavalkosignaalin yläpäähän. Kompressointi ei siis ole mitään uutta, mutta nykyinen digitaalitekniikka tekee sen vain helpommaksi.

Sovelluksesta ja ratkaisusta riippumatta kompressoinnilla on aina sama tavoite. Suuresta tietomäärästä erotellaan siirtoa tai tallennusta varten vain oleellinen osa, josta pystytään koostamaan mahdollisimman tarkkaan alkuperäistä vastaava tietomäärä. Kompressoidusta kuvasta ei tarvitse välttämättä palauttaa alkuperäisen tarkkaa kopiota, vaan voidaan luoda katsojalle mahdollisimman uskottavasti alkuperäistä vastaava mielikuva. Videon kompressiomenetelmissä hyödynnetäänkin usein ihmisen näköaistin heikkouksia. Silmälle lähes näkymättöminä suurina taajuuksina ilmenevät yksityiskohdat poistetaan kuvasta. Myös näkökyvyn hitautta hyödynnetään pienentämällä nopeasti liikkuvien kohteiden tarkkuutta.

5.1 Kompressoinnin tarve ja periaatteet

Digitaalinen video sisältää suuren määrän dataa. ITU-R 601-studionormin mukaisessa komponenttivideokuvassa 720 * 576 kuvapistettä. Kun luminanssin ja molempien värierosignaalin kvantisointiin käytetään 10 bittiä saadaan yhden kuvan datasisällöksi n.8 Mbittiä. Liikkuva kuva, jonka taajuus televisiossa on 25 Hz, vaatii siten siirtonopeudeksi 207,4 Mbittiä/s. HDTV:n kuva vaatii 1,1 Gbittiä/s siirtonopeuden. Kun näihin lisätään vielä tahdistussignaalit ja virheenkorjaus ja äänikanavat kasvaa digitaalisen datan määrä edelleen. Tällaisten datamäärien siirto ja talletus on hankalaa ja kallista. Näin laajakaistaiset signaalit veisivät nopeasti käytettävissä olevat televisiokanavat. Jos digitaalitekniikan etuja halutaankin hyödyntää taloudellisesti ja teknisesti on kompressointi usein välttämätöntä.

6. MPEG

MPEG standardissa on kolme elementtiä: kuva, ääni ja systeemi. Kuvaelementti määrittelee menetelmän miten kuvaa voidaan kompressoida, vastaavasti äänielementti määrittelee äänen syntaksin. Systeemielementti spesifioi mekanismin miten yhdistetään ja tahdistetaan kuva- ja äänielementit yhdeksi bittivirraksi.

MPEG koostuu kolmesta eri kehyksestä, joita lähetetään peräkkäin: I (intra), P (predictive) ja B (bidirectional) kehyksistä. Frameja lähetetään määritetyssä järjestyksessä I,B,B,P,B,B,P,B,B,I kahden intra framen väliä kutsutaan GOP:ksi (group of picture). I kehys sisältää vain yhden kuvan sisäistä tietoa, kun taas P kehys ennustetaan edellisestä I kehyksestä ja B kehys edeltäneestä ja tulevasta P kehyksestä. I frame siis sisältää eniten informaatiota ja B frame vähiten. Siirtonopeus tasataan puskurissa, joka säätelee siirtotielle menevää bittivirtaa.

Click here for Picture

Kun MPEG-komitea alkoi kehittää järjestelmää kompressoidulle digitaaliselle videolle, sen tavoitteena oli video CD, eli siirtonopeudet maksimissaan n. 1,5 Mbit/s. Koska tiedettiin että tällä siirtonopeudella on mahdotonta lähettää yleisradiotasoista kuvaa päädyttiin 1/4-erottelukykyyn (352x288), joka vastaa hyvää VHS-tason kuvaa. Järjestelmän nimeksi tuli MPEG-1.

Yleisradiotasoisten laitteiden valmistajat havaitsivat välittömästi MPEG teknologian mahdollisuudet lisätä kanavien tehokkuutta maanpäällisissä, satelliitti- ja kaapelijärjestelmissä, mutta teollisuus ei halunnut rajoittua video CD:n siirtonopeuksiin eikä VHS:n tasoiseen resoluutioon. Tämän seurauksena MPEG komitea kehitti toisen standardin nimeltä MPEG-2, joka suunniteltiin erityisesti yleisradiotasoisiin sovelluksiin. Järjestelmässä on studiotasoisen digitaalivideon resoluutio (720x576)ja siirtonopeutena 2,0...15,0 Mbit/s. Lisäksi MPEG-2 mahdollistaa lomittelun, useiden kanavien yhdistämisen yhdeksi bittivirraksi ja laajennuksen HDTV:hen. MPEG-2 dekooderi pystyy myös vastaanottamaan MPEG-1 signaalia.

Click here for Picture

Jakeluteknisissä sovellutuksissa digitaalivideo kvantisoidaan 8 bitillä ja näytteytetään 4:2:0 järjestelmällä. Tämä tarkoittaa, että joka toisella juovalla on luminanssi ja toinen värierosignaali ja joka toisella luminanssi ja toinen värierosignaali. Näin väriresoluutio pudotetaan puoleen luminanssiin nähden myös vertikaalisesti. Bittinopeus MPEG-2 enkooderin sissänmenossa on siis (576*720*8bittiä +2*288*360*8 bittiä)*25 Hz eli 124,4 Mbit/s.

6.1 Transformikoodaus

Transformikoodauksessa kuvan informaatio muutetaan sellaiseen muotoon, jossa redundanssi ja irrelevantti tieto on helpommin tunnistettavissa. Tämä menetelmä ei siis vielä itsessään kompressoi dataa, vaan kuvapisteiden arvot muunnetaan toisistaan enemmän riippumattomiin ja helpommin analysoitaviin taajuuskomponentteihin. Kuvien sisältämä informaationon keskittynyt yleensä matalille taajuuksille, joten korkeiden taajuuksien sisältämä redundanssi saadaan transformikoodauksessa hyvin esiin. Varsinainen kompressointi tehdään näitä taajuuskomponenttien arvoja subjektiivisesti painottamalla sekä pyöristämällä jättäen vähemmän merkitseviä bittejä pois eli kvantisoimalla. Kompressointia tehostetaan koodaamalla kvantisoidut taajuuskomponentit vielä juoksunpituuskoodilla eli RLC-koodauksella ja vaihtuvanmittaisella koodauksella, joista yleisimmin käytetty menetelmä on Huffmann-koodaus.

6.2 Diskreetti kosinimuunnos

MPEG:ssä käytetään diskreettiä kosimuunnosta eli DCT:ä. DCT-muunnoksessa kuva jaetaan tyypillisesti 8*8 kuvapisteen lohkoihin, joille muunnos tehdään. Nämä 8*8 kuvapisteen lohkot muunnetaan 64 transformikertoimiksi, joiden arvot edustavat 64 kaksidimensionaalisen diskreetin taajuuden määrää kuvalohkossa. Käänteisessä DCT-muunnoksessa kuvalohkon rekonstruointi tapahtuu summaamalla nämä yhteen. DCT-muunnoksella saadaan siis selville jaksollisen signaalin taajuusspektri eli siirrytään tarkastelussa aikatasosta taajuustasoon. DCT-muunnos on palautuva eli kuva on palautettavissa täsmälleen alkuperäisen kaltaiseksi käänteisellä muunnoksella.

Nollataajuudella eli kuvalohkon vasemmassa ylänurkassa olevaa transformikerrointa kutsutaan DC-kertoimeksi, joka edustaa kuvalohkon keskimääräistä intensiteettiä. Muut kertoimet ovat AC-kertoimia, jotka edustavat lohkon horisontaalisia, vertikaalisia ja diagonaalisia taajuuksia.

6.3 Kvantisointi

Varsinainen kompressointi tehdään kvantisoimalla DCT-muunnetut kuvapisteet siten, että jokainen transformikerroin jaetaan tietyllä kvantisointitaulukosta haetulla subjektiivisella painotetulla kvantisointikertoimella ja pyöristetään lähimpään kokonaislukuun. Pyöristyksen vuoksi kvantisointi on häviöllinen menetelmä, koska tieto häviää lopullisesti.

Tranformikertoimien kvantisoinnissa voidaan subjektiivisen kuvanlaadun kannalta tärkeimmät kertoimet esittää tarkemmin ja vähemmän tärkeät kertoimet epätarkemmin. Koska ihmissilmä ei ole herkkä kvantisointivirheille korkeilla taajuuksilla, voidaan näitä taajuuksia vastaavat kertoimet kvantisoida karkeammin. Myös diagonaalisia taajuuksia edustavat kertoimet voidaan kvantisoida karkeammin kuin vastaavat horisontaaliset tai vertikaaliset kertoimet.

Nollataajuudella oleva DC-kerroin täytyy kvantisoida AC-kertoimia huolellisemmin, koska kvantisointivirhe DC-kertoimessa muuttaa kuvalohkon keskimääräistä kirkkautta tai väriä. Tämä aiheuttaa näkyvän epäjatkuvuuskohdan vierekkäisten kuvalohkojen välille, mikä ilmenee erityisen selvästi tasaisesti muuttuvissa kuvapinnoissa kuvan lohkottumisena kuvalohkon kokoisiin alueisiin.

6.4 Juoksunpituuskoodaus

Kvantisoinnin jälkeen DC- ja AC-kertoimet käsitellään eri tavalla. Koska DC-kerroin sisältää huomattavan osan kuvan kokonaisenergiasta ja vierekkäisten kuvalohkojen DC-kertoimet korreloivat yleensä voimakkaasti, käytetään DC-kertoimeen koodauksen prediktiivistä menetelmää eli koodataan ainoastaan peräkkäisten kuvalohkojen DC-termien erotus.

Kvantisoinnin jälkeen useimmat DCT-kertoimet ovat nollia ja vain harvat kertoimet saavat nollasta poikkeavia arvoja. Lisäkompressiota saavutetaan poistamalla nämä nollasekvenssit juoksunpituuskoodilla, jossa ilmoitetaan nollasta poikkeavan kertoimen arvo ja sitä edeltävien peräkkäisten nollien lukumäärä. Juoksunpituuskoodauksen tehokkuutta parannetaan muuntamalla kvantisoidut AC-kertoimet yksidimensionaaliseksi jonoksi zigzag-skannauksella, jossa matalataajuiset kertoimet sijoittuvat ennen korkeataajuisia kertoimia ja siten myös nollasekvenssit pitenevät kertoimien välillä.

6.5 Vaihtuvanmittainen koodaus

Juoksunpituuskoodauksen jälkeen kuvalohko voidaan koodata tehokkaasti vaihtuvanmittaisella koodauksella, joka on luonteeltaan häviötön koodaus. VLC-koodauksesa useimmiten esiintyvät arvot koodataan lyhyellä koodisanalla ja harvemmin esiintyvät arvot pitemmällä koodisanalla. Tällä tavoin saadaan kuvalohkon esittämiseen tarvittava keskimääräinen bittien lukumäärä vähenemään merkittävästi. Lyhyempi koodisana ei saa kuitenkaan esiintyä pitemmän koodisanan alkuosana, jotta VLC-koodisana voidaan palauttaa yksikäsitteisesti takaisin alkuperäiseksi sanaksi.

6.6 Hybridi-DCT-koodaus

Transformikoodauksessa kuvansisäinen spatiaalinen redundanssi voidaan poistaa tehokkaasti, mutta ilman kuvienvälistä koodausta jää kompressio usein vaatimattomaksi. Liikekompensoidulla prediktiivisellä koodauksella voidaan taas kuvien välinen temporaarinen redundanssi poistaa tehokkaasti, mutta koodatut erotuskuvat sisältävät yhä spatiaalista redundanssia. Jos nämä molemmat kompressiomenetelmät yhdistetään siten että prediktiivisen koodauksen jälkeen liikekompensoidut erotuskuvat lisäksi transformimuunnetaan, niin kuvien välinen sekä spatiaalinen että temporaalinen redundanssi saadaan poistettua. Tätä kompressiomenetelmää kutsutaan hybridi-DCT-koodaukseksi. Hybridikoodaus on tehokas kompressiomenetelmä, jossa erilaisia koodausmenetelmiä yhdistämällä saavutetaan merkittävästi parempi kompressiosuhde.

6.7 Liikkeenkompensoitu hybridikoodaus

Hybridikoodauksessa joko liikekompensoidun viimeksi lähetetyn kuvan ja uuden kuvan erotuskuva koodataan tai kuva kompressoidaan ainoastaan kuvan sisäisesti, jolloin aikaisemmin koodatun kuvan tietoa ei käytetä hyväksi. Koska kuvajaetaan DCT-muunnettuihin kuvalohkoihin, myös liikkeenestimointi perustuu lohkoihin. Aikaisemmin koodatusta kuvasta löydetyn ennustuslohkon ja koodattavan kuvalohkon erotus DCT-muunnetaan ja saadut transformikertoimet kvantisoidaan. Tämän jälkeen lähetettävä bittivirta kompressoidaan vielä vaihtuvanmittaisella koodilla. Koska liikkeenkompensointia ei tehdä transformitasossa, niin kooderissa tarvitaan myös käänteiset DCT- ja kvantisointioperaatiot.

Click here for Picture

VLC-koodauksen vuoksi datamäärä kuvien välillä vaihtelee, joten kooderi ulostulossa tarvitaan puskurimuisti, jolla ulostulevan bittivirran nopeus tasataan vakioksi. Puskurin täyttöaste säätää kvantisointia siten, että puskurintäyttyessä kvantisointi muuttuu karkeammaksi ja siirtonopeus putoaa. Puskurin tyhjentyessä datavirtaan lisätään ylimääräisiä datasanoja, joilla siirtonopeutta saadaan nostettua.

7. DIGITAALINEN AUDIO

Digitaalinen audiotekniikkaa perustuu ns. AES/EBU spesifikaatioon, joka määrittelee äänen näytteenottotaajuudeksi 48 kHz ja vähintään 16 bitin kvantisointi. Yhden audiokanavan siirtonopeudeksi tulee näin 768 kbit/s. Nykyinen tilaääni tekniikka vaati tuotannossa vähintään viittä äänikanavaa eli 5*768 kbit/s eli 3,84 Mbit/s.

7.1 MPEG-2 audio

Digi TV:ssä käytetään ISO/MPEG-2 audio äänen bittiredusointi järjestelmää, jossa kukin audiokanavaa redusoidaan vaihtoehtoisesti joko 128 kbit/s tai 64 kbit/s. MPEG-2 on monikanavajärjestelmä, joka laajentuu 5,1 kanavaiseksi. 0,1 tarkoittaa erillistä matalien taajuuksien kanavaa, joka voidaan siirtää pienellä bittinopeudella.

7.2 Bittireduktion perusteet

Äänen bittireduktio perustuu korvan psykoakustiseen malliin, jota on maailmalla tutkittu laajasti. Bittireduktion kannalta tärkeimpiä käsitteitä ovat kuulokynnys, kriittinen taajuuskaista sekä peittoilmiö. Ihmisen havaitsema taajuusalue on 20 Hz:stä 20 kHz:iin. Kuulon dynamiikka-alueen alarajana on on kuulokynnys ja ylärajana kipukynnys.

Kuulokynnys on pienin äänenvoimakkuus, jolla tietynlainen ääni on juuri ja juuri kuultavissa. Kuulokynnys riippuu voimakkaasti taajuudesta. Kuulon herkin taajuusalue on 2-5 kHz:n kohdalla ja äänenpainetaso laskee jyrkästi 16 kHz:n tuntumassa.

Kriittinen taajuuskaista kuvaa ihmisen kykyä analysoida leveäkaistaista ääntä. Spektriltään leveämmän signaalin äänekkyys kasvaa kaistanleveyden funktiona, kun kokonaisäänenpainetaso pidetään vakiona, mutta sitä kapeamman signaalin äänekkyysaistimus ei enää riipu kaistanleveydestä vaan pelkästään äänenpaineesta. Käytännössä kriittinen kaistanleveys on n. 100 Hz, kun taajuus alle 500 Hz ja n. 20 % keskitaajuudesta, kun taajuus suurempi kuin 500 Hz.

Peittoilmiö tarkoittaa korvan ominaisuutta, jolloin suuritasoisen äänen taajuuden lähellä olevia pienitasoisia signaaleja ei korva kuule. Vastaavan tyyppinen peittoilmiö on myös ajan suhteen. N.20 ms ennen ja n. 100 ms jälkeen suuri tasoisen signaalin ei korva kuule.

8. MODULAATIOMENETELMÄT

DVB-T:ssä on useita eri modulaatiovaihtoehtoja, jotka mahdollistavat valinnat bittinopeuden ja peittoalueen välillä. Eri tasoisilla QAM modulaatioilla ja virheenkorjaussuhteilla pystytään tekemään valintoja eri maiden lähtökohdista lähtien. Todennäköisimmät vaihtoehdot ovat 64-QAM 2/3 virheenkorjauksella ja 64-QAM 7/8 virheenkorjauksella. Suhdeluku kertoo hyötysignaalin osuuden kokonaisdatasta. Ensin mainittu mahdollistaa n. 20 Mbit/s hyötybittinopeuden osuuden kanavassa ja jälkimmäinen n. 26 Mbit/s hyötybittinopeuden. Epäilyjä on riittääkö jälkimmäisen virheenkorjaus riittävään peittoon nykyisellä lähetin tiheydellä.

Yhden TV-ohjelman siirtonopeuden tarve on paljolti kiinni kuvasisällöstä mutta nykyisellä MPEG-2 kompressiotekniikalla se lienee 4-8 Mbit/s. Eli yhteen kanavaan mahtuu 3-6 TV ohjelmaa. Mm. Yleisradio on parhaillaan tekemässä selvityksiä eri ohjelmamateriaalien siirtonopeustarpeista.

Kantoaalto modulaatio DVB:ssä tehdään COFDM-modulaatiolla, joka tehdään nopealla Fourier-muunnoksella. DVB:n standardointi elimissä väännettiin pitkään kättä toteutetaanko COFDM 2000 vai 8000 kantoaallolla. Lopputulemana oli luonnollisesti kompromissi, jossa molempia voidaan käyttää mutta 8k:n on pystyttävä vastaanottamaan 2k:ta. 2k haluttiin saada speksiin mukaan, koska 8k:n vastaanottolaitteiden hintojen pelätään nousevan korkeaksi ja näin estävän maanpäällisen järjestelmän kilpailukyvyn kaapeli- ja satelliittijärjestelmiin. Haittapuolena 2 k järjestelmässä on että se ei mahdollista ns. yhden taajuuden verkkoa suuremman suojaetäisyys tarpeen vuoksi vaan eri lähettimien taajuudet on oltava eri kanavilla.

9. YHTEENVETO

Digitaali TV on tällä hetkellä kuuma keskusteluaihe sekä Suomessa että muualla Euroopassa. Suurin kiinnostus maanpäällisen digi televisioon näyttää olevan Iso-Britanniassa ja Pohjoismaissa. Iso-Britannia on ilmoittanut alkavansa digi lähetykset vuoden 97 lopussa. Suomessa mahdollinen aloittamisaika lienee vuosituhannen vaihteessa.

Digitaalijärjestelmä mahdollistaa 16:9 sivusuhteen esittämisen 625 juovaisena. Myös HDTV on mahdollista, mutta yksi HDTV ohjelma vie yhden kokonaisen kanavan.

Ongelmana digi TV:n lanseeraamisessa on että mitä se tarjoaa tavalliselle katsojalle? Ylimääräinen tv kanava on hyvä porkkana, 16:9 kuva? Paremmat teksti TV palvelut? Jakeluyhtiöillehän edut ovat kiistämättömät: pitemmän päälle halvemmat jakelukustannukset, analogiaverkon väistyttyä taajuuksien vapautuminen...kunhan vain taloudelliset näkökohdat eivät tallaa kuvan teknistä laatua. Toinen ongelma on vastaanottimien hinta, josta ei ole tällä hetkellä todellista tietoa. Ettei vaan käy niin kuin keski-Euroopassa kaksi vuotta sitten käyttöönotetulle PALplussalle. PALplus vastaanottimen hinta Saksassa on 18 000 Suomen markkaa eikä tekniset ratkaisut ole digi TV:hen verrattavissa..

Lähdeluettelo

1. Tech 3267-E 1992. EBU interfaces for 625-line digital video signals at the 4:2:2 level of CCIR recommendation 601.

2. Haikonen Pentti O.A. 1992. Videotekniikka.

3. INSKO: Uudet digitaaliset kuvakompressio- ja jakelumenetelmät 5.6.1994

4. ITU: Draft specification for digital terrestrial television, considerations and technical choices.

5. SMPTE Journal december 95