S-38.164
Laajakaistainen välitystekniikka
Harjoitustyö:
Referaatti Kouichi Gendan ja Naoaki Yamanakan artikkelista
TORUS: Terabit-per-second ATM Switching
System Architecture Based on Distributed Internal
Speed-Up ATM Switch
Tekijät:
Harri Kapanen, 42894N
Petri Jäppilä, 40487V
Juha Nieminen, 42978A
Mikko Suni, 43047P
Tulevaisuuden multimediaverkot edellyttävät nopeaa sekä eritasoisia palveluja tarjoavaa siirtoverkkotekniikkaa. ATM:stä on suunniteltu laajalti povatun B-ISDN:n siirtotekniikkaa.
Nopeiden tilaajaliittymien ja kasvaneen käytön myötä vaaditaan kytkentäjärjestelmiltä jopa terabitin kytkentäkapasiteettia. Järjestelmien pitäisi pystyä tarjoamaan eri palveluluokille riittävä laatu ja kapasiteetti taloudellisesti järkevään hintaan.
Artikkelissa ehdotettu ratkaisu terabitin ATM-kytkentäjärjestelmäksi koostuu kahdenlaisista moduleista – kaupallisista ATM-kytkimistä (AHM) sekä nopeasta yhdistysmodulista (AMC), jolla kytkimet yhdistetään toisiinsa (kuva 1). Kaupalliset kytkimet tarjoavat ulospäin 155-600 Mbit/s yhteydet ja yhdistysmoduli 2,5 – 10 Gbit/s yhteydet kytkinten välille.
Toruksen perusideana on pitää AMC mahdollisimman yksinkertaisena ja siten nopeana. Nopeuden ansiosta palvelun laatu kytkinten välillä ei kärsi. ATM-kytkimet hoitavat kaikki ATM-kerrokselle määritellyt toiminnot ja AMC ainoastaan solujen passiivisen välittämisen kytkimeltä toiselle virtuaalipolkutunnusten perusteella. Artikkelin mukaan palveluluokista AMC:ssä kannattaisi eritellä vain viiveherkkä ja ei viiveherkkä liikenne. Törmäyksenhallinta tulisi toteuttaa hyvin yksinkertaisesti, koska kytkentäpäätös on tehtävä alle solujakson aikana.
Kuva 1. Laitteistoarkkitehtuuri
Terabittien nopeus edellyttää suurehkoja ja hyvin nopeita solupuskureita. Suuri nopeus estää tiheään pakattujen ja monimutkaisten piirien käytön lämpöongelmien vuoksi. Ongelmaa on lähestytty eriyttämällä solukytkentäosat puskureista, jolloin voidaan käyttää hajautetusti pieniä, nopeita piirejä, jotka kytketään valokuiduilla. Lisäksi AMC:n sisällä käytetään suurempaa siirtonopeutta kuin tuloporteissa.
Yhdistysmoduli on Toruksen ydinkomponentti, joka ratkaisee järjestelmän kapasiteetin. Esitettyjen laskelmien mukaan sadalla 20 Gbit/s ATM-kytkimellä saavutettaisiin terabitin kytkentäkapasiteetti, koska kaistanleveys kytkimen ja AMC:n välillä olisi noin 10 Gbit/s, jolloin puolet kytkimen kapasiteetista kuluisi järjestelmän sisäiseen kytkentään. AMC:n tulisi siis skaalautua vähintään kokoon 100x100 saakka, mikä kuitenkaan ei ole Toruksella mahdotonta järjestelmän hajautetun luonteen vuoksi.
Vaihtoehtoisista toteutustekniikoista ristikytkentämatriisiin pohjautuvilla kytkimillä saavutetaan vain kymmenien gigabittien kytkentäkapasiteetti, koska nopeammat ratkaisut edellyttäisivät kytkentäpisteiden solupuskurien kohtuutonta pienentämistä aiemmin mainituista piiriteknisistä syistä.
Matriisikytkinten rajoituksia on kierretty kehittämällä sisäisesti tuplanopeudella toimiva crossbar -tyyppinen kytkin, jonka kytkentäkapasiteetti on 160 Gbit/s. Sisäänmenojen ja ulostulojen nopeus on 10Gbit/s ja sisäinen nopeus 20 Gbit/s. Ratkaisu käyttää Cu/PI MCM-teknologiaa ja liukuhihnaperiaatetta bittien siirtämisessä perättäisten kytkentäpisteiden välillä, jotka on synkronoitu tarkasti sisääntulosignaalien vaiheen perusteella.
Tämän ratkaisun jatkokehityksen tiellä ovat MCM-tekniikan virransyöttö- ja jääähdytysongelmat sekä täsmällisen synkronoidun kellosignaalin jakaminen kytkentäpisteille. Lisäksi törmäyksenhallinta on vaikea toteuttaa suuremmilla nopeuksilla solun lukuaikaa nopeammaksi.
Mainittujen pohdintojen pohjalta on esitetty Torus-konsepti AMC:n toteuttamiseksi. Torus tarjoaa nopean, hajautetun ja sisäisesti nopeutetun yksinkertaisen kytkinarkkitehtuurin, joka ei vaadi suurta piirien pakkaustiheyttä ja joka tarjoaa tilastollisesti suuren läpäisyn.
Kytkinjärjestelmän toiminnallinen rakenne on esitetty kuvassa 2. AHM suorittaa kaikki ATM-tason toiminnot: Käytön ja kunnossapidon (OAM), VC-tason kutsujen hyväksynnän (CAC), VP-tason kaistanvarauksen (BA) ja VC-kytkennän. Kaistanvaraus on toteutettu käyttäen virtuaalipolkujen ryhmittelyä (GVP). AMC:n ainoa tehtävä on huolehtia AHM-lohkojen välisestä erittäin nopeasta VP-kytkennästä ilman palvelutason heikkenemistä, kuten viiveiden kasvu ja solujen katoaminen AMC:ssä.
Kuva 2. AHM:n ja AMC:n toiminnallinen rakenne
Itsereitityksen toteutus on esitetty kuvassa 3. Jokaisen AHM:n edessä on osoitekonvertteri (HCV) solun VPI:n ja VCI:n muuttamiseen. AMC ei toteuta mitään HCV-toimintoja. Kytkinjärjestelmään tuloon saapuessaan solun VPI ja VCI muutetaan HCV:n toimesta AMC:n kohteen tai lähtöpuolen AHM tuloportin mukaiseksi. Uusi VPI osoittaa sekä tulo- että lähtöpuolen AHM:ien numerot. Solut reititetään passiivisesti AMC:ssä lähtöpuolen AHM-numeron mukaan. Lähtöpuolen AHM:ssä solut reitittyvät kohteisiinsa, kun niiden VPI ja VCI numerot ovat taas uudistettu HCV:llä.
Kuva 3. Itsereitityksen kaavio
Kuva 4 esittää QoS:n kontrollointimekanismia tässä kytkinarkkitehtuurissa. Tässä järjestelmässä AHM:t hallitsevat jokaisen palveluluokan suurien solupuskureiden avulla, koska tilaajajohdot, joiden purskeinen liikenne perustuu uusiin palveluluokkiin, ovat suoraan yhteydessä AHM:iin. Toisaalta AMC:ssä tarvitaan vain muutama QoS luokka, sillä ne ovat täysin riippumattomia AHM:ien tukemista liikenneluokista (ATC). Koska AMC:n tärkein tehtävä on nopea kytkentä, pitäisi sen QoS algoritmin olla yksinkertainen. Muutama luokka riittää varmasti, sillä QoS pidetään AMC:ssä lähes vakiona 10 Gbps solukytkennän avulla. Kuvan 4 esimerkissä kaikki ATC:t on kutistettu kahteen QoS ryhmään: ryhmä 1 on viiveherkälle liikenteelle ja ryhmä 2 viiveen sallivalle liikenteelle.
Kuva 4. QoS kontrollointi
OAM toiminnot on jätetty pois AMC:stä monimutkaisten mekanismiensa takia, eli tässä järjestelmässä ne toteutetaan vain AHM:ssa. Koska AMC käsittelee OAM soluja kuten käyttäjän solujakin, OAM virtoja ei katkaista AMC:ssä. Yhteys AHM:ien välillä tarkastetaan käyttämällä F4-loopback soluja, jotka generoidaan ja terminoidaan AHM:ssa ja välitetään AMC:n läpi. Järjestelmän suorituskykyä hallitaan samoin; F4-forward monitoring ja -backward reporting –solut generoidaan ja terminoidaan AHM:ssä AMC:n läpi.
Kaistanvarausmenetelmä
Kaistanvaraus toisiinsa kytkeytyneiden AHM:ien välillä perustuu virtuaalipolkujen ryhmittelyyn (GVP = group VP). Kaista linkille AHM #i:stä AHM #j:hin varataan kutsu kutsulta tarpeen mukaan aina TVP-kaistarajaan (Total VP) saakka. Algoritmi on esitetty kuvassa 5. Tässä järjestelmässä TVP on yhtä kuin AMC:n tarjoama fyysinen nopeus. Kaistanhallinta on toteutettu sekä tulo-, että lähtöpuolen AHM:ssä, eli AMC:ssä ei ole siihen liittyviä mekanismeja.
Kuva 5. Kaistanvarausalgoritmi
Kuva 6 esittää järjestelmän kokonaiskytkentäkapasiteetin toisiinsa kytkettyjen AHM:in lukumäärän funktiona. Kytkinjärjestelmää on verrattu toiseen arkkitehtuuriin, jossa AHM:t on kytketty suoraan toisiinsa kiinteäkaistaisilla linkeillä ilman AMC:tä. GVP-järjestely voi kasvattaa kokonaiskytkentäkapasiteettia kytkettyjen AHM:ien lukumäärän suhteessa, sillä solujen ja kutsuvirtojen keräyminen aiheuttaa hyötyä tilastollisen tasoittumisen myötä. Kuvaajan mukaan AMC on tarpeen AHM:ien yhdistämiseen, kun kokonaiskytkentäkapasiteetti ylittää 200 Gbps.
Kuva 6. Kytkinjärjestelmän kokonaiskytkentäkapasiteetti
Torus-kytkimen arkkitehtuuri
Kytkimen looginen rakenne on esitetty kuvassa 7. Kaikki Torus-kytkimen sisään- ja ulostulot on kytketty AHM:iin jotka ovat sylinterimuodossa AMC:n ympärillä. AMC perustuu sisäisesti nopeudeltaan kiihdytettyyn ristikytkentätyyppiseen rakenteeseen jossa ei ole sisäisiä puskureita. Puskurointi on keskitty solupuskureihin, joita on jokaisessa AMC:n sisään- ja ulostulossa.
AHM:stä tuleva solu tallennetaan väliaikaisesti AMC:n sisääntulopuskuriin. Puskurissa ensimmäisenä olevan solun osoitetta verrataan ensin samalla sisääntulolinjalla olevissa kykentäpisteissä. Kuvassa 7 sisääntulolinja on samalla pystysarakkeella olevat kytkentäpisteet. Jos kyseiseen kytkentäpisteeseen ei ole samanaikaisesti tulossa vasemmalta toista solua, niin solu kytketään tälle ulostulolinjalle. Ulostulolinja on kuvassa sylinterin kiertävä vaakatasoinen ympyrä. Kun solu on onnistuneesti kytketty ulostulolinjalle, lähetetään solun sisäätulopuskurille ACK kuittausviesti.
Kuva 7. TORUS-kytkin
Ulostulolinjalla solun välitetään ympyrän seuraavalle kytkentäpisteelle optisella linkillä. TORUS-kytkimessä käytetty solujen itsetahdistus poistaa tarpeen siirtää kellosignaalia kaikille kytkinkomponenteille, koska käytettävä kello generoidaan solukohtaisesti. Solujen itsetahdistuspiirien määrä- ja sijainti kytkimessä voidaan valita useammalla tavalla. Yksi mahdollisuus on asettaa ne ainoastaan ulostulopuskureihin, jolloin ne tahdistavat AHM:lle tulevat solut.
Valitusta rakenteesta johtuen AMC toimii FIFO-periaatteella. Törmäyksen kokeneet solut yksinkertaisesti lähetetään uudelleen kunnes saadaan viesti solun läpimenosta. Tälläinen yksinkertaistettu uudelleenlähetysmekanismi on välttämätön, jotta rakennetta voidaan käyttää nopeassa kytkimessä.
Torus-kytkimeen valittu sylinterirakenne mahdollistaa joustavan laajentamisen. Käytetyssä ratkaisussa sisään- ja ulostuloportit on koottu samalle kortille, joka taas on kytketty AHM:lle. Kytkintä käyttävä operaattori voi kasvattaa kapasiteettia yksinkertaisesti lisäämällä vapaana oleviin korttipaikkoihin lisäkortteja.
Solujen itsetahdistuksella (self-bit-synchronization) saavutetaan useiden kymmenien gigabitien välityskapasiteetti sekunnissa ilman voimakkaita pakkaustekniikoita. Valittu tekniikka ei vaadi bittisynkronisaatiopiireissä ajastukseen yhteistä kelloa. Kellosignaalin paikallinen generointi mahdollistaa järjestelmän hajautuksen, sillä gigabittien kellosignaalia ei ole mahdollista välittää täsmällisesti pitkiä matkoja. Itsetahdistuksessa tahdistutaan saapuvan solun vaiheeseen. Menetelmässä valitaan parhaiten tulosoluun sopiva kello monista eri vaiheessa olevista kelloista.
Kuva 9 näyttää lohkokaavion Toruksen itsetahdistuspiiristä. Piiri käsittää kellon valintapiirin, kellogeneraattorin ja D-flip-flopin (D-FF). Piirin kellotaajuus on sama kuin järjestelmän kellotaajuus. Aikaa tai vaihetta ei olla määritelty ollenkaan. Useita "eri" kelloja saadaan aikaan kellogeneraattorissa, jossa jokainen kello saa oman vaiheen. Piirin lähdössä solut bittisynkronisoidaan D-flip-flopissa.
Kuva 8. Kytkimen looginen perusrakenne
Kuva 8 esittää TORUS-kytkimen loogikkakaavion ja uuden hajautetun valinta-algoritmin FOP (fixed output-precedence). Kilpailutilanteessa valinta suoritetaan jokaisessa kytkentäpisteessä, koska keskitetty toiminta rajoittaisi kytkimen skaalattavuutta. FOP-algoritmissa ei tarvita erillistä solujen valintaa, jos kohde on sama. Kiinteä FOP numero (FOPN) on määritelty jokaiselle kytkentäpisteelle.
Kaikille tulopuskureille annetaan samanlainen mahdollisuus välittää solut kohteeseen määrittelemällä kukin kytkentäpiste jokaisessa sisääntulossa eri FOPN:ksi. Jokaisella eri tuloportista tulevalla solulla on erilainen etuoikeus päästä tiettyyn lähtöön johtavalle kierrokselle.Tasapainotetussa sisääntuloliikenteessä kaikki tulopuskurit saavuttavat samat liikenneparametit, sillä tulosolujen kohde on hajautunut lähtöportteihin. Kuitenkin jokaisen yksittäisen kytkennän lähtökuorma eri lähtöihin vaihtelee. Jotta QoS voitaisiin taata on sisäistä nopeutta kasvatettava.
Kuva 9. Solujen itsetahdistus
Torusta voidaan laajentaa ottamatta huomioon kontrolliaikaa, joka tarvitaan solun reitin vertailevaan ratkaisemiseen. Tämä saavutetaan, koska FOP-algoritmi ei tarvitse neuvottelua eri kytkentäpisteiden välillä. FOP-algoritmillä laitteisto vähenee merkittävästi ja samalla toteutus voidaan hajauttaa.
Liikenneparametrit
Torus- kytkin, jolla on sisäinen nopeus (m x ulkoinen nopeus), voi käsitellä raskasta tuloliikennettä. Suurin mahdollinen tulokuorma kasvaa m:n mukana, koska solujen määrä tulopuskurista määränpäähän kasvaa ajassa T .
m sisäisen nopeuden suhde ulkoiseen nopeuteen ,
r in sisääntulokuorma
Nin sisääntulevien solujen lkm sisääntulosolun jakson aikana T,
Nout suurin mahdollinen välitettyjen solujen lkm sisäntulopuskurista Nin sisääntulosolun jakson aikana
Kuva 10. Sisäisen ja ulkoisen nopeuden suhde
Tasapainotetulla liikenteellä tulokuorma r in voi kasvaa arvoon 1, kun sisäisen nopuden kerroin m on vain 2. Jopa tasapainottamattomalla liikenteellä voi r in kasvaa arvoon 1, kun m on vain 3. Tällöin kaikki yhteydet ovat taattuja.
Suoritettujen simulaatioiden perusteella saavutetaan kohtuullinen soluhukka (10-8) sisäisen nopeuden kertoimella m=2, tulopuskurin koolla 40 ja lähtöpuskurin koolla 200 solua. Tällöin latenssi pysyttelee 155 Mbit/s tilaajalinjan kannalta kohtuullisena – maksimissankin neljän solujakson mittaisena.
Peruskonsepti yksinkertaisesta yhdistysmodulista, jolla kytketään yhteen olemassaolevia ATM-kytkimiä, vaikuttaa toteutuskelpoiselta. Yksinkertaisuuden vuoksi jo käytössä olevalla teknologialla saavutetaan melkoinen kytkentäkapasiteetti. Hajautettu arkkitehtuuri skaalautuu ilmeisen hyvin jopa mainittuun 100x100 kokoon saakka. Verrattuna ATM Forumin monimutkaisiin QoS-toteutuksiin AMC:n tapa taata palvelun laatu yksikertaisella törmäyshallinnalla ja raa’alla voimalla ilahdutti suuresti.
Rakennettu koesysteemi vaikutti lupaavalta, koska nähtävästi pienellä rahalla toteutetulla 4x2 kytkimellä saavutettiin 2,5 Gbit/s porttinopeus ja melko vapaa laajennettavuus. Artikkeli esitteli tuloksia kuitenkin epätarkasti, joten tuloksiin on syytä suhtautua hieman varauksin. Samoin simulaatiot vaikuttivat tilastollisesti yksinkertaistavilta, eikä siten todellisuutta vastaavilta. Yhteenkytkettyjen ATM-kytkinten keskinäinen kapasiteetti rajoittunee mainittuun 10 Gbit/s nopeuteen, joten Toruksen tehokas hyödyntäminen edellyttää kuormituksen tasapainottamista eri ATM-kytkinten välille.
Jatkokehityksestä ei artikkelissa mainittu. Tutkijat vain esittävät mittaustulosten perusteella laitteen olevan sopiva Terabit B-ISDN-kytkimeksi. Kuitenkin tulokset olisi syytä varmistaa kattavammilla simuloinneilla kuin mitä artikkelissa esitettiin.