Képtömörítés: a multimédia rendszerek kulcsa megtekintése

(1)

Winfried Gödért

M u Itim edia-I-l n / y k 111 padién auf C D - R O M

Eine verKltíeliende Analysr von AllKi'iiieinenzyklupütlien

DEUTSCHES BIBLIOTHEKSINSTITUT

GÖDÉRT, Winfried

Mutimedia-EnzyklopádiGti auf CD-ROM: eine vergleichende Analyse von Allgemelnenzyklopá- dien/Winfried Gödért; [Hrsg.] Dautsches Bib- liotheksinstitut. - Berlin : Dt. Bibliotheksinstltut. • 1994. - 125 p. (Informatlonsmlttel für Bibliotheken, ISSN 0946-878 ; 1.)

Bibliogr.: lábjegyzetkánt ISBN 3-87068-541-7

New Grolier Electronic Encyclopedia. A k ö n y v b e n szereplő enciklopédiák közül ez a

„legtudományosabb". A l a p j a a 2 1 kötetes Academic American Encyclopedia k b . 3 3 0 0 0 c í m  szóval. T ö b b s z í n ű képek é s hangfelvételek tartoz

nak h o z z á . A z itt szereplő t e r m é k e k között e z az egyetlen, amely n e m grafikus felhasználói felülettel r i o l n n 7 Í k

The Software Toolworks Multimedia Ency

clopedia. Alapja szintén az A c a d e m i c A m e r i c a n Encyclopedia, felhasználói felületét a W i n d o w s adja, és multimédiás e l e m e k e t integrál m a g á b a : térképeket, hang- és videofelvételeket, animáció

kat.

A z előző t e r m é k k e l ö s s z e h a s o n l í t v a j ó l látható, milyen előnyös a grafikus felhasználói felület, és a multimédiás elemekkel v a l ó kiegészítés.

Microsoft Encarta. M e s s z e a legtöbb multi

médiás elemet t a r t a l m a z z a . S z ö v e g e s tartalmának forrása a 2 9 kötetes Funk & Wagnells New Encyclopedia, a m e l y h e z k b . 1 0 0 0 saját c í m s z ó is társul, Összesen k b . 2 5 0 0 0 . M i n d e z 17 0 0 0 multi

médiás e l e m m e l bővül: 7 ó r a hangfelvétel ( 3 5 0 zenei részlet, t ö b b s z á z állat- é s speciális madár

h a n g , beszéd részlet, példák 4 5 nyelvből és 5 0 0 0 elhangzó s z ó e g y szótárból), t ö b b ezer k é p , ani

máció, videofelvétel és térkép.

Bertelsmann Lexikodisc. Alapja a 15 kötetes Bertelsmann Lexikothek. A z 1-es verzió f e l h a s z n á  lói felületét a W i n d o w s 2 . 0 3 adja, a m e l y b e n kis ablak nyílik a keresési s z a v a k m e g a d á s á r a . A 2-es verzió m á r W i n d o w s 3.1 alatt fut, d e a funkciók és szolgáltatások n e m változtak. B á r egyik változatot s e m tekinthetjük multimédia enciklopédiának, mégis bekerültek e k ö n y v b e , mert e z volt az első n é m e t C D - R O M általános enciklopédia.

Bertelsmann Unversallexikon. Ez az első német C D - R O M multimédia enciklopédia - b á r csak néhány multimédiás e l e m e t tartalmaz. Alapja az egykötetes Bertelsmann Universallexikon. W i n d o w s 3.1 alatt fut.

Mindaz, a m i a k ö n y v b e n megtalálható, inkább c s a k kóstoló, n e m pedig részletes ismertetés. A programok igazán c s a k akkor ismerhetők m e g , h a már saját, gyakorlati tapasztalatunk is v a n h a s z n á latukról.

A 4 2 oldalnyi s z ö v e g j o b b m e g é r t é s é t segíti a függelékben található rengeteg ábra az egyes t e r m é k e k képernyőképeivel.

Szakács Tamás (Evangélikus Teológiai A k a d é m i a )

Képtömörítés: a multimédia rendszerek kulcsa

A multimédia r e n d s z e r e k b e n s o k s z o r o s a n n a g y o b b m e n n y i s é g ű információt kell v o n a l o n (távközlési v o n a l o n , v a g y a z optikai lemezről a s z á m í t ó g é p b e ) t o v á b b í t a n i , mint a m e n n y i a s z ó b a n f o r g ó v o n a l a k átviteli kapacitása. Ezért a multimé

dia rendszerek teljességgel megvalósíthatatlanok

voltak a megfelelően hatékony k é p t ö m ö r í t é s i eljá

rások és a z ezeket m e g v a l ó s í t a n i képes hardver- és szoftvereszközök kifejlesztése előtt. A z alábbi

a k b a n a m a elterjedt t ö m ö r í t é s i eljárásokat és a m a érvényes k é p t ö m ö r í t é s i s z a b v á n y o k a t tekintjük át.

(2)

Beszámolók, szemlék, referátumok

1. Állókép-tömörítés: JPEG rendszer

A z állóképek t ö m ö r í t é s e során viszonylag lazák a feldolgozás időbeli korlátai, viszont igen nagyok az igények a képfeldolgozás f i n o m s á g a és a kódo

lás-dekódolás viszonylagos veszteség m e n t e s s é g e iránt. Sokszor (például a K o d a k P h o t o - C D eseté

ben) lehetőséget kell adni arra, hogy a felhasználó a kódolt képet több különböző felbontási f i n o m sággal állíthassa helyre. A kódolás-dekódolás folyamatának bármely k é p m é r e t r e és a képek bármely oldalarányára végrehajthatónak kell len

nie. Tetszőleges képtartalmat m e g kell engedni, a színábrázolásnak pedig függetlennek kell lennie a konkrét alkalmazástól. A létrehozott adatáramnak olyannak kell lennie, hogy a kódoló és a dekódoló rendszer egymástól független lehessen.

A z ISO (International Standards Organisation = Nemzetközi S z a b v á n y ü g y i Szervezet) egyik m u n kacsoportja 1982 júniusától kezdett foglalkozni az állókép-tömörítés nemzetközi s z a b v á n y o s í t á s á v a l . Munkájuk e r e d m é n y e k é p p e n 1992-re született m e g az ISO/IEC IS 10918 jelű nemzetközi s z a b vány. A z e b b e n rögzített eljárást J P E G módszer

nek nevezik, arról a Joint Photographic Experts Group (= fényképészeti s z a k e m b e r e k egyesített csoportja) nevű s z a k m a i csoportról, amely a s z a b ványtervezetet végül is kidolgozta.

A J P E G eljárásban a képtömörítés négy lépés

ből áll:

> képelőkészltés,

> képfeldolgozás,

> kvantálás,

> a létrehozott bitáram tömörítése.

A képfeldolgozásnak négy módját engedi m e g a szabvány:

> veszteséges szekvenciális m ó d ,

> kiterjesztett v e s z t e s é g e s m ó d ,

> v e s z t e s é g m e n t e s m ó d ,

> hierarchikus m ó d . 1.1 KépelÖkészités

A J P E G rendszer n a g y o n általános képdefiní

ciós rendszert használ, hogy ne k ö s s e m e g a kó

dolandó képnek s e m a méretét, s e m az oldalará

nyát, s e m a felbontási f i n o m s á g á t stb.

A z előkészítés első lépéseképpen a képet k o m p o n e n s e k r e , m á s n é v e n rétegekre bontják.

Legalább 1, legfeljebb 2 5 5 k o m p o n e n s r e bontható a kép. A gyakorlatban a m o n o k r ó m képeket rend

szerint egy k o m p o n e n s k é n t kezelik, a színes ké

peket pedig a színábrázolás rendszerével m e g h a tározott három k o m p o n e n s r e bontják.

N e m kötelező, hogy a képfelbontás f i n o m s á g a , vagyis a képpontok m é r e t e minden k o m p o n e n s b e n azonos legyen. A háromszln-eljárásban ( R G B eljárás), a m e l y b e n a h á r o m alapszín (R - red =

v ö r ö s , G = green = zöld, B = blue = kék) intenzitá

sát külön-külön kezelik, a h á r o m alapszínnek megfelelő h á r o m k o m p o n e n s felbontási finomságát célszerű azonosra v e n n i . A z o k b a n a színábrázolá

sokban a z o n b a n (YIQ és Y U V eljárások), a m e lyekben egy fény e r ő k o m p o n e n s és két s z í n e s s é g - k o m p o n e n s szerepel, a s z f n e s s é g k o m p o n e n s e k felbontását egyik v a g y mindkét irányban kevésbé finomra szokás választani, mint a f é n y e r ő k o m p o nensét. Például a Digital Videó Interactive (DVI) nevű multimédia rendszer mindkét irányban négy

szer (felületükben tehát tizenhatszor) nagyobb képpontokat használ a két s z í n e s s é g k o m p o n e n s - ben, mint a f é n y e r ő k o m p o n e n s b e n .

A J P E G rendszer azt s e m köti m e g , hogy a képpontok leírására hány bit használható, de egy kép valamennyi k o m p o n e n s é n e k valamennyi kép

pontjára azonos kell legyen a leíró bitek s z a m a . A v e s z t e s é g e s m ó d o k b a n rendszerint 8 - 1 2 bitet használnak képpontonként, a v e s z t e s é g m e n t e s m ó d b a n 2 - 1 2 bitet.

A mintavételi gyakoriságot k o m p o n e n s e n k é n t külön-külön lehet m e g a d n i , mindkét irányban 1 és 4 között. A legsűrűbb megengedett mintavétel tehát 1*1 = 1 képpont mintánként, a legritkább

pedig 4 x 4 = 16 képpont. (A mintavételi gyakoriság csak egész s z á m lehet.)

A képet ezután a d a t e g y s é g e k r e bontják. A v e s z t e s é g e s m ó d o k rendszerint 8 * 8 képpontot alkalmaznak adategységként.

A z egyik lehetséges kódolási sorrendben előbb egy k o m p o n e n s v a l a m e n n y i adategységét feldol

gozzák (soron belül balról j o b b r a , a sorokat pedig felülről lefelé), azután térnek át a következő k o m ponensre. A z így kódolt színes kép helyreállítása

kor először m o n o k r ó m képként jelenik m e g , azután fokozatosan kiszínesedik.

A másik lehetséges kódolási sorrend az, hogy a képet régiókra bontják. Egy adott régió valamennyi k o m p o n e n s b e n ugyanazt a képrészt fedi. Először egy régió valamennyi k o m p o n e n s é t feldolgozzák, azután térnek át a következő régióra. A z így kódolt kép helyreállításkor soronként f o k o z a t o s a n jelenik m e g .

1.2 Veszteséges szekvenciális mód

Ez a kódolási m ó d s z e r 8 * 8 képpontból álló adategységeket használ, egy képpontot 8 bittel írva le.

A kódolás első lépéseként a képpontokat leíró (0 és 2 5 5 közötti) értékekből levonnak 128-at, így - 1 2 8 és +127 közötti értékeket kapnak. Ezzel a

leggyakrabban előforduló képeknél sok lesz a kis abszolút értékű képpont, és kevés lesz a nagy abszolút értékű.

A kódolás második lépése az úgynevezett diszkrét koszinusztranszformáció. Ez azt jelenti, hogy a 8 * 8 képpontból álló egységet kétdimenziós hullámfelületnek tekintik, amely 64 meghatározott

(3)

frekvenciájú hullámfelület e g y m á s r a rakodásaként Irható le. Kiszámítják a 64 hullám együtthatóját, vagyis azt, hogy melyik hullámot milyen amplitúdó

val kell figyelembe v e n n i , hogy együtt a kódolandó képrészt adják ki. A t o v á b b i a k b a n a 64 képpont egyenkénti leírása helyett a 64 huilámegyüttható

val dolgoznak. Általában a kisebb frekvenciák együtthatóira n a g y o b b , a n a g y o b b frekvenciák együtthatóira kisebb értékek adódnak, az utóbbiak között sok a nullához közeli. A mindkét irányban nulla frekvencia, vagyis a síkfelület együtthatója (az úgynevezett e g y e n á r a m ú együttható) az átla

gos értéket írja ie, a többi (az úgynevezett váltóá

ramú együtthatók) az átlagtól való eltérést. Ez az átalakítás a véges számolási p o n t o s s á g miatt már némi információveszteséggel jár.

A harmadik lépés a kvantálás. Ez a lépés jelen

tős információveszteséggel jár, ugyanakkor a z o n ban lényeges adattömörítést a d . A kvantálás abból áll, hogy a 8 * 8 hullámegyütthatót elosztják egy ugyancsak 8 * 8 osztóból álló táblázat értékeivel, minden együtthatót a neki megfelelő osztóval, majd a hányadost e g é s z értékre kerekítik. Általá

ban a kisebb frekvenciák együtthatóit kisebb, a nagyobb frekvenciák együtthatóit nagyobb s z á m mal osztják, így a n ö v e k v ő frekvenciákkal csökken az ábrázolás p o n t o s s á g a , vagyis a képrészlet f i n o m a b b j e l l e m z ő i t k e v é s b é pontosan adják vissza, mint a fő jellemzőket. Egy-egy együtthatót most már egy alig n é h á n y bittel ábrázolható kis s z á m ír le.

A z e g y e n á r a m ú együtthatókat különválasztják a váltóáramú együtthatóktól, az utóbbiakat egy-egy adategységen belül a kisebb frekvenciáktól a na

gyobbak felé haladó sorba rendezik.

Egy képet most m á r két számsorozat ír le, az e g y e n á r a m ú együtthatóké és a váltóáramú együtt

hatóké. Mindkét s z á m s o r o z a t kis s z á m o k b ó l áll, és n a g y o n sok nullát tartalmaz.

A k é p t ö m ö r í t é s utolsó lépése e n n e k a két s z á m s o r o z a t n a k a további t ö m ö r í t é s e a h a g y o m á nyos adattömörítés egyik s z o k á s o s módszeréve!, a s z a b a d a l o m m a l n e m védett, tehát szabadon alkalmazható úgynevezett Huffman-kódolással.

Egy kódolási e g y s é g h á r o m s z á m b ó l áll: az egy

m á s után következő nullák s z á m á b ó l , a legköze

lebbi nullától k ü l ö n b ö z ő s z á m ábrázolásához szük

séges bitek s z á m á b ó l , majd magából a nullától különböző s z á m értékéből. A s o k nulla miatt, és a kevés bittel ábrázolható kis s z á m o k gyakorisága miatt ez a kódolás nagyfokú t ö m ö r í t é s s e l jár.

1.3 Kiterjesztett veszteséges mód

Ez a kódolási m ó d a v e s z t e s é g e s szekvenciális m ó d h o z képest több kötöttséget felold.

A z a d a t e g y s é g 8 * 8 képpont helyett 12x12 kép

pontból is állhat.

A kvantálás utáni további adattömörítés n e m csak a hullámegyütthatók eredeti sorrendjében történhet, h a n e m két úgynevezett progresszív m ó d o n is. A z egyik a spektrális progresszív m ó d , amelynek során először az e g é s z képre az ala

csony frekvenciák hullám együtthatóit dolgozzák fel, azután az egyre m a g a s a b b frekvenciákét. A másik a szukcesszív spektrális m ó d , amelynek során először a hullámegyütthatók m a g a s a b b helyértékű bitjeit dolgozzák fel, azután az egyre alacsonyabb helyértékű biteket. Mindkét megoldás arra vezet, hogy helyreállításkor a kép először elnagyoltan jelenik m e g , azután egyre élesebben és részletgazdagabban.

Végül e b b e n a kódolási m ó d b a n a H u f f m a n - kódolás helyett m e g e n g e d e t t egy 5 - 1 0 % - k a l jobb tömörítést adó, az adatok s z e r k e z e t é h e z a u t o m a tikusan igazodó, d e s z a b a d a l o m m a l védett adat- tömörltési eljárás, az úgynevezett aritmetikai kódo

lás is.

1.4 Veszteségmentes mód

Ez a m ó d az egyes képpontokat önálló adat

egységekként kezeli. Egy képpont 2 - 1 6 bittel irha

tó le.

A diszkrét koszinusztranszformáció és a kvan

tálás itt elmarad (ezért hívják v e s z t e s é g m e n t e s nek), helyettük a valamilyen irányban (felfelé, bal

ra, balra és felfelé) megelőző k é p p o n t h o z képest a változást próbálja az eljárás hét előfeltevés v a l a

melyikének P r o k r u s z t é s z - á g y á b a beszorítani (valamelyik irányban változatlan a kép, valamelyik irányban egyenletesen változik a kép stb.). H a azonban egy képpontra egyik előfeltevés s e m illeszthető rá, akkor a megelőzőktől független kép

pontként kell kezelni.

1.5 Hierarchikus mód

E b b e n a m ó d b a n (amely egyes lépéseiben az előző h á r o m m ó d bármelyikét megengedi) a kódo

lás lépésenként történik. A képet először kis fel

bontással kódolják, m a j d minden további lépésben megkétszereződik a felbontás f i n o m s á g a . A j o b b felbontással kapott kódból kivonják a közvetlenül megelőző felbontás kódját, és csak a különbséget viszik t o v á b b .

A hierarchikus m ó d lényegesen rosszabbul t ö mörít, lényegesen n a g y o b b tárkapacitást igényel, mint az előző m ó d o k , viszont a k é p azonnal külön

böző felbontási f i n o m s á g o k k a l áll rendelkezésre.

(Ez lényeges például a K o d a k P h o t o - C D e s e t é b e n , ahol a körömnyitől a kiállítási méretig sok különbö

z ő méretben nyerhető vissza a f é n y k é p a lemezről.

- A ref.) Hierarchikus kódolás nélkül a keresésre alkalmas kis képméret c s a k úgy lenne létrehozha

tó, ha először a teljes f i n o m s á g ú képet helyreállí

tanák, majd külön időráfordítással lekicsinyítenék.

(4)

a képpontokat bizonyos képpontcsoportok átlagér

tékéből hozva létre, vagyis a kis felbontású, kis méretben képernyőre hozható keresőkép létreho

z á s a t o v á b b t a r t a n a , mint a teljes részletességű képé, ami abszurd helyzetet t e r e m t e n e .

2. Mozgókép-tömörítés: H.261 (p*64) eljárás A m o z g ó k é p - t ö m ö r í t é s mindig abból áll, hogy az egyes képkockákat állóképekként tömörítik, majd az e g y m á s utáni képkockákat e g y m á s b ó l valamilyen m ó d o n kivonva, csak a változásokat tárolják. A z egyes k é p k o c k á k t ö m ö r í t é s e iránt azonban sokkal kisebb igényeket t á m a s z t a m o z gókép-tömörítés, mint a valódi állóképek t ö m ö r í t é se: korlátozott felbontással elégedhetünk m e g , amely valamelyik t é v é s z a b v á n y felbontásának felel m e g , tehát a s z ü k s é g e s legfinomabb felbontás a nagyfelbontású televízió ( H D T V = High Definiton TV) felbontása, a k é p e k oldalaránya s e m tetszőle

ges, az is megfelel valamelyik tévészabványnak.

N a g y o b b a k viszont az igények a feldolgozási sebesség iránt. E téren két megoldás lehetséges.

A párbeszédes felhasználásban (pl. képtelefon) úgynevezett szimmetrikus kódolásra v a n s z ü k s é g , mind a tömörítést, mind a helyreállítást valós idő

ben kell megoldani, vagyis egy képkockára legfel

jebb az amerikai t é v é s z a b v á n y szerinti 1/30 m á sodperc juthat. A tárolt képeknél, például az optikai lemezes multimédia-kiadványoknál m e g e n g e d h e t ő az aszimmetrikus kódolás: c s a k a helyreállításnak kell személyi s z á m í t ó g é p p e l , valós időben történ

nie, a tömörítés s z á m í t á s i ideje és g é p s e b e s s é g - tgénye e n n e k a s o k s z o r o s a is lehet.

A H.261 ( m á s n é v e n p * 6 4 ) eljárást az ISDN rendszerekhez dolgozták ki, elsősorban a képtele

fonhoz é s a videokonferenciákhoz. ( I S D N = Integrated Services Digital Network. E z a r o h a m o san terjedő szélessávú távközlési eljárást azt cé

lozza, hogy minden távközlési igényt egyazon vonalon szolgáljanak ki, a telefontól a kábeltévén át a párbeszédes adatátvitelig. - A ref.) É p p e n ezért szimmetrikus kódolási rendszer, vagyis mind a kódolás, mind a dekódolás a valós időben való végrehajtás igényeihez alkalmazkodik. A z ISDN kábel p s z á m ú gyors, 64 kbit/s-os csatornáját v e heti egyszerre igénybe, ahol p = 1, 2 30; innen ered a rendszer px64 elnevezése. H.261 s z á m ú CCITT-ajánlásként hagyták j ó v á 1990 d e c e m b e r é ben, innen a másik elnevezés.

2.1 Képelőkészítés

E b b e n a rendszerben a k é p f o r m á t u m szigorúan kötött. A képváltási frekvencia 29,97 kép/s kell legyen. Egy mintavételi e g y s é g h á r o m jelből, egy intenzitásjelből (Y) és két színdifferencia-jelből ( C^b és C⁽) áll. A k é p oldalaránya 4:3, az intenzitás- k o m p o n e n s szempontjából a k é p 2 8 8 sorból, so

ronként 352 képpontból áll, a színdifferencia¬

k o m p o n e n s e k szempontjából 144 sorból, soron

ként 176 képpontból. A z intenzitás mintavétele tehát mindkét irányban kétszer olyan f i n o m , mint a színeké. M e g e n g e d i a s z a b v á n y a fele ilyen finom felbontást is, tehát a 1 7 6 x 1 4 4 intenzitás- és 8 8 * 7 2 szlndifferencia-képpontot. A d u r v á b b felbontásra minden alkalmazási rendszernek képesnek kell lennie, a f i n o m a b b felbontás opcionális.

A z előkészítés s o r á n 8 * 8 képpontból alakítanak ki egy adatblokkot. Négy intenzitásblokk és egy- egy színdifferencia-blokk alkot egy úgynevezett makroblokkot, 33 makroblokk egy blokkcsoportot.

Igy a d u r v á b b felbontásban h á r o m , a f i n o m a b b a n tizenként blokkcsoportból áll egy k é p k o c k a .

2.2 Kódolás

A H.261 rendszer kétféle kódolást használ: a képkockán belülit és a k é p k o c k á k közöttit. A z előbbi esetben a képkockát önálló képként kezeli, az utóbbiban a m e g e l ő z ő v a g y a rá következő képkockához hasonlítja. A s z a b v á n y nem írja elő, hogy mikor melyiket kell használni, ezt mindig a feldolgozás közben kell eldönteni.

A képkockán belüli kódolás során 8 x 8 képpont

ból álló adategységeket vetnek alá diszkrét koszinusztranszformációnak, mint J P E G eljárás

ban. A z e g y e n á r a m ú hullámegyütthatót különvá

lasztják a váltóáram úaktól, az együtthatókat kvantálják, majd a kapott bitsorozatokat a J P E G eljáráshoz hasonlóan tömörítik.

A k é p k o c k á k közötti kódolásban az előző vagy a rá következő k é p k o c k á h o z képest az a d a t e l e m nek megfelelő képrészletnek egyrészt az e l m o z d u lását, másrészt a változását határozzák m e g . A z előbbi a z o n b a n nem kötelező, ezért az egyszerűbb rendszerek - nulla elmozdulást felételezve - csak a változást vizsgálják. A z elmozdulásvektort (ha van) mindig kódolják, m é g p e d i g változó hosszúsá

g ú , v e s z t e s é g m e n t e s kódolással, d e a változást csak akkor, ha meghalad egy megadott m i n i m u mot. A változás kódolása diszkrét koszinusz- transzformációval történik, ezután azonban beik

tatható egy felülvágó szűrő, a m e l y csak az ala

csony frekvenciákat engedi át. Végül tömörítik az adatsort.

A kvantálás a H.261 eljárásban f ü g g a puffer telítettségétől. Ezzel kikényszerítik, hogy az adat

áramlás s e b e s s é g e mindig e g y f o r m a legyen. E z viszont azzal jár, hogy a részletgazdagabb v a g y gyorsabban változó képek minősége a helyreállítás után g y e n g é b b , a részletszegényebb é s lassabban változó képek minősége jobb.

2.3 Az adatáram

A H.261 rendszer a d a t á r a m a hierarchikus, többrétegű, a legalsó réteg tartalmazza a t ö m ö r l -

(5)

tett képet. A z a d a t á r a m hibajavító információt tar

talmaz (az átviteli z a v a r o k hatásának c s ö k k e n t é s é re), és ötbites ideiglenes képkockasorszámot. A z alkalmazási szoftver küldhet olyan parancsot a vevőnek, a m e l y a képet állóképként befagyasztja, a kódoló berendezés pedig olyat, amely átvált a m o z g ó k é p m ó d és az állóképmód között.

3, Mozgókép-tömörítés: MPEG eljárás A z 1993 ó t a nemzetközi szabványként elfoga

dott M P E G rendszer a k o m p a k t l e m e z e s adattáro

lás e s z k ö z e kíván lenni. E n n e k megfelelően a C D - R O M 1,2 Mbit/s-os adatátviteli sebességét célozza m e g , felső határként ennek kb. a másfélszeresét szabva m e g . A kép- és a hanginformáció együttes t ö m ö r í t é s é r e szolgál. Már 1993 óta hardvereszkö

zöket is árusítanak e h h e z az eljáráshoz.

Szimmetrikus kódoláson kívül aszimmetrikus kódolásra is képes az eljárás.

3.1 Képtömörítés

A z M P E G eljárásban a képformátum szigorúan kötött. A k é p egy intenzitás- és két s z l n e s s é g - k o m p o n e n s b ő l áll ( Y U V f o r m á t u m ) . A z intenzitás- k o m p o n e n s mintavétele mindkét irányban kétszer olyan s ű r ű , mint a s z l n e s s é g k o m p o n e n s e k é . A z előbbinek a felbontása nem haladhatja m e g a 7 6 8 * 5 7 5 képpontot. Egy képpont leírására k o m ponensenként 8 bit szolgál.

A továbbított információ tartalmazza a képpont oldalarányát, amely 14 különböző értéket vehet fel, például lehet 1:1, 4:3, 16:9. U g y a n c s a k szerepel a továbbított információban a képváltási frekvencia, a m e l y n e k 8 különböző megengedett értéke lehet:

23,976 Hz, 24 Hz, 2 5 H z , 29,97 Hz, 30 Hz, 50 H z és 60 Hz.

A k é p k o c k á k o n belül 8 * 8 képpont alkot egy blokkot, 4 intenzitásblokk ( 1 6 * 1 6 képpont) plusz 1¬

1 s z l n e s s é g b l o k k alkot egy makroblokkot. A m i k o r egy képkockáról c s a k az előző v a g y a rá követke

z ő képkockától való eltérést továbbítják, akkor a makroblokkok külön-külön kezelhetők, Igy a válto

zatlan, v a g y csak lassan és e g y s z e r ű e n változó részről (rendszerint a k é p hátteréről) k e v e s e b b információt kell továbbítani, mint a g y o r s a n változó részekről (rendszerint a kép előteréről).

A z M P E G rendszerben az- e g y e s képkockák kódolásának négy t í p u s a létezik. E z biztosltja egy

részt a hatékony kódolást, m á s r é s z t azt, hogy a m o z g ó k é p bármelyik pillanata indulási pontként szolgálhasson a lejátszáskor. A négy kódolási m ó d a következő:

> az I k é p k o c k á k k ó d o l á s a minden m á s képkoc

kától független;

> a P k é p k o c k á k h o z s z ü k s é g v a n az előző kép

k o c k á k r a , m é g p e d i g a legutóbbi I képkockára, és attól az adott k é p k o c k á i g valamennyi köz

bülső P k o c k á r a ;

> a B k é p k o c k á k h o z mind az előző, mind a rá következő I k é p k o c k á r a , és azoktól az adott képkockáig minden közbülső P képkockára s z ü k s é g v a n ;

> a D k é p k o c k á k a t ö n m a g u k b a n kódolják, d e ezek a normál lejátszásban n e m szerepelnek, csak a gyors „tekercselésben".

A legjobban bevált kódolási sorrend a követke

ző: I B B P B B P B B I B B P B B P B B . A B képkockák jelenléte miatt a z o n b a n a továbbítási sorrend ettől eltérő, a B képkockákat csak a kódolásukhoz és dekódolásukhoz s z ü k s é g e s I és P képkockák után továbbítják (lásd 3.3 pont).

A z I képkockákat diszkrét koszinusztransz

formációval kódolják, egy k o m p o n e n s e n belül csak az e g y m á s utáni blokkok különbségét használva fel.

A P képkockák kódolásakor figyelembe veszik, hogy az egyes képrészletek g y a k r a n nem változ

nak, csak eltolódnak. Ezért minden blokkhoz m e g keresik az előző I v a g y P k é p k o c k a h o z z á legha- sonlóbb blokkját. Erre több m ó d s z e r alkalmas. A s z á m í t á s i g é n y e s e b b (tehát csak aszimmetrikus kódolásra alkalmas) eljárások j o b b e r e d m é n y t adnak, mint a kisebb s z á m l t á s i g é n y ű (tehát s z i m metrikus kódolásra is megfelelő) eljárások. Nő a kódolás s z á m í t á s i g é n y e azzal is, ha növelik a t á volságot, amelyen belül a megfelelő képrészleteket keresik. Csak a blokk elmozdulásvektorát és az e g y m á s utáni k é p k o c k á k megfelelő részletei kö

zötti kis változást kódolják. A P k é p k o c k á b a n le

hetnek így kódolt makroblokkok, lehetnek olyan makroblokkok, amelyekre c s a k az elmozdulás- vektort kell kódolni, és lehetnek olyan m a k r o blokkok, amelyeket az I k é p k o c k á k makroblokk- jaihoz hasonlóan kódolnak. A z egyes makro

blokkok diszkrét

koszmusziranszTormacioja

u t a n akadhatnak olyan makroblokkok, a m e l y e k v a l a mennyi hullámegyütthatója zérus. E z e k a további kódolásból kimaradnak, csak egy hatbites érték megy t o v á b b róluk.

A B k é p k o c k á k o n m e g h a t á r o z z á k , hogy egy makroblokkhoz az előző v a g y a rá k ö v e t k e z ő k é p kockán található-e j o b b a n hasonlító makroblokk. A kódolás e g y é b k é n t u g y a n ú g y történik, mint a P képkockák e s e t é b e n , azzal a különbséggel, hogy a B képkockát s e m a kódoláskor, s e m a d e k ó d o l á s kor n e m kell tárolni, mivel a h h o z további képkockát m á r nem hasonlítanak, t o v á b b í t á s után azonnal elfelejthető.

A D képkockákról c s a k az e g y e n á r a m ú hullám

együtthatókat tárolják, Igy ezek n a g y o n elnagyolt képet adnak.

3.2 Hangtömörítés

A hangkódoláshoz az M P E G rendszerben használható az a két mintavételi frekvencia, amely a digitális magnónál ( D A T ) és a kompakt hangle-

(6)

meznél használatos (48 kHz és 44,1 kHz), emellett megengedett a 32 kHz is. Egy minta 16 biten kó

dolható.

A z amplitúdómintákból gyors Fourier-transz- formációval 32 hullámegyütthatót határoznak m e g , vagyis 32 e g y m á s s a l át nem fedő frekvenciasávra bontják a hangot. Egy úgynevezett pszicho- akusztikus modell segítségével minden sávra meghatározzák a zajt. A zajosabb sávokra dur

vább, a kevésbé zajos s á v o k r a f i n o m a b b a k v a n t á lás. Végül a kapott adatsort tömörítik.

A z M P E G - s z a b v á n y m e g e n g e d i az egy monohangot, a két független monohangot, a f ü g getlen j o b b és bal csatornával kódolt sztereó han

got, és a kapcsoltan kódolt sztereó hangot. A két

féle sztereó hang közül az utóbbi tömöríthető job

ban, mert kihasználható a redundancia.

3.3 Adatáram

A z M P E G rendszer e g y m á s s a l átfedésben t á rolja a hangot és a képet. A h a n g legkisebb elérhe

tő e g y s é g e 384 mintából áll, ez a mintavételi frek

venciától f ü g g ő e n 8 - 1 2 m s játékidőt jelent.

A képinformáció átvitele meglehetősen bonyo

lult, hat e g y m á s r a épülő rétegből áll.

1. A legfelső adatkezelési réteg a k é p s z e k v e n  ciák rétege. E z e n a szinten történik a szükséges pufferméret és az adatátviteli s e b e s s é g közlése.

Ez utóbbi ellenőrzési célokat szolgál.

2. A következő a képcsoportok rétege. Ez a réteg kezeli a k é p k o c k á k sorrendjét. Egy képcso

port mindig legalább egy I képkockát tartalmaz, és mindig közvetlenül elérhető. Mint már szó volt róla, a képkockák átviteli sorrendje n e m azonos a megjelenési sorrenddel. H a a m o z g ó k é p e n a kép

kockák sorrendje például

B B I B B P B B P B B P

0 1 2 3 4 5 6 7 8 9 10 11

akkor az átvitel sorrendje

I B B P B B P B B P B B

2 0 1 5 3 4 8 6 7 11 9 10

3. A képkockák rétege egy képkockát kezel.

4 . A szeletek rétege adott s z á m ú makroblokkot kezel, amelyek egyik képkockáról a másikra m e g változhatnak. E b b e n a rétegben történik a kvantá

lási paraméterek t o v á b b í t á s a .

5. A makroblokkréteg egy makroblokkot kezel.

6. A legalsó réteg a blokkok rétege.

A z a d a t á r a m t o v á b b í t á s a a d a t c s o m a g o k f o r m á jában történik. A legelső a d a t c s o m a g tartalmazza a d e k ó d e r erőforrás-beállításához szükséges adatokat, Igy egy elindított a d a t á r a m vételébe nem lehet m e n e t közben bekapcsolódni. Ez az optikai

lemezen tárolt információ kiolvasásakor n e m jelent gondot, d e például táv konferenciák kódolására alkalmatlanná teszi az M P E G rendszert.

A z a d a t c s o m a g o k e g y m á s s a l p á r h u z a m o s a n t ö b b csatornán is t o v á b b í t h a t ó k , a helyes összeil

lesztés biztosítására ezért az a d a t c s o m a g o k időbé

lyegzést tartalmaznak.

3.4 Az MPEG-2 rendszer

A z M P E G rendszerrel tömörített videoadás k é p m i n ő s é g e akkor a legjobb, ha a tömörített a d a t á r a m átviteli s e b e s s é g e 1,5 Mbit/s körül van.

nagyobb átviteli s e b e s s é g e k r e (100 Mbit/s-ig) dol

gozták ki továbbfejlesztését, az M P E G - 2 rend

szert. E z lehetővé teszi a nagyfelbontású televízi

ónak ( H D T V ) megfelelő j o b b képfelbontást, 1152 sorig, soronként 1920 képpontig.

A z M P E G - 2 rendszer h a n g k ó d o l á s a öt teljes sávszélességű hangcsatornát e n g e d m e g (bal, jobb, középső, és két hangkörnyezeti csatornát), plusz egy mélyhang-kiemelő csatornát és/vagy hét különböző nyelvű beszédcsatornát.

Kétféle adatáramot e n g e d m e g . A program- adatáram változó h o s s z ú s á g ú adatcsomagokból áll, és alacsony zajszintű k ö r n y e z e t b e n használha

tó (pl. a C D - R O M lejátszótól a s z á m í t ó g é p b e ) , a transzport-adatáram 188 bájtos fix hosszúságú a d a t c s o m a g o k b ó l áll, és alkalmas a m a g a s zaj

szintű környezetben v a l ó átvitelre (pl. távoli átvitel

re kábelen, optikai kábelen, m ű h o l d o n , ISDN rend

szeren vagy adatávrteli hálózaton).

4. A DVI rendszer kódolása

A Digital V i d e ó Interactive (DVI) rendszer saját kép- és hangtömörítési eljárással rendelkezik. A kódolás és dekódolás hardvereszközökkel (mikro

programozható V L S I áramkörökkel) történik.

4.1 Hangkódolás

A h a n g digitalizálásakor a D V I mintánként 16 bitet használ. A m o n o - vagy sztereó h a n g kódolha

tó tömörítés nélkül, ímpulzuskód-modulácróval, ilyenkor a mintavétel gyakorisága 11,025 kHz, 22,050 kHz vagy 4 4 , 1 0 0 kHz lehet, vagy negyedé

re tömöríthető az úgynevezett adaptív differenciá

lis impulzuskód-modulációval, ekkor viszont a mintavétel g y a k o r i s á g a 8,268 k H z , 31,129 kHz vagy 33,075 kHz csatornánként. A dekódolt h a n g minősége m é g ilyenkor is eléri a sztereó m ű s o r szórás minőségét.

4.2 Állókép-tömörítés

A DVI a színes k é p kódolását Y U V f o r m á r a alakltja. H a az eredeti k é p h e z háromszín-eljárást ( R G B ) alkalmaztak, vagyis a három alapszín

(7)

(vörös, zöld, kék) intenzitását külön-külön kódolták, akkor az átalakítás az

Y = 0.30R + 0,59G + 0,11B U = B - Y

V = R - Y

képletek alapján történik, annak megfelelően, hogy 3 0 % vörös, 5 9 % zöld és 1 1 % kék adja ki a fehér színt. A fixpontos aritmetikára történő áttérés után a képletek alakja:

109Y = 32R + 6 4 G + 16B + 1744 11U = 6 4 B - 6 4 Y + 15 216 8 8 V = 6 4 R - 6 4 Y + 1T 253,

ahol az egyes k o m p o n e n ek lehetséges értékhatá

rai:

0 < R, G, B < 2 5 5 16 < Y < 235 16 < U , V < 2 4 0 .

A z U és V s z l n e s s é g k o m p o n e n s e k r e a DVI egy 4><4-es képpontblokkra egyetlen értéket használ, mégpedig a blokk bal felső képpontjának értékét, igy az Y f é n y e s s é g k o m p o n e n s 8 bites értékéből és a 16 képpontra érvényes 8 + 8 bit s z l n e s s é g - k o m p o n e n s szétosztott bitjeiből 9 bites f o r m á t u m j ö n ki.

Helyreállításkor a blokk képpontjainak s z í n e s ségét a legközelebbi bal felső képpontok értékeiből interpolálják, ez a k é p jobb szélen és alján észre

v e h e t ő szlntorzulást okoz.

Alkalmazható a D V I rendszerben az M P E G rendszernél említett 16 bites és 24 bites f o r m á t u m is. A 24 bites f o r m á t u m o t nem tömörítik t o v á b b , a 16 bites f o r m á t u m o t v e s z t e s é g m e n t e s eljárással tömörítik, a 9 bites f o r m á t u m t ö m ö r í t é s é r e pedig a J P E G eljárással kapcsolatban az 1.2 pontban emlí

tett tömörítési m ó d , és egy másik v e s z t e s é g e s tömörítési m ó d közül lehet választani.

4.3 Mozgókép-tömörítés

A D V I két különböző eljárást használ a m o z g ó kép-tömörítésre.

A g y e n g é b b k é p m i n ő s é g e t a d ó valós idejű videokódolás szimmetrikus eljárás, tehát mind a kódolás, m i n d a d e k ó d o l á s valós időben hajtható v é g r e a megfelelő hardver-szoftver kombinációval.

Intel 386-os é s 4 8 6 - o s p r o c e s s z o r o k o n tisztán szoftverrel is megoldható, d e c s a k lerontott k é p m i nőséggel.

A z állóképhez hasonlóan a s z í n e s s é g k o m p o - nenseket itt is 4 * 4 képpontra egyszer határozzák m e g .

A z eljárás kétféle képkockát használ. A z önál

lóan kódolt k é p k o c k á n az adott képpont és a felet

te lévő képpont különbségét kódolják (az első sor felett egy fiktív sort definiálva), igy sok zérus érték keletkezik, tehát a s z á m s o r n a g y o n alkalmas a további t ö m ö r í t é s r e . A z előző k é p k o c k á h o z h a

sonlított k é p k o c k a kódolásakor minden képpontból kivonják az előző k é p k o c k a u g y a n a z o n helyén lévő képpontokat. Itt is sok zérus érték adódik.

A további adattömörítés során az e g y m á s utáni nullákból csak a sorozat hosszát tárolják, a többi

hez nyolc különböző táblázatból válogatják a kó

dokat. Ezután a kapott s z á m s o r o z a t o t m é g egy

szer tömörítik az 1.2 pontban említett H u f f m a n - kódolással.

A j o b b képminőséget a d ó bemutatási szintű videokódolás erősen aszimmetrikus, nagy gépidőt igényel a tömörítéskor. E z az eljárás a megfelelő integrált áramköröket gyártó Intel tulajdonában van, és csak fő vonásait tették közzé. Minden kép

kockát derékszögű blokkokra bontanak, és az előző k é p k o c k á h o z képest kiszámítják a m o z g á sát, különböző előfeltevések közül válogatva. A m o z g á s v e k t o r kiszámítása nem egész, h a n e m valós aritmetikával történik. A z e g y m á s utáni kép

kockák megfelelő blokkjai közötti eltérés kódolása ugyanúgy történik, mint a valós idejű kódolás so

rán.

5. Értékelés

A J P E G rendszer a j ö v ő állókép-tömörítő s z a b v á n y á n a k tekinthető. Figyelemre méltó s z a b a d sággal rendelkezik a k é p k o m p o n e n s e k számát, a sorok és képpontok számát, a kép méretarányát és az egy képpont kódolására használt bitek s z á mát illetően. Mind szoftver-, mind h a r d v e r m e g v a - lósltásban létezik.

A H.261 eljárás már érvényes s z a b v á n y , a m e lyet szilárdan t á m o g a t n a k a távközlési szolgálta

tók. A kóder és a d e k ó d e r egyszerűen megvalósít

ható, d e a k é p m i n ő s é g n e m mindig kielégítő. F ő alkalmazási területe a párbeszédes távközlés, vagyis a videotelefon é s a távkonferencia. Állandó adatáramlási s e b e s s é g e n a g y o n előnyös a nagy területű hálózatokban é s az ISDN-távközlésben.

A z M P E G a legígéretesebb szabvány az eljö

v e n d ő tömörített tárolású digitális videó- é s audioalkalmazásokban. 1,2 Mbit/s átviteli sebes

ségnél, amely megfelel a C D - R O M olvasókhoz, minősége ö s s z e m é r h e t ő a V H S v i d e o r e n d - szerével. 3 6 0 x 2 4 0 képpontos felbontásnál tömörí

tési eljárása n a g y o n hatékony. N a g y o b b , például 6 2 5 soros felbontásra is alkalmas, d e ezt m á r megsínyli a k é p m i n ő s é g . A fejlődés iránya az M P E G - 2 eljárás, a m e l y hasonló adatáramnál 100 Mbit/s átviteli sebességet is m e g e n g e d , Igy lénye

g e s e n javítja a kódolt adatok minőségét. A z M P E G m a g á b a n foglalja a hangkódolást is, mintánként 16 bites kódolás e s e t é n elérve a D A T (digitális m a g nó) hangminőségét. A z M P E G rendszert a multi

média-alkalmazásokra optimalizálták, az M P E G - 2 pedig lehetővé teszi a t é v é m i n ő s é g , sőt, a H D T V - minőség elérését.

(8)

A DVI eljárás az Intel cég tulajdona. Két kódo

lási eljárást alkalmaz, egy valós idejűt és egy aszimmetrikusát, a dekódolás azonban a két eset

ben azonos hardverrel történik. H a n g - és állókép- tömörítése igen jó minőségű. M o z g ó k é p tömörítése az aszimmetrikus m ó d b a n nagyon jó minőségű, v e r s e n y k é p e s az M P E G eljárással, a szimmetrikus m ó d b a n is jó minőségű, és a legtöbb alkalmazásra megfelel, z a v a r ó a z o n b a n a 150 ms feletti feldolgozási késés.

A négy ismertetett eljárás nem e g y m á s helyet

tesítője, hanem m á s - m á s célt szolgáló módszerek, Igy e g y m á s melletti használatukra, és e g y m á s h o z való közeledésükre lehet számítani.

/STEINMETZ, R.: Data compresslon In multimédia computíng - standards and systems. = Multimedia Systems, 1. köt. 5. sz. 1994. p. 187-204./

(Válás György)

A brit dokumentumellátás stratégiája a következő tíz évre

A British Library (BL) 1992-ben megkezdte új, az ezredfordulóig szóló stratégiai tervének kidolgo

zását, amely a tudományért, kutatásért és innová

cióért c í m m e l jelent m e g . E h h e z való hozzájáru

lásként - és hogy legyen az új évezredbe átvezető saját stratégiája - a Dokumentumellátó Központ (Document Supply Centre = DSC) is felülvizsgálta meglevő stratégiáját, és kidolgozta az újat. A ter

vezési folyamat során áttekintették a működés tágabb környezetét, S W O T - e l e m z é s s e l vizsgálták az alaptevékenységet, a jelenlegi felhasználói cso

portokat és igényeiket, a j ö v ő b e n egyedül, illetve együttműködéssel nyújtható szolgáltatásokat.

Mindezek alapján hat funkcionális stratégiát dol

goztak ki a marketing, a szolgáltatások, a gyűjte

mény, az emberi erőforrások, az információtechno

lógia és a p é n z ü g y e k terén.

A BL stratégiai t e r v e szerint biztosítani akarja a világelsőséget a távoli felhasználók publikált do

kumentumokkal való ellátásában. Ennek érdeké

ben a D S C másolatokat szolgáltat és eredetiket kölcsönöz; katalógusokat, listákat és figyelemfelhí

vó szolgáltatásokat nyújt; együttműködik másokkal (a BL-en belül és kívül) a dokumentumellátás és információszolgáltatás terén; építi gyűjteményét;

gondoskodik arról, hogy az könnyen hozzáférhető legyen a könyvtár valamennyi olvasótermében;

azon dolgozik, hogy az Egyesült Királyságban országos szinten költséghatékony d o k u m e n t u m e l látó rendszer m ű k ö d j ö n .

A D S C alapvető üzleti célja, hogy 2 0 0 2 - 2 0 0 3 - ra 5,6 millióra, azaz az 1 9 9 2 - 9 3 - a s 2,8 milliónak a kétszeresére emelje a távoli felhasználóknak nyújtott d o k u m e n t u m o k számát.

Mindezen célok eléréséhez a következőket tartják szükségesnek:

> minden eddiginél e r ő s e b b e n kell a felhasználói igényekre koncentrálni;

> néhány kiválasztott külföldi piacon jelentős be

fektetésekre kerüljön sor;

> az információtechnológia minden lehetőségét ki kell használni a gyorsabb, h a t é k o n y a b b szolgál

tatás é r d e k é b e n ;

> a gyűjtési és hozzáférési politika növelje a tel

jesített kérések arányát;

> a teljes körű minőségbiztosítás módszerét is fel kell használni a h a t é k o n y s á g növelésére;

> a személyi állomány hozzáértését ki kell hasz

nálni és m e g kell növelni;

> a BL m á s részlegeivel e g y ü t t m ű k ö d v e kell dol

gozni a könyvtár szolgáltatásainak integrálásán;

> a kiadókkal e g y ü t t m ű k ö d v e kell törekedni a copyrightproblémák megoldására.

Ezeket a kulcsstratégiákat támogatja a funkcio

nális stratégiák csoportja:

Marketing téren a külföldi kérések arányát 25- röl 50%-ra kell növelni 2003-ig, különös tekintettel az észak-amerikai és európai közvetítőkre. A D S C az elektronikus ellátás irányába mozdul, hiszen a BL stratégiája szerint a digitálisan tárolt és kutatási célra hozzáférhetővé tett s z ö v e g e s d o k u m e n t u m o k egyik nagy központja k í v á n lenni, s az Igy tárolt szövegek elektronikus t o v á b b í t á s á v a l a távoli fel

használók lehető legolcsóbb és leggyorsabb ellá

tását célozza m e g .

A szolgáltatások tekintetében a felhasználói igények széles körének megfelelő költséghatékony szolgálat a cél. Ezt hatékony munkával, az új technológia lehetőségeinek legjobb kihasználásá

val, rugalmasabb eljárások bevezetésével lehet elérni.

A gyűjteményi stratégiának biztosítania kell, hogy a D S C gyűjtési politikáját a használói kérések irányítsák. A gyarapításnak legalább a raktárról való kiszolgálás jelenlegi arányát kell fenntartania.

E b b e beletartozik az elektronikus publikációk, v a lamint a ritkán kért anyagok m á s gyűjteményekből való beszerzése. A g y ű j t e m é n y e k optimális hasz

nálata m e g k í v á n j a , hogy a B L teljes anyagát egyetlen e g y s é g e s g y ű j t e m é n y n e k tekintsék, f ü g getlenül tárolási helyétől. A beszerzést minden lehetséges esetben egy példányra korlátozzák.

A z információtechnológia használata központi kérdés a könyvtár terveiben. A technológiai fejlő

d é s nagy lehetőségeket nyújt a D S C - n e k , hogy