• Nem Talált Eredményt

Virtuális örökkévalóság: objektumok a digitális könyvtárban megtekintése

N/A
N/A
Protected

Academic year: 2022

Ossza meg "Virtuális örökkévalóság: objektumok a digitális könyvtárban megtekintése"

Copied!
16
0
0

Teljes szövegt

(1)

G o l d e n D á n i e l - T ó t h T ü n d e - T u r i L á s z l ó

E L T E B ö l c s é s z e t t u d o m á n y i M T A I r o d a l o m t u d o m á n y i M T A Filozófiai Intézet Kar Intézet

Virtuális örökkévalóság: objektumok a digitális könyvtárban*

A tanulmány a digitális könyvtár rögzítési, illetve archiválási módszereinek elméleti és gyakorlati kérdéseit vizsgálja nemzetközi tapasztalatok alapján. Elsősorban a szöveges dokumentumokkal foglalkozik, külön kitérve a magyar írásjelkészletből adódó sajátos nehézségekre. Emellett röviden áttekinti a kották, térképek, képek és audiovizuális anya­

gok digitális archiválásának gyakorlatát is, noha ezek kódolása még sokkal kevésbé szabványosított, mint a szövegeké. A digitális rögzítési szabványok közül elsősorban az SGML-t, illetve ennek alkalmazásait igyekszik bemutatni.

1. E l ő z e t e s m e g j e g y z é s e k

T a n u l m á n y u n k s z e m p o n t j á b ó l digitális k ö n y v ­ t á r n a k n e v e z ü n k m i n d e n o l y a n s z e r v e z e t e t , a m e l y digitalizált f o r m á b a n gyűjt, őriz, katalogizál és az o l v a s ó k s z á m á r a h o z z á f é r h e t ő v é t e s z publikált vagy kéziratos m ű v e k e t , f ü g g e t l e n ü l attól, hogy azokat e r e d e t i l e g is digitális f o r m á b a n készítették¬

e. A m ü v e k k ö r e é p p e n o l y a n t á g lehet, m i n t a h a g y o m á n y o s k ö n y v t á r a k b a n : a folyóiratoktól a m o n o g r a f i k u s m ü v e k e n át a h a n g z ó és k é p i a n y a ­ g o k i g b á r m i . A digitalizálás f o r m á j a és m ó d j a is r e n d k í v ü l s o k f é l e , bár a g y a k o r l a t e g y r e i n k á b b e g y s é g e s ü l , k i a l a k u l n a k a s z a b v á n y o s , illetve k o n ­ v e n c i o n á l i s eljárások.

A digitális k ö n y v t á r t á r g y a i t - William Y. Arms n y o m á n - digitális objektumoknak n e v e z z ü k , m e ­ l y e k b e n m e g k ü l ö n b ö z t e t j ü k az adatot és a z azt leiró m e t a a d a t o t . E m e g k ü l ö n b ö z t e t é s r e azért v a n s z ü k s é g , mert a m ű f a j o k , nyelvek és kultúrák, v a l a m i n t a h a r d v e r - s z o f t v e r e s z k ö z ö k á l l a n d ó f e j ­ l ő d é s e k ö v e t k e z t é b e n a digitalizált a n y a g o k n a p j a ­ inkra r e n d k í v ü l n a g y v á l t o z a t o s s á g o t m u t a t n a k . A s z a b v á n y o s í t o t t f o r m á t u m ú m e t a a d a t o k f e l a d a t a a r e n d t e r e m t é s e s o k f é l e s é g b e n .

B á r a digitális o b j e k t u m o k rögzítési s z a b v á n y a i is l e h e t ő v é t e s z i k a leíró j e l l e g ű k a t a l ó g u s a d a t o k rögzítését, ú g y véljük, c é l s z e r ű m e g ő r i z n i a ha­

g y o m á n y o s k ö n y v t á r a k b ó l ismert, a t á r g y a k t ó l fizikailag e l k ü l ö n í t v e kezelt, ö n á l l ó k a t a l ó g u s ­ a d a t b á z i s o k r e n d s z e r é t . A z a z s z a b v á n y o s f o r m á ­ t u m ú bibliográfiai leíró a d a t b á z i s o k a t , és u g y a n ­ c s a k s z a b v á n y o s f o r m á b a n rögzített digitális o b j e k ­ t u m o k a t kell l é t r e h o z n i .

A digitális o b j e k t u m o k k a l k a p c s o l a t o s m e t a ­ adatok s z a b v á n y o s í t á s á n a k h e l y z e t e a z o n b a n m a j d n e m o l y a n v á l t o z a t o s k é p e t m u t a t , mint m a ­ g u k az a d a t f o r m á t u m o k . A Berkeley Digitális Könyvtér2 kutatói n y o l c j e l e n t ő s e b b s z a b v á n y t , illetve s z a b v á n y j a v a s l a t o t k ü l ö n b ö z t e t n e k m e g , bár csoportosításuk3 v i t a t h a t ó . A z a l á b b i a k b a n a Berkeley-féle lista s e g í t s é g é v e l - á m n e m p o n t o ­ s a n k ö v e t v e azt - áttekintjük az e g y e s s z a b v á n y o ­ kat. E s z a b v á n y o k t ö b b s é g é n e k k i z á r ó l a g a digitá­

lis o b j e k t u m bibliográfiai l e í r á s a , k a t a l o g i z á l á s a a célja - v a g y i s n e m az a d a t t a r t a l o m r ö g z í t é s e - , ezért e z e k k e l itt c s a k e m l í t é s s z e r ű e n f o g l a l k o z u n k .

A digitális o b j e k t u m o k r ö g z í t é s i s z a b v á n y a i n a k fejlettsége m e g l e h e t ő s e n eltérő az e g y e s t í p u s o k között. A l e g k i d o l g o z o t t a b b a s z ö v e g e k r ö g z í t é s e , a l e g i n k á b b v á l t o z ó , f e j l ő d ő a z időalapú m ü v e k ( a u d i o - és videó-) r ö g z í t é s e . H a nincs gyártótól f ü g g e t l e n rögzítési s z a b v á n y , a digitális k ö n y v t á r is k é n y t e l e n a l e g n é p s z e r ű b b g y á r t ó k f o r m á t u m a i t a l k a l m a z n i . A k ö v e t k e z ő k b e n e l s ő s o r b a n g y á r t ó k ­ tól f ü g g e t l e n s z a b v á n y o k a t i s m e r t e t ü n k . A m e t a - a d a t s z a b v á n y o k leírására s z o l g á l ó legelterjedtebb s z a b v á n y , v a g y i s a s z a b v á n y o k s z a b v á n y a a k é ­ s ő b b r é s z l e t e s e n i s m e r t e t e n d ő SGML, a m e l y e l s ő ­ s o r b a n s z ö v e g s z e r ű f o r m á b a n k ó d o l h a t ó digitális o b j e k t u m o k r ö g z í t é s é r e h a s z n á l h a t ó .

É p p e n úgy, a h o g y a h a g y o m á n y o s k ö n y v t á r is csak a legjobb m i n ő s é g ű p a p í r r a n y o m o t t , legtar­

t ó s a b b f e d é l b e kötött k ö n y v m e g v á s á r l á s á t e n g e d ­ heti m e g m a g á n a k , a digitális k ö n y v t á r o b j e k t u m a ­ inak r ö g z í t é s e is c s a k i n f o r m á c i ó v e s z t é s nélkül

" A tanulmány a Neumann-ház, a Magyar Elektronikus Könyvtár és a KFKI számára készült a Nemzeti Kulturá­

lis Alap támogatásával,

(2)

Golden D.-Tóth T . - T u r i L.: V i r t u á l i s ö r ö k k é v a l ó s á g . történhet. C s a k o l y a n k ó d o l á s i eljárást s z a b a d

h a s z n á l n i , a m i a l k a l m a s az ö s s z e s r e n d e l k e z é s r e álló i n f o r m á c i ó r ö g z í t é s é r e , f ü g g e t l e n ü l attól, hogy erre az o l v a s ó n a k é p p e n s z ü k s é g e v a n - e . N y i l v á n ­ való, hogy az I n t e r n e t m a i adatátviteli k a p a c i t á s a , a r e n d s z e r e k i n k o m p a t i b i l i t á s a m é g s z ü k s é g s z e r ű ­ e n határt s z a b az o l v a s ó i g é n y e i n e k , d e ez n e m s z a b a d , hogy b e f o l y á s o l j a a digitális k ö n y v t á r rögzítési eljárását. A m a x i m á l i s h ű s é g g e l rögzített eredetiből kell előállítani az o l v a s ó aktuális i g é n y e ­ inek, l e h e t ő s é g e i n e k m e g f e l e l ő g y e n g é b b m i n ő s é ­ gű v a g y e g y s z e r ű b b v á l t o z a t o t .

1.1 Bibliográfiai szabványokról röviden

T a n u l m á n y u n k e l s ő s o r b a n a digitális o b j e k t u ­ mok rögzítési s z a b v á n y a i v a l foglalkozik. A digitális o b j e k t u m o k k a t a l o g i z á l á s á h o z h a s z n á l h a t ó s z a b ­ v á n y o k r ó l c s a k a t e l j e s s é g k e d v é é r t adunk r ö v i d , utalásszerű áttekintést.

a) Nem SGML-aiapúak

M A R C ( M a c h i n e R e a d a b l e C a t a l o g i n g )4

A s z á m í t ó g é p e s k ö n y v t á r i k a t a l ó g u s o k k ö z i s ­ mert és elterjedt f o r m á t u m a , az első m e t a a d a t - s z a b v á n y . N o h a a k é s ő b b i e k b e n hivatkozunk m é g rá, i s m e r t e t é s e n e m lehet e t a n u l m á n y t á r g y a . (Van m á r SGML-aiapú változata5 is.)

Z 3 9 . 5 06

Bibliográfiai i n f o r m á c i ó k l e k é r d e z é s é r e , a M A R C a l a p j á n k i d o l g o z o t t a m e r i k a i s z a b v á n y . Mivel nincs k ö z v e t l e n ö s s z e f ü g g é s b e n a digitális o b j e k t u m o k t á r o l á s á v a l , e t a n u l m á n y b a n részlete­

sen n e m f o g l a l k o z u n k v e l e . A N S I / N I S O Z 3 9 . 5 6 - 1 9 9 X '

S o r o z a t b a n m e g j e l e n t m ű v e k s z a b v á n y o s a z o ­ nosítója, t e t s z ő l e g e s m é d i u m h o z .

U R C ( U n i f o r m R e s o u r c e C h a r a c t e r i s t i c s )8

A z I n t e r n e t e n e l é r h e t ő digitális o b j e k t u m o k a z o n o s í t ó r e n d s z e r e ,

b) SGML-alapúak

E A D ( E n c o d e d A r c h i v á l D e s c r i p t i o n )9

Á l l o m á n y l e í r ó levéltári, m ú z e u m i és kézirattári s e g é d l e t e k , m u t a t ó k r ö g z í t é s é r e , illetve i n t é z m é ­ nyek k ö z ö t t i c s e r é j é r e k i d o l g o z o t t S G M L D T D . A projekt 1 9 9 3 - b a n indult a kaliforniai Berkeley E g y e t e m e n .

DOI (Digital O b j e c t I d e n t i f i e r ) '0

W e b e n publikált m ü v e k a z o n o s í t ó r e n d s z e r e , amely az I S B N - h e z h a s o n l ó a n egyetlen kötött s z e r k e z e t ű k ó d s z á m m a l a z o n o s l t j a a kiadót és a m ű v e t . A D O I r e n d s z e r m a g j a egy központi adat­

bázis.

D u b l i n i a l a p m e t a a d a t o k '1

M i n d ö s s z e t i z e n ö t e l e m b ő l álló j e l k é s z l e t , amely a H T M L f o r m á t u m ú w e b f á j l o k leírására s z o l g á l . A H T M L f o r m á t u m ú fájl f e j l é c é b e n e l h e l y e z h e t ő

„ M E T A " kódok h a s z n á l a t á t s z a b á l y o z z a a javaslat.

2. Digitális o b j e k t u m o k 2.1 Történeti kitekintés

A s z ó b e l i s é g k o r á b a n a s z ö v e g a lehető l e g s z o ­ r o s a b b a n k ö t v e volt e l h a n g z á s á n a k t e r é h e z és idejéhez. A z oralitás a l k o t á s m ó d j á b ó l k ö v e t k e z ő e n a k ö z v e t í t é s - a m i k o r m á s v a l a k i m o n d t a el a s z ö ­ v e g e t újra - m i n d i g ú j r a s z e r z é s is volt, a k ö z v e t í t ő , illetve k ö z v e t í t ő k sorának s z e l l e m i t e r m é k e .

A kéziratos k o r b a n a s z ö v e g k e v é s b é volt újra­

f o r m á l h a t ó , a s z e r z ő sajátja volt, a m e l y e t a m e d i á t o r o k h í v e n v a g y h i b á s a n m á s o l t a k újra.

E k k o r j ö n létre a textológia t u d o m á n y a , a m e l y n e k célja a hibák kijavítása, és a voluntas auctons, a s z e r z ő s z á n d é k a szerinti s z ö v e g m e g á l l a p í t á s a és t o v á b b a d á s a . A s z ö v e g k r i t i k a g o n d o s k o d i k arról, hogy az o l v a s ó k a legjobb, a l e g i n k á b b hiteles s z ö v e g e t kapják. A m á s o l ó k e g y s z e r r e c s a k egy s z ö v e g e t , egy - e s e t l e g c s a k az ideák szintjén létező - kritikai f ő s z ö v e g e t m á s o l n a k .

A n y o m t a t á s f e l f e d e z é s e l e h e t ő v é tette, hogy egy a d o t t l e n y o m a t ( e g y e t l e n m á s o l a t ) t ö b b s z á z , e z e r v a g y millió p é l d á n y b a n j e l e n j é k m e g ; ez elv­

b e n a s z ö v e g é l e t t a r t a m á t is m e g h o s s z a b b í t o t t a , hiszen e g y e t l e n példány m e g s e m m i s ü l é s e n e m s z á m í t o t t , n e m s z á m i t p ó t o l h a t a t l a n v e s z t e s é g n e k ,

A n y o m t a t á s n e m m ó d o s l t j a a s z ö v e g h a g y o ­ m á n y o z á s eljárását: egy v a g y t ö b b f o r r á s b ó l állíta­

nak elő e g y k ö v e t k e z ő t . E b b e n a k o r s z a k b a n lehe­

t ő v é válik az ú g y n e v e z e t t f a k s z i m i l é k k i a d á s a . A f a k s z i m i l e e l v b e n p o n t o s m á s a az eredetijének.

V a n n a k f é n y k é p e s h a s o n m á s o k , és v a n n a k k v á z i f a k s z i m i l é k , a m e l y e k a n y o m t a t o t t s z ö v e g e k ú j r a s z e d é s é v e l k é s z ü l n e k . D e m é g e z e k a f o r r á s u k p o n t o s m á s á n a k t ű n ő k i a d v á n y o k s e m t u d j á k c á ­ folni a t e x t o l ó g i a a l a p t ö r v é n y é t , mely szerint a

másolat m i n d i g k ü l ö n b ö z i k az eredetijétől. Hol ö s s z e c s e r é l i k a lapokat, hol e l c s ú s z n a k a t ö b b ­ s z í n n y o m á s s a l , v a g y retusálják a p a c á k a t , a m e ­ lyekből a v é r b e l i t e x t o l ó g u s Sherlock Holmes e l m é ­ j é h e z illő k ö v e t k e z t e t é s e k r e k é p e s j u t n i . N o és t e r m é s z e t e s e n n e m lehet a v í z j e l e k e t , a papír álla­

gát, az ívfüzetek terjedelmét s o h a , s e m m i f é l e f a k ­ s z i m i l é b e n h í v e n v i s s z a a d n i , s e z e k m e g i n t c s a k o l y a n j e l l e g z e t e s s é g e k , a m e l y e k b ő l m e s s z e m e n ő k ö v e t k e z t e t é s e k e t lehet l e v o n n i . A f a k s z i m i l e k i ­ a d á s t e h á t é p p o l y a n s z ö v e g k i a d á s , m i n t bármely m á s i k , c s a k a n n y i b a n különbözik t ő l e , hogy ö s z - s z e m é r h e t e t l e n ü l j o b b a n ő r z i a forrás Irás- és s z e ­ d é s k é p é t .

(3)

T M T 4 5 . évf. 1998. 8 - 9 . sz.

V a l ó s z í n ű , h o g y a digitális k o r s z a k a l k o t á s m ó d ­ ja is m á s lesz, mint az e l ő z ő e k é . Innen n é z v e a h a g y o m á n y o s é r t e l e m b e n vett i r o d a l o m egy o l y a n s p e c i á l i s eset, ahol a s z ö v e g h e z n e m kap­

c s o l ó d n a k kép-, h a n g - , illetve m o z g ó k é p á l l o m á ­ n y o k " [1]. A hardver- és s z o f t v e r f e j l ő d é s i t e n d e n c i ­ ák is az o l y a n integrált „ o f f i c e - k o m p l e x u m o k " irá­

n y á b a m u t a t n a k , a m e l y e k k e l s z e m b e n a l a p v e t ő k ö v e t e l m é n y lesz a k ü l ö n b ö z ő m é d i u m o k ö s s z e ­ h a n g o l t k e z e l é s e , e g y r e b o n y o l u l t a b b h i p e r m é d i a - d o k u m e n t u m o k l e j á t s z á s a , illetve l é t r e h o z á s a . A s p e c i á l i s a n digitális m ű f a j o k sajátos t u l a j d o n s á g a i m é g c s a k m o s t a n á b a n k ö r v o n a l a z ó d n a k .

2.2 Az objektumok fajtái

2.2.1 Digitális és digitalizált

E l s ő l é p é s b e n m e g kell k ü l ö n b ö z t e t n ü n k a n e m digitális { a l a p v e t ő e n : n y o m t a t o t t ) m é d i u m o k átírá­

sával k e l e t k e z ő („digitalizált") o b j e k t u m o k a t , illetve az e l e v e digitális f o r m á b a n s z ü l e t ö k e t . A z e l s ő e s e t b e n a digitális k ö n y v t á r b e l i a r c h i v á l á s szük­

s é g s z e r ű e n átírást is jelent (lásd r é s z l e t e s e n ké­

s ő b b ) , a m á s o d i k b a n a z o n b a n ez k o r á n t s e m m a ­ g á t ó l é r t e t ő d ő . H i s z e n egy o b j e k t u m l e g t ö k é l e t e ­ s e b b a r c h i v á l á s a m a g á n a k az e r e d e t i n e k v á l t o z a t ­ lan f o r m á b a n v a l ó m e g ő r z é s e .

Egy m u l t i m é d i a C D - R O M k o m p l e x s t r u k t ú r á j á ­ nak v i s s z a a d á s á r a v a l ó s z í n ű l e g n e h é z az e r e d e t i k ó d o l á s n á l m e g f e l e l ő b b e t találni, arról n e m is s z ó l ­ v a , hogy a m é d i u m a l a p v e t ő e n g r a f i k u s j e l l e g e miatt az ilyen t í p u s ú k i a d v á n y o k r ó l m i n d e n b i z o n y ­ nyal c s a k „ f a k s z i m i l é k e t " l e n n e é r d e m e s kiadni, m i n d e n m á s f o r m a lényegi i n f o r m á c i ó v e s z t é s s e l j á r n a . D e Papp Tibor: Disztichon-generátor [2]

c í m ű s z á m í t ó g é p e s k ö l t é s z e t i a l k o t á s á n a k az ere­

d e t i M a c i n t o s h r e n d s z e r t ő l e l t é r ő k ö r n y e z e t b e n v a l ó r e p r o d u k á l á s a is t u l a j d o n k é p p e n a m ű ú j r a í r á ­ s á v a l v o l n a e g y e n é r t é k ű .

A digitális d o k u m e n t u m o k a r c h i v á l á s a k o r t e h á t e g y m á s t ó l e l v á l a s z t h a t a t l a n n a k látszik az i n f o r m á ­ ció, illetve a z információt fizikailag h o r d o z ó e s z k ö z m e g ő r z é s e és t á r o l á s a . N i n c s ez m á s k é n t a ha­

g y o m á n y o s m é d i u m o k , a k ö n y v , a f i l m , a h a n g l e ­ m e z e s e t é b e n s e m , e z e k é p p ú g y fizikai t e r m é s z e ­ t ű e k , mint a C D - R O M v a g y a m e r e v l e m e z . A k ü ­ l ö n b s é g c s a k a n n y i , hogy a s z á m i t ó g é p e n k é s z í ­ tett d o k u m e n t u m o k e s e t é b e n i g é n y b e v e t t t e c h n i ­ kai s e g é d l e t j ó v a l b o n y o l u l t a b b , és h a m a r a b b e l ­ a v u l ó . A h o g y a h a n g l e m e z r e karcolt z e n é t c s a k a m e g f e l e l ő lejátszó s e g í t s é g é v e l t u d j u k é l v e z h e t ő v é t e n n i , a digitális d o k u m e n t u m h o z is h o z z á t a r t o z i k a z a p r o g r a m , a m e l y k é p e s a s z ö v e g e t , képet, h a n g o t , m o z g ó k é p e t kezelni és m e g j e l e n í t e n i . Á m a p r o g r a m c s a k e g y adott o p e r á c i ó s r e n d s z e r alatt, a z o p e r á c i ó s r e n d s z e r pedig kizárólag egy adott h a r d v e r k o n f i g u r á c i ó n f u t t a t h a t ó .

A digitális k ö n y v t á r n a k t e h á t v a l ó s z í n ű l e g az eleve digitális f o r m á b a n születő o b j e k t u m o k ere­

detijének m e g ő r z é s e és s z o l g á l t a t á s a v o l n a az egyik feladata - az e h h e z s z ü k s é g e s h a r d v e r f e l t é ­ telek b i z t o s í t á s á v a l együtt. Ilyen é r t e l e m b e n a digitális k ö n y v t á r n a k digitális m ú z e u m m á (is) kell válnia. T a l á n m é g nincs k é s ő , hogy az utolsó H T - k, C o m m o d o r e - o k és S p e c t r u m o k , a p a d l á s o k o n rejtőző C h i W r i t e r e k és W o r d S t a r o k b e g y ű j t é s e m e g t ö r t é n j é k !

Digitalizált és digitális közt f é l ú t o n h e l y e z k e d ­ nek el az ú n . kiadói fájlok: o l y a n e l e k t r o n i k u s a n kódolt d o k u m e n t u m o k , a m e l y e k l é t r e h o z á s á b a n a z o n b a n a m a j d a n i n y o m t a t o t t v á l t o z a t j á t s z i k m e g h a t á r o z ó s z e r e p e t . N e h é z e l d ö n t e n i , v a j o n a digitális o b j e k t u m o t v a g y i n k á b b az ennek n y o m á n előállított n y o m t a t o t t a t tekintsük az a r c h i v á l á s alapjának. E l ő b b i e s e t b e n (a n y o m d a i k ó d o k értel­

m e z é s é n e k n e m i s m e r e t é b e n ) l e m o n d u n k a d o ­ k u m e n t u m ' v a l ó d i ' k é p é r ő l , u t ó b b i b a n n y u g o d t s z í v v e l v e t h e t j ü k alá s z i s z t e m a t i z á l ó á t í r á s n a k a digitális o b j e k t u m o t .

2.2.2 Két- és háromdimenziós médiumok A digitálisan tárolt i n f o r m á c i ó n e m m i n d e n e s e t b e n tudja pótolni a n e m digitálisát. A z időbeli m ű v é s z e t e k , mint a film és a z e n e e s e t é b e n a digitális t e c h n i k a j o b b n a k bizonyult a n e m digitális r ö g z í t é s e k n é l . A t é r b e l i e k n é l , mint az é p í t é s z e t , a s z o b r á s z a t , a f e s t é s z e t stb. a digitális f o r m á t u m egyelőre i n k á b b c s a k a t u d o m á n y o s k u t a t á s , illetve az i s m e r e t t e r j e s z t é s s e g é d e s z k ö z e lehet. A térbeli tárgyak digitális m e g j e l e n í t é s é r e m a i s m e r t e l j á r á ­ sok m é g n e m a d n a k o l y a n m é r t é k b e n v a l ó s á g h ű m á s o l a t o t , mint a m e n n y i r e például a digitalizált z e n e az a k u s z t i k u s z e n e r e p r o d u k c i ó j a lehet.

2.2.3 Átmeneti műfajok

A h a g y o m á n y o s statikus n y o m t a t o t t s z ö v e g s z á m á r a a digitális m é d i u m s z á m o s m e g ú j u l á s i l e h e t ő s é g e t kínál: a térbeli s z ö v e g , a kinetikus s z ö v e g , a m u l t i t e x t (= a u t o m a t i k u s s z ö v e g g e n e r á ­ tor által előállított s z ö v e g ) , a hipertext, a m u l t i m é ­ d i a , v a g y é p p e n a s z á m í t ó g é p e s s z ó t á r , lexikon, a d a t b á z i s f o r m á c i ó i t . E z e n új o b j e k t u m f a j t á k k e z e ­ l é s é h e z e g é s z e n új s z e m l é l e t r e v a n s z ü k s é g : a h a g y o m á n y o s é r t e l e m b e n vett s z ö v e g v e l e ( l e g ­ alább) e g y e n r a n g ú m á s i n f o r m á c i ó k k a i ( k é p i m e g ­ j e l e n é s , h i p e r t e x t k a p c s o l a t o k , h i e r a r c h i k u s s t r u k t ú ­ ra) e g é s z ü l ki; az o b j e k t u m a r c h i v á l á s á n a k a s z ö ­ v e g e n túli ö s s z e t e v ő k r e is m e s s z e m e n ő e n f i g y e ­ l e m m e l kell lennie.

S z á m o s k é r d é s t v e t fel a v i l á g h á l ó n publikált h i p e r s z ö v e g e s d o k u m e n t u m o k a r c h i v á l á s a : H o ­ g y a n ö r i z h e t ö k m e g a c s a t o l ó k b a n (link) h o r d o z o t t i n f o r m á c i ó k ? H o l h ú z h a t ó k m e g egy ilyen d o k u ­ m e n t u m határai, a z a z a r c h i v á l a n d ó k - e m i n d a z o k a

(4)

GoldGti D . - T ó t h T . - T u r i L : V i r t u á l i s ö r ö k k é v a l ó s á g . távoli hálózati a n y a g o k is, a m e l y e k r e a forrás m u ­

tat? M e n n y i r e t e k i n t e n d ő k a h i p e r s z ö v e g r é s z é n e k a b e n n e f e l h a s z n á l t e g y é b m é d i u m o k : egy ábra t e r m é s z e t e s e n i g e n , de a háttér már n e m ? H o g y a n t e h e t ő é r t e l m e s s é az archiválási s z á n d é k a folya­

m a t o s a n v á l t o z ó hálózati d o k u m e n t u m o k e s e t é ­ ben, ahol l é n y e g é b e n két lehetőség közül választ­

hatunk: v a g y e g y á l t a l á n nincs múlt (az identitás m e g r a g a d h a t a t l a n ) , v a g y túl sok múlt v a n (tízper­

c e n k é n t a u t o m a t i k u s b a c k u p ) .

2.3 A kódolhatóság szintjei

A digitális i n f o r m á c i ó nem m á s , mint m e g h a t á ­ rozott s z á m ú jel v a r i á l á s a , nyolcbites r e n d s z e r b e n például m i n d ö s s z e 2 5 6 e l e m b ő l áll a jelkészlet. E variációk t ö b b é - k e v é s b é kötött m i n t á k a t k ö v e t n e k : s z ö v e g f á j l o k e s e t é b e n a kötöttség n a g y o b b , k é p f á j ­ lok e s e t é b e n v i s z o n t ez k e v é s b é j e l l e m z ő .

V a l ó j á b a n a h a g y o m á n y o s i n f o r m á c i ó h o r d o z ó k is e l h e l y e z h e t ő k egy képzeletbeli s k á l á n , a m e l y n e k egyik v é g é n a r e n d k í v ü l kis s z á m ú e l e m b ő l - az angol nyelv e s e t é b e n például 2 6 írásjegyből - sokféle m i n t á v a l é p í t k e z ő írott s z ö v e g áll, a másik v é g é n pedig az e l m é l e t i l e g v é g t e l e n s z á m ú jelet t a r t a l m a z ó k é p . Minél k e v e s e b b a j e l e k s z á m a , annál k ö n n y e b b a s z á m í t ó g é p e s k ó d o l á s s z a b v á ­ n y o s í t á s a . A z e u r ó p a i kottaírás e képzeletbeli s k á l á n a két v é g l e t között, i n k á b b a s z ö v e g h e z közel k a p h a t n a helyet, hiszen j e l k é s z l e t e b ő v e b b , de m é g i s m e g o l d h a t ó kódolt, k e r e s h e t ő s z á m í t ó ­ g é p e s r ö g z í t é s e . A t é r k é p a z o n b a n m á r i n k á b b a másik v é g l e t felé közelít, bár a k o r s z e r ű digitális t é r k é p e k és t é r i n f o r m a t i k a i s z a b v á n y o k b i z o n y s á g a szerint m e g o l d h a t ó a v é g e s s z á m ú e l e m b ő l álló j e l k é s z l e t r e r e d u k á l á s . M i n d e n e s e t r e n e m véletlen, hogy a t é r k é p i á b r á z o l á s digitális f o r r a d a l m a jó néhány évet k é s e t t a s z ö v e g e s i n f o r m á c i ó k é h o z k é p e s t . A s k á l a m á s i k v é g é r e h e l y e z h e t ő képi á b r á z o l á s e l e m e i n e k s z a b v á n y o s digitalizálása pedig m á r szinte m e g o l d h a t a t l a n f e l a d a t n a k tűnik, annak e l l e n é r e , h o g y készülnek o l y a n m ű v é s z e t ­ történeti a d a t b á z i s o k - például az ICONCLASS™

alapján k é s z ü l ő Marburgi Index'3 - , a m e l y e k e g y - egy k o r s z a k képi emlékeit i g y e k e z n e k a k ö z ö s t a r t a l m i e l e m e k a l a p j á n m e g h a t á r o z o t t e l e m s z á m ú s z ö v e g e s i n f o r m á c i ó v á redukálni, Igy l e h e t ő v é t é v e az a d a t b á z i s o k b a n m e g s z o k o t t k e r e s é s t . U g y a n ­ a k k o r a képi á b r á z o l á s jelkészletét s o k k a l inkább m e g h a t á r o z z a az a d o t t kultúra, mint az írásét, Igy v a l a m e l y képi j e l k é s z l e t t é n y l e g e s lefrása általában az adott k o r p u s z teljes körű f e l d o l g o z á s á v a l lehet­

s é g e s . (Itt is v a n n a k p e r s z e kivételek, pl. a fraktálok e b b ő l a s z e m p o n t b ó l k ü l ö n l e g e s , belső mintázatú k é p n e k tekinthetők.)

M i n d e n i n f o r m á c i ó h o r d o z ó r ó l e l m o n d h a t ó , hogy j e l k é s z l e t e i d ő b e n változó. E v á l t o z á s általában

s z ű k ü l é s t jelent, v a g y i s a j e l k é s z l e t e g y r e kisebb e l e m s z á m r a r e d u k á l ó d i k , a m i n t azt k é s ő b b a m a ­ g y a r nyelv í r á s j e l k é s z l e t é n e k v á l t o z á s á n is b e m u ­ tatjuk. F e l t e h e t ő e n t ö b b m é d i u m r a is igaz, hogy j e l k é s z l e t é n e k s z ű k ü l é s é b e n , e g y s é g e s e d é s b e n nem kis s z e r e p e v a n a rögzítés t e c h n i k a i v á l t o z á ­ sának, azaz a n y o m t a t o t t , ú j a b b a n pedig digitális terjesztésnek.

A k ö v e t k e z ő k b e n az e g y e s i n f o r m á c i ó h o r d o z ó k rögzítésének kérdéseit a k ó d o l h a t ó s á g szintjeit k ö v e t v e i g y e k s z ü n k áttekinteni.

3. A digitalizált s z ö v e g 3.1 Elméleti problémák

A n y o m t a t o t t f o r r á s b ó l s z á r m a z ó s z ö v e g e k digi­

talizálása s z á m o s e l m é l e t i p r o b l é m á t is felvet N e m m i n d e g y , hogy mit és h o g y a n rögzítünk. Az elektronikus s z ö v e g k i a d á s h a s o n l ó s z a k m a i felké­

szültséget igényel, mint a n y o m t a t o t t m é d i u m b e l i . A m a g y a r nyelvű s z ö v e g h a g y o m á n y kritikai igényű kiadása i r o d a l o m t ö r t é n é s z i - t e x t o l ó g u s i s z a k é r t e l ­ met igénylő feladat. A t e x t o l ó g u s s z e m é v e l nem létezik a s z ö v e g , c s a k s z ö v e g e k v a n n a k [ 3 ]i n - az idők s o r á n az újabb és ú j a b b k i a d á s o k mindig új, az eredetitől t ö b b é v a g y k e v é s b é eltérő s z ö v e g v á l ­ t o z a t o k a t hoznak létre: ... kiderült, hogy a m e g í r á s csak egy s t á d i u m a a s z ö v e g állandó k e l e t k e z é s é ­ nek, h i s z e n a mü a publikált v á l t o z a t o k b a n is to­

vábbfejlődik" [4], A z e l e k t r o n i k u s és n e m elektroni­

kus rögzítések s o r á n b e k ö v e t k e z ő s z ö v e g r o m l á s o k lehetséges fajtáira n é z v e lásd Megjegyzések a Szépirodalmi polchoz 1-2 (Golden D á n / e / /5 1 6.

De m á r az s e m e g é s z e n e g y é r t e l m ű , hogy p o n t o s a n milyen információk rögzítendők egy n y o m t a t o t t s z ö v e g e s e t é b e n . T e r m é s z e t e s célunk lehet, hogy egy minél intelligensebb digitális objek­

t u m o t h o z z u n k létre, t e h á t m i n é l t ö b b s z e m a n t i k a i jellegű információt (pl. s z e r z ő , c l m , b e k e z d é s , verssorhatár, s z a k a s z b a t á r ) kódoljunk. A s z k e p t i ­ kus m e g k ö z e l í t é s a z o n b a n n e m h a j l a n d ó ilyen m é r t é k b e n az aktuális s z ö v e g k ó d o l ó interpretáció­

jára bízni m a g á t : ö csak a szintaktikai i n f o r m á c i ó k ­ ra tart igényt, m e l y e k r ő l m a g a s z e r e t n é e l d ö n t e n i , milyen j e l e n t é s t h o r d o z n a k (pl. hogy a kurzív s z e ­ d é s kiemelést, idézetet v a g y példát j e l e n t - e ) . A z abszolút b i z a l m a t l a n s á g á l l á s p o n t j á n a k a z o n b a n ez is k e v é s (illetve s o k ) , ő a s z ö v e g grafikai k é p é ­ nek p o n t o s m á s á t s z e r e t n é m e g k a p n i , s azt is m a g a kívánja e l d ö n t e n i , m i m i n ő s ü l az adott k o n ­ t e x t u s b a n j e l n e k , s mi e g y s z e r ű p a p í r h i b á n a k .

Különleges e s e t e t j e l e n t h e t n e k a vizuális költé­

szeti alkotások, ahol az e g y e s s z ö v e g r é s z e k pozí­

ciói, sőt az a l k a l m a z o t t b e t ű t í p u s is információhor­

d o z ó . (A b e t ű t í p u s o k v a l ó s z í n ű l e g önálló digitális o b j e k t u m o k k é n t is a r c h i v á l a n d ó k , s i n k á b b a v e k t o -

(5)

TMT 45, óvf, 1998. 8 - 9 . sz.

ros f e l é p í t é s ű P o s t s c r i p t f o r m á t u m b a n , mint T r u e T y p e - b a n . ) K o r l á t o z o t t a b b m é r t é k b e n , d e más s z ö v e g e k e s e t é b e n is s z ü k s é g lehet a térbeli elhe­

l y e z k e d é s v a g y a grafikai m e g j e l e n é s bizonyos a s p e k t u s a i n a k r ö g z í t é s é r e .

A kortárs t e x t o l ó g i á n a k a s z ö v e g v á l t o z a t o k m e g á l l í t h a t a t l a n b u r j á n z á s á r ó l s z ó l ó t a p a s z t a l a t a a s z ö v e g e k t á r o l á s á n a k k é r d é s é t is m á s megvilágí­

t á s b a helyezi. A t e o r e t i k u s f e l i s m e r é s e k n e k és az e z e k e n alapuló g y a k o r l a t n a k [5] o l y a n a d a t m o d e l l felel m e g . a m e l y b e n az a l a p e g y s é g n e m a mű, s n e m is a könyv, h a n e m a kettő t a l á l k o z á s a k é n t létező szöveg [6] E b b e n az e r e d e n d ő e n bibliográ­

fiai s t r u k t ú r á b a n t e r m é s z e t e s e n elhelyezhetők m a g u k a s z ö v e g e k ( a k á r t ö b b f a j t a á t í r á s b a n ) , s az adott v á l t o z a t o k f a k s z i m i l é i is.

E s t r u k t ú r á v a l s z e m b e n is m e g f o g a l m a z h a t ó k b i z o n y o s kételyek: az e g y i k a ' m ű f a j ' globális kriti­

k á j a , mely s z e r i n t elvileg l e h e t e t l e n egy, a j ö v ő r e n é z v e teljes m e g o l d á s k i d o l g o z á s a ; a j ö v ő tartal­

m i / t e c h n i k a i ú j d o n s á g a i , illetve az ezek m e g k ö v e ­ telte r ö g z í t é s i és tárolási k í v á n a l m a k s e m m i f é l e ­ k é p p e n n e m láthatók e l ő r e . A m á s i k kifogás a fel­

d o l g o z a n d ó a n y a g o k eltérő t e r m é s z e l é r e hivatko­

zik: például a m i a régi m a g y a r v e r s zárt k o r p u s z á r a bevált, n e m b i z t o s , hogy m i n d e n l é n y e g e s v á l t o z t a ­ tás nélkül a l k a l m a z h a t ó lesz a k ö z e l m ú l t s z ö v e g e i ­ re, n e m is s z ó l v a a digitális korról, a m i k o r ahány m e n t é s - a n n y i s z ö v e g v á l t o z a t , illetve csak e g y e t ­ l e n e g y , de á l l a n d ó a n ú j r a í r ó d ó .

3.2 S z ö v e g s t r u k t ú r a

3.2.1 Project Gutenbergé

M i n d e n b i z o n n y a l a z első s z ö v e g d i g i t a l i z á l á s i k e z d e m é n y e z é s , m i n d e n e l e k t r o n i k u s és digitális k ö n y v t á r a k ő s a p j a . A z 1 9 7 1 - b e n indult projekt filo­

zófiája a k ö v e t k e z ő : ..A G u t e n b e r g Project e- s z ö v e g e i n e k o l y a n k ö n n y e n k e z e l h e t ő e k n e k kell lenniük, hogy s o h a s e n k i n e k ne o k o z z o n g o n d o ' , hogy miként h a s z n á l j a , o l v a s s a , i d é z z e és k e r e s s e ő k e t . ... Ez arra indított b e n n ü n k e t , hogy a G u ­ t e n b e r g Project e - s z ö v e g e i t 'tiszta A S C I I - b a n ' [Plain Vanilla A S C I I ] j e l e n í t s ü k m e g . E n n e k e g y s z e r ű o k a v a n : ez az e g y e t l e n o l y a n s z ö v e g ­ f o r m á t u m , mely k é n y e l m e s a s z e m n e k és a s z á m i ­ t ó g é p n e k is."

K é n y e l m e s , m o n d h a t n á n k , m i n d a d d i g , a m í g nem a k a r u n k b o n y o l u l t a b b t a r t a l m a k a t kifejezni, pl.

t á b l á z a t o t , g r a f i k o n t , m a t e m a t i k a i k é p l e t e k e t al­

k a l m a z n i . D e s z a b á l y o z á s híján m á r az e g y s z e r ű k i e m e l é s s e l is m e g g y ű l i k a bajunk: a projekt a d o k u m e n t u m l é t r e h o z ó j á r a b í z z a , hogy milyen k a r a k t e r e k e t k f v á n h a s z n á l n i pl. a kurzív s z ö v e g ­ r é s z e k j e l ö l é s é r e .

A z e g y s z e r ű s é g c s a p d á j a két e l l e n t é t e s oldalról is b e z á r u l . E g y r é s z t n e m t e s z i l e h e t ő v é a s z ü k s é ­ ges i n f o r m á c i ó m e n n y i s é g t o v á b b í t á s á t (a „ k ö n n y e n o l v a s h a t ó " itt tehát azt jelenti: „túl k ö n n y e n " ) , m á r ­ pedig egy digitális n e m z e t i k ö n y v t á r célja c s a k i s a lehető l e g j o b b m i n ő s é g b i z t o s í t á s a lehet - egy i n f o r m á c i ó b a n g a z d a g d o k u m e n t u m m i n d i g lebutít­

ható lesz az é p p e n aktuális s z e r é n y e b b i g é n y e k ­ nek m e g f e l e l ő e n , fordítva a z o n b a n ez n e m t e h e t ő m e g . M á s r é s z t azt az illúziót táplálja, hogy létezik egy o l y a n l e g k i s e b b közös t ö b b s z ö r ö s , mely afféle

„ c o m m o n s e n s e ' - k é n t k o r o k o n , f ö l d r é s z e k e n , n y e l ­ v e k e n s t b . á t í v e l ő e n m i n d e n k i s z á m á r a é r t h e t ő m a r a d . Holott a h á t t é r b e n egy e g y s z e r ű s z a b v á n y , az A S C I I áll, amely fölött eljárt az idő, arról n e m is s z ó l v a , hogy a nem angol n y e l v ű f e l h a s z n á l ó k igényeit m á r s z ü l e t é s e pillanatában s e m volt k é p e s kielégíteni.

R e n d b e n v a n , m o n d h a t n á n k , h a a t i s z t a A S C I I n e m felel m e g m i n ő s é g i i g é n y e i n k n e k , k e r e s s ü n k o l y a n s z ö v e g - , illetve k i a d v á n y s z e r k e s z t ő p r o g r a ­ m o t , a m e l l y e l legtitkosabb v á g y a i n k a t is m e g v a ­ lósíthatjuk. S z á m t a l a n ilyen v a n , v á l a s s z u k t a l á n a legelterjedtebbet, a Microsoft W o r d o t ! V a l ó b a n , e b b e n m á r e l é g sok mindent m e g t u d u n k c s i n á l n i ( m é g k ü l ö n b ö z ő b e t ű t í p u s o k is v a n n a k ) . Itt a z o n ­ ban a G u t e n b e r g - h í v ő d i a d a l i t t a s a n c s a p az a s z t a l ­ ra: azt a z t á n m e g n é z h e t e d , hogy n é h á n y év m ú l v a mit t u d s z k e z d e n i az Igy készített d o k u m e n t u m o d ­ dal! É s i g a z a is v a n , hiszen a W o r d sok e s e t b e n m é g ö n m a g á v a l (saját korábbi v á l t o z a t a i v a l ) s e m t e l j e s e n kompatíbilis, n e m h o g y m á s f o r g a l o m b a n lévő s z ö v e g s z e r k e s z t ő k k e l ; d o k u m e n t u m u n k elszi­

g e t e l ő d é s e az idő e l ő r e h a l a d t á v a l e g y e n e s a r á n y ­ b a n n ő n i f o g .

M i a m e g o l d á s ? Egyfelől a l e g t e l j e s e b b b o n y o ­ lultság l e h e t ő s é g é n e k , m á s f e l ő l a lehető legtelje­

s e b b p r o g r a m - és r e n d s z e r f ü g g e t l e n s é g n e k a m e g t e r e m t é s e . C s a k o l y a n r e n d s z e r felel m e g egy h o s s z ú t á v ú digitális s z ö v e g r ö g z í t é s céljaira, a m e l y k é p e s t ö k é l e t e s e n k ö v e t h e t ő m ó d o n s z á m o t adni saját k ó d o l á s i eljárásairól, s e z z e l biztosítja a plat­

f o r m f ü g g e t l e n s é g e t , az á t j á r h a t ó s á g o t , s z ü k s é g e s e t é n az a n y a g o k m e g b í z h a t ó k o n v e r t á l h a t ó s á ­ g á t .

A m e g o l d á s a két s z e m p o n t Ö s s z e e g y e z t e t é s e egy o l y a n m e t a n y e l v b e n , a m e l y l e h e t ő v é t e s z i s z á m u n k r a , hogy t e t s z ő l e g e s b o n y o l u l t s á g i f o k ú s z ö v e g k ó d o l á s i rendszert definiáljunk, p u s z t á n a tiszta A S C I I karakterek f e l h a s z n á l á s á v a l . Ez a r e n d s z e r az S G M L .

3.2.2 SGML (Standard Generalized Markup Language - ISO 8879:1986)™

A m e t a a d a t h a s z n á l a t á n a k a l a p f e l t é t e l e , hogy e g y é r t e l m ű e n e l v á l a s z t h a t ó l e g y e n m a g á t ó l az a d a t t ó l . A z S G M L s z a b v á n y a l k a l m a z á s a i b a n a

(6)

Golden D.-Tóth T . - T u r i L : Virtuális ö r ö k k é v a l ó s á g .

„<>" z á r ó j e l p á r - k a r a k t e r e k e t s z o k á s h a s z n á l n i erre a c é l r a . A z t . hogy milyen jellegű m e t a a d a t o t érde­

m e s r ö g z í t e n i , a s z ö v e g r ö g z í t é s célja h a t á r o z z a m e g . H a a k ö n n y ű p r o g r a m o z h a t ó s á g f o n t o s a b b , mint az adat r e n d s z e r f ü g g e t l e n s é g e , a r e n d s z e r e k közötti á t j á r h a t ó s á g , a k k o r a m e t a a d a t o k f e l d o l g o ­ zási u t a s í t á s o k lesznek. A h a r d v e r - és s z o f t v e r f ü g ­ g e t l e n adat k u l c s a a z o n b a n az, hogy a m e t a a d a t o k á l t a l á n o s a b b é r v é n y ű i n f o r m á c i ó t r ö g z í t s e n e k : m i n ő s í t s é k azt az adatot, a m e l y r e v o n a t k o z n a k . V a g y i s n e m m a g á t a v é g r e h a j t a n d ó u t a s í t á s t kell m e t a a d a t k é n t m e g a d n i , h a n e m a s z ö v e g s z e g ­ m e n t u m a z o n t u l a j d o n s á g á t , amely e z t r e n d s z e r e ­ sen kiváltja, feltételezi.

Egy p é l d á v a l : ha az a l c í m k i e m e l é s é t például a kövér b e t ű k r e v o n a t k o z ó u t a s í t á s s a l j e l e z z ü k , az más r e n d s z e r b e n csak a k k o r lesz é r t e l m e z h e t ő , ha a k ö v é r betűk ott is u g y o l y a n k ó d o t k a p n a k . Ezért c é l s z e r ű b b azt rögzíteni, hogy az a d o t t s z ö v e g ­ részlet a l c í m k é n t f u n k c i o n á l . S z ö v e g e s adatok e s e t é b e n például o l y a n j e l l e m z ő t u l a j d o n s á g o t kell rögzíteni, a m e l y k é p e s kifejezni az adott s z e g m e n ­ t u m v i s z o n y á t a s z ö v e g t ö b b i s z e g m e n t u m á h o z . E s z e m p o n t o k n a k m e g f e l e l ő t u l a j d o n s á g a s z ö v e g ­ s z e g m e n t u m o k hierarchikus e l r e n d e z e t t s é g e . J. M.

Lotman [7] s z a v a i v a l :

„A szöveg hierarchikus jellege, azaz rendszerének szétesése alrendszerek bonyolult konstrukciójára, oda vezet, hogy a belső struktúrába tartozó számos elem a Különféle típusú alrendszerekben határjellegűnek bizo­

nyul (a fejezetek, strófák, verssorok, félverssorok hatá­

rai). A határ, amely jelzi az olvasónak, hogy szöveggel van dolga, és tudatában felidézi a megfelelő művész Kódok egész rendszerét, strukturális jellegű, erős hely­

zetben. Tekintve, hogy egyes elemek egy bizonyos natár jelei, mások viszont néhány, a szövegben elfoglalt általános helyzetük szerint egybeeső több határ jelei (egy fejezet vége egyben a könyv vége): tekintve, hogy a hierarchia szintjei alapján beszélhetünk egyik vagy másik határ domináns helyzetéről (a fejezethatárok hierarchikusan magasabban állnak, mint a strófaha­

tárok, a regény határa magasabban, mint a fejezet határa), strukturálisan összemérhetővé válik az elhatá­

rolás ilyen vagy amolyan jelének szerepe. ... A fenti tételek alapján hasznos szabályok adódnak. Először: a szöveg leírásának nyelve - hierarchia." (58-61)

Az S G M L s z a b v á n y e l s ő d l e g e s f e l a d a t a az, hogy szintaktikai s z a b á l y o k a t b i z t o s í t s o n a s z ö v e g h i e r a r c h i k u s a n r e n d e z ő d ő e l e m e i n e k f o r m á l i s le­

í r á s á h o z . T e h á t a s z a b v á n y n e m azt h a t á r o z z a m e g , hogy az e g y e s s z ö v e g t í p u s o k b a n m i l y e n s z e g m e n t u m r e n d s z e r f e l t é t e l e z h e t ő , h a n e m azt, hogy ez a r e n d s z e r h o g y a n d e f i n i á l h a t ó . A g y a k o r ­ lat t a n ú s á g a szerint a r ö g z í t é s , illetve f e l h a s z n á l á s céljától, k o n c e p c i ó j á t ó l f ü g g ő e n e g y s z e r r e t ö b b f é l e hierarchia is m e g j e l e n h e t e g y e t l e n d o k u m e n t u m ­ b a n . E z e k e t az S G M L s z a b v á n y alapján e g y m á s ­ sal a z o n o s é r t é k ű , ú n . k o n k u r e n s s t r u k t ú r á k k é n t lehet k ó d o l n i , v a g y i s a s z ö v e g e t nem kell kizáróla­

g o s a n h o z z á r e n d e l n i p é l d á u l az o l d a l s z á m o k vagy a műfaji e g y s é g e k s t r u k t ú r á j á h o z , azaz p á r h u z a ­ m o s a n , az ö s s z e k e v e r é s v e s z é l y e nélkül jelölhetők pl. az oldal-, illetve s t r ó f a h a t á r o k .

N e m h a t á r o z z a m e g a s z a b v á n y azt s e m , hogy az így definiált s z e g m e n t u m o k m i l y e n s z á m í t ó g é ­ pes eljárással a z o n o s í t h a t ó k vagy d o l g o z h a t ó k föl a s z ö v e g b e n , e z e k a s z ö v e g f e l d o l g o z ó p r o g r a m ­ r e n d s z e r e k f e l a d a t a i . A s z a b v á n y feltételezi - de n e m írja elő - egy o l y a n s z á m í t ó g é p e s p r o g r a m ­ nak a h a s z n á l a t á t , a m e l y k a p c s o l a t o t t e r e m t a s z ö v e g b e n jelölt s z e g m e n t u m o k , a s z e g m e n t u m o k definíciója, v a l a m i n t a s z ö v e g l e h e t s é g e s f e l h a s z ­ nálása között. E p r o g r a m (a s z a b v á n y b a n :

„parser") ellenőrzi, hogy a s z ö v e g b e n jelölt s z e g ­ m e n t u m o k a z o n o s a k - e a definiáltakkal, és emellett esetleg e s z e g m e n t u m o k a t át is tudja s z e r v e z n i

A p r o g r a m m ű k ö d é s é h e z a k ö v e t k e z ő k szük­

s é g e s e k :

A szintaxis b i z o n y o s a l a p v e t ő j e l l e g z e t e s s é g e i ­ nek a d e f i n i á l á s a , például a k ü l ö n b ö z ő speciális k a r a k t e r e k n e k , a kódok h o s s z á n a k v a g y a s z i n t a x i s b a n m e g e n g e d e t t v a r i á c i ó k n a k a m e g ­ h a t á r o z á s a . B á r a hasonlat n e m t ö k é l e t e s , m o n d h a t n i , hogy ez a s z ö v e g l e í r ó nyelv alkal­

mazott n y e l v j á r á s á n a k leírása. E n n e k az adat­

c s o p o r t n a k a s z a b v á n y b a n használt n e v e : . S G M L D e c l a r a t i o n " .

^ A s z ö v e g b e n f e l t é t e l e z h e t ő h i e r a r c h i k u s s z e g ­ m e n t u m r e n d s z e r n e k és j e l ö l é s é n e k leírása. A s z a b v á n y b a n e n n e k a leírásnak a n e v e „ D o c u - ment T y p e D e f i n í t o n " ( D T D ) .

> T e r m é s z e t e s e n a f e l d o l g o z a n d ó s z ö v e g is s z ü k s é g e s a p r o g r a m m ű k ö d é s é h e z . A s z a b ­ v á n y b a n az ilyen s z á m í t ó g é p e n rögzített, és a D T D - b e n m e g h a t á r o z o t t s z e g m e n t u m o k jelölé­

sével ellátott t e r m é s z e t e s nyelvi s z ö v e g neve:

„ d o c u m e n t i n s t a n c e " . Egy „ S G M L D e c l a r a t i o n "

egy v a g y t ö b b D T D - r e v o n a t k o z h a t , és egy D T D egy v a g y t ö b b „ d o c u m e n t i n s t a n c e " s z e g ­ m e n t u m r e n d s z e r é t írhatja le. A z o k a t a s z ö v e ­ geket, a m e l y e k n e k a z o n o s a s z e g m e n t u m - r e n d s z e r e , a s z a b v á n y s z ö v e g t í p u s o k n a k t e ­ kinti.

A h i e r a r c h i k u s a n r e n d e z ő d ő s z ö v e g s z e g m e n ­ t u m o k n a k , azaz a hierarchia a l k o t ó e l e m e i n e k a s z a b v á n y b a n h a s z n á l a t o s e l n e v e z é s e : „ e l e m e n t "

( m a g y a r m e g n e v e z é s e a t o v á b b i a k b a n : a l k o t ó ­ elem). A r e n d s z e r b e n az a z o n o s s z e r e p e t betöltő a l k o t ó e l e m e k a z o n o s n e v e t k a p n a k , a m e l y n e m fejez ki s e m m i m á s t , csak az a d o t t s z e g m e n t u m viszonyát a s z ö v e g t ö b b i s z e g m e n t u m á h o z .

A z t m o n d h a t j u k , hogy az a s z ö v e g l e í r ó nyelv, amelyik u t a s í t á s o k a t ad a s z á m í t ó g é p n e k ( p é l d á u l :

„innentől a l á h ú z a n d ó ! " ) , c s a k igéket h a s z n á l , az S G M L pedig c s a k n é v s z ó k a t : a s z ö v e g s z e g m e n ­ t u m o k nevét, és az azt e g y e d l t ő , a h a s o n l ó nevű s z e g m e n t u m o k t ó l m e g k ü l ö n b ö z t e t ő t u l a j d o n s á g o -

(7)

TMT 45. évf. 1998. 8-9. sz.

kat. U g y a n i s a s z a b v á n y szerint a s z e g m e n t u m o t nyitó a z o n o s í t ó jel - a z á r ó j e l p á r között - n e m c s a k a s z e g m e n t u m nevét t a r t a l m a z h a t j a , de egy vagy t ö b b erre v o n a t k o z ó „attribute"-ot is (a t o v á b b i a k ­ b a n : t u l a j d o n s á g ) . M i v e l e g y e t l e n s z e g m e n t u m t ö b b f é l e s z e m p o n t b ó l , a z a z t ö b b f é l e t u l a j d o n s á g ­ g a l is j e l l e m e z h e t ő , ezért a t u l a j d o n s á g is két rész­

ből áll: a t u l a j d o n s á g m e g n e v e z é s é b ő l és az adott s z e g m e n t u m r a j e l l e m z ő ú n . é r t é k é b ő l .

A z „entity" is a s z ö v e g v a l a m e l y s z e g m e n t u m á ­ ra való h i v a t k o z á s e s z k ö z e , a k á r c s a k az „ e l e m e n t "

f o g a l m a . D e e l l e n t é t b e n az „ e l e m e n t " f o g a l m á v a l , amely az adott s z e g m e n t u m r a a n n a k s z e g m e n ­ t u m r e n d s z e r b e l i p o z í c i ó j á v a l utal, az „entity" a s z e g m e n t u m o t egy m i n d e n f é l e hierarchiától f ü g g e t ­ len e g y s é g n e k t e k i n t i . Ez az e g y s é g a s z e g m e n ­ t u m o k h i e r a r c h i á j á n a k b á r m e l y i k szintjén előfordul­

hat, t e t s z ő l e g e s m é r e t ű , strukturált és strukturálat­

lan is lehet. A z „entity" f o g a l m a azt h a n g s ú l y o z z a , hogy a s z ö v e g k i s e b b és n a g y o b b - e g y m á s t ó l f ü g g e t l e n - s z e g m e n t u m o k b ó l áll: a teljes d o k u ­ m e n t u m is egy „entity", a l e g n a g y o b b . Ezzel s z e m b e n az „ e l e m e n t " f o g a l m á n a k lényege a s z e g m e n t u m o k h i e r a r c h i á b a r e n d e z ő d ő k a p c s o l a ­ ta, f ü g g ő s é g e .

A s z a b v á n y b a n e két s z e m l é l e t n e m ellentétben áll, h a n e m k i e g é s z í t i e g y m á s t : az „entity" f o g a l m a amellett, hogy l e h e t ő v é t e s z i a s z ö v e g e n kívüli bármely e g y s é g r e v a l ó e g y é r t e l m ű hivatkozást, s z á m o s m á s f e l a d a t r a is a l k a l m a s .

Az „entity" a l k a l m a z á s a igen e g y s z e r ű . A d o ­ k u m e n t u m o t m e g e l ő z ő D T D - b e n kel! - a s z a b ­ v á n y b a n m e g h a t á r o z o t t s z i n t a x i s s a l - a z o n o s í t a n i az e g y e d t a r t a l m á t a n n a k t e t s z ő l e g e s e n választott n e v é v e l , majd a d o k u m e n t u m b a n e z z e l a névvel lehet az e g y e d r e h i v a t k o z n i , az e g y e d nevét az elején .,&" és a v é g é n „;" k a r a k t e r r e l v á l a s z t v a el a s z ö v e g t ő l . A s z a b v á n y szerint m ű k ö d ő e l e m z ő - p r o g r a m b e h e l y e t t e s í t i az e g y e d nevét annak tar­

t a l m á v a l . A z e g y e d o l y a n - l e g a l á b b egy karakter­

ből álló - s z ö v e g e g y s é g h e l y e t t e s í t é s é r e , a z o n o s í ­ t á s á r a s z o l g á l , a m e l y e t a s z á m í t ó g é p k ö z v e t l e n ü l n e m t u d f e l d o l g o z n i , m e g j e l e n í t e n i v a g y t o v á b b í ­ t a n i , illetve a m e l y e t a f e l h a s z n á l ó v a l a m i l y e n okból

nem k í v á n k ö z v e t l e n ü l k e z e l n i - p é l d á u l azért, mert túl h o s s z ú .

A z S G M L s z a b v á n y a szintaktikai s z a b á l y o k o n kívül o l y a n listákat is t a r t a l m a z , a m e l y e k b e n s z á ­ m o s k ö z v e t l e n ü l föl n e m d o l g o z h a t ó karakter - például a m a i m a g y a r nyelv ö s s z e s é k e z e t e s m a ­ g á n h a n g z ó j a - , v a l a m i n t m a t e m a t i k a i és e g y é b s z i m b ó l u m k ü l ö n - k ü l ö n e g y e d k é n t v a n a z o n o s í t v a . E z e k b e n a l i s t á k b a n (a s z a b v á n y b a n : „public entity s e f ) m i n d e n e g y e d m e g h a t á r o z á s á h o z hozzátar­

tozik a h i v a t k o z o t t k a r a k t e r f o r m á j á n a k rövid, angol nyelvű leírása. A z e g y e d e k n e v e - t e h á t az a rö­

v i d í t é s , a m e l l y e l a s z ö v e g b e n hivatkozni kell rá - t e r m é s z e t e s e n c s a k az a n g o l á b é c é karaktereit

t a r t a l m a z z a . A listák c s a k e g y e z m é n y e s h i v a t k o ­ z á s i a l a p k é n t h a s z n á l h a t ó k , s e m m i f é l e utalást n e m t a r t a l m a z n a k a karakter n y o m t a t ó n v a g y képer­

n y ő n való m e g j e l e n í t é s é r e - h i s z e n a s z a b v á n y a l a p e l v e a z , hogy csak az a d a t t á r o l á s á t h a t á r o z z a m e g , f e l h a s z n á l á s á t n e m .

3.2.3 HTML (Hypertext Markup Language)™

A w e b közismert a d a t f o r m á t u m a , b e m u t a t á s á r a nincs s z ü k s é g . F o n t o s a z o n b a n m e g j e g y e z n i , hogy a H T M L is egy S G M L - a l k a l m a z á s , v a g y i s egy D T D , a m e l y e t a W o r l d W i d e W e b C o n s o r t i u m d e ­ finiált. A w e b b ö n g é s z ő k v a l ó j á b a n o l y a n S G M L - o l v a s ó k , melyek csak e g y e t l e n - v i s z o n y l a g e g y ­ s z e r ű - D T D f e l d o l g o z á s á r a a l k a l m a s a k . A H T M L D T D e l s ő s o r b a n o l y a n a l k o t ó e l e m e k e t t a r t a l m a z , a m e l y e k a k é p e r n y ő - m e g j e l e n í t é s t s z a b á l y o z z á k , v a g y i s minimális m é r t é k b e n h a t á r o z z a csak m e g az a d a t l o g i k a i - s z e m a n t i k a i s z e r k e z e t é t , hierarchiá­

ját. B á r t a r t a l m a z strukturált s z e m a n t i k a i leíráshoz h a s z n á l h a t ó k ó d o k a t - például a H 1 , H 2 és H3 c í m e k e t v a g y az „ a d d r e s s " a l k o t ó e l e m e t - , e z e k r e n d e l t e t é s s z e r ű h a s z n á l a t a a z o n b a n n e m terjedt el. E b b ő l k ö v e t k e z ő e n a H T M L f o r m á t u m k e v é s s é a l k a l m a s jól v i s s z a k e r e s h e t ő , strukturált digitális o b j e k t u m o k rögzítésére.

3.2.4 TEI (Text Encoding lnitiative)2C H á r o m s z á m í t ó g é p e s n y e l v é s z e t i és irodalmi k u t a t á s o k k a l f o g l a l k o z ó a n g o l s z á s z t u d o m á n y o s t á r s a s á g indította a projektet 1 9 8 7 - b e n . A z akkor m e g h a t á r o z o t t cél kiállta az idők p r ó b á j á t : olyan s z ö v e g - , illetve a d a t r ö g z í t é s i ú t m u t a t ó t készíteni, amely e g y a r á n t szoftver-, h a r d v e r - és a l k a l m a z á s ­ f ü g g e t l e n , és a l k a l m a s b á r m i l y e n nyelvű és korú s z ö v e g r ö g z í t é s é r e . R e n d k í v ü l f o n t o s , h o g y nem s z a b v á n y t , h a n e m ú t m u t a t ó t k í v á n t a k alkotni a k e z d e m é n y e z ő k . Az első ilyen d o k u m e n t u m 1 9 9 0 - ben készült el, majd a s z a k m a i vita a l a p j á n 1 9 9 2 - re a m á s o d i k , v é g ü l 1 9 9 4 - r e a h a r m a d i k , i m m á r v é g l e g e s n e k tekintett ajánlás is m e g j e l e n t . Az e g y e s v á l t o z a t o k között e g y r e s z é l e s e b b kört v o n t a k be az é r t é k e l é s b e , ez p e r s z e az eredeti e l k é p z e l é s e k h e z k é p e s t s z ü k s é g s z e r ű e n e g y r e t ö b b k o m p r o m i s s z u m o s e l e m e t is h o z o t t . J e l e n l e g folyik a v é g s ő s z ö v e g k i s e b b h i b á i n a k j a v í t á s a , illetve a projekt t o v á b b i s o r s á n a k a v i z s g á l a t a . Az ajánlás a z o n b a n l é n y e g é b e n k é s z n e k t e k i n t h e t ő .

A T E l - a j á n l á s e g y a r á n t i g y e k s z i k állást foglalni a m e t a a d a t - r ö g z í t é s két fő k é r d é s é b e n : mit és h o g y a n ? A z utóbbira a v á l a s z e g y s z e r ű : a T E I a m e t a a d a t o k a t az S G M L s z a b v á n y n a k m e g f e l e l ő e n rögzíti. A T E I t e k i n t h e t ő az S G M L s z i n t a x i s o n ala­

puló s z e m a n t i k a i r e n d s z e r n e k . A z e l ő b b i k é r d é s r e u g y a n a k k o r az ajánlás i g y e k s z i k e g y m i n é l s z é l e ­ s e b b kör s z á m á r a e l f o g a d h a t ó m e g o l d á s t kínálni, m e l y e t az O x f o r d és C h i c a g o k ö z p o n t t a l m ű k ö d ő

(8)

Golden D.-Tóth T.-Turi L.: Virtuális Örökkévalóság.

projekt v e z e t ő i g y a k r a n h a s o n l í t a n a k a chicagói pizzához: a v e n d é g e l ő b b eldönti, hogy v é k o n y a b b , r o p o g ó s vagy v a s t a g a b b , k e n y é r s z e r ű t é s z t á t kér, majd kiválasztja a f e l t é t e k e t . A s z ö v e g r ö g z í t é s r e v o n a t k o z t a t v a ez azt j e l e n t i , hogy az ajánlás m e g ­ h a t á r o z z a (1) a m i n d e n s z ö v e g r e é r v é n y e s a l a p k ó d k é s z l e t e t (core tags), (2) a f ő b b s z ö v e g t í ­ pusok szerint k ü l ö n b ö z ő hat fő k ó d k é s z l e t e t (base tag sets). és ( 3 ) az e l s ő s o r b a n a s z ö v e g r ö g z í t é s céljától f ü g g ő k i e g é s z í t ő k ó d k é s z l e t e k e t (additionat tag sets), a m e l y e k b ő l tizet k ü l ö n b ö z t e t m e g az ajánlás

1. A z alapkódkészlet n e m c s a k a l e g e l e m i b b , álta­

lánosan é r v é n y e s s z ö v e g e l e m e k m e t a k ó d j á t t a r t a l m a z z a ( b e k e z d é s , sor, d á t u m stb.), d e a s z ö v e g e g é s z é r e v o n a t k o z ó bibliográfia jellegű információkat t a r t a l m a z ó ú n . fejlécet (header) is. A z ajánlás m e g l e h e t ő s e n sokféle i n f o r m á c i ó rögzítését j a v a s o l j a , bár n e m zárja ki a pusztán a z o n o s í t á s r a s z o l g á l ó , m i n i m á l i s fejléc a l k a l m a ­ zását s e m .

2. A z a j á n l á s b a n m e g k ü l ö n b ö z t e t e t t f ő b b szöveg­

típusok:

> próza,

^ v e r s ,

> d r á m a

> lejegyzett b e s z é d ,

> n y o m t a t o t t szótárak, t e r m i n o l ó g i a i a d a t b á z i s 3. Kiegészítő kódkészletek:

> h i p e r t e x t k a p c s o l a t o k , m u t a t ó k jelölése;

> analitikus információk kódolása:

«- strukturális n y e l v é s z e t i és m á s e l e m z é s e k e r e d m é n y é n e k kódjai;

*- a s z ö v e g é r t e l m e z é s e k o r , r ö g z í t é s e k o r fel­

merülő b i z o n y t a l a n s á g o k j e l ö l é s e ;

" kéziratos f o r r á s o k á t í r á s á n á l h a s z n á l a t o s különleges jelek;

r kritikai s z ö v e g r ö g z í t é s ;

> nevek és d á t u m o k kódolása:

~r gráfok, f á k és h á l ó z a t o k á b r á z o l á s a ;

> t á b l á z a t o k és képletek;

> nyelvi k o r p u s z o k .

A z ajánlás m e g k ü l ö n b ö z t e t egy n e g y e d i k c s o ­ portot is, a járulékos dokumentumokai fauxiliary document types), a m e l y e k közül a l e g f o n t o s a b b ­ nak az ú n . í r á s r e n d s z e r - d e f i n í c i ó tűnik (writing system declaration). A z í r á s r e n d s z e r - d e f i n í c i ó cél­

j a , hogy m e g h a t á r o z z a a k é r d é s e s nyelv, lejegyzé­

s é n e k m ó d j a ( á b é c é , s z ó t a g í r á s stb.), és a lejegy­

z é s h e z használt írásjelkészlet közötti Összefüggé­

seket. E t e c h n i k a i m e g o l d á s t e h á t l e h e t ő v é teszi a m a g y a r karakterkészlet p o n t o s rögzítését.

Az ajánlás jelenlegi s z ö v e g é t t ö b b é v i t u d o m á ­ n y o s vita és k o n s z e n z u s k e r e s é s e l ő z t e m e g , amit a b e v e z e t ő b e n így ö s s z e g e z n e k a s z e r k e s z t ő k :

„Az ajánlás nem kíván különbséget tenni a szövegre vonatkozó »objektiv« és »szubjektiv« információ, illetve

a szöveg »megje!enítése« és »interpretációja« között. E megkülönböztetések - noha szűkebb, jobban meghatá­

rozható összefüggésben gyakran hasznosnak bizonyul­

halnak - itt leginkább úgy jelentkeznek, mint olyan kérdések, melyekben lehetséges a tudományos kon­

szenzus, és olyanok, melyekben nem. Kétségtelen, hogy e konszenzus tartalma megváltozhat. A TEI- ajánlás nem ajánlja és nem teszi kötelezővé semmiféle metaadat rögzítését. . . A szövegrögzítés pontosságá­

ról, illetve az interpretáció helyességéről mindig magá­

nak a felhasználónak kell döntenie. Az ajánlás csak eszközt biztosít magának a szövegrögzítésnek a doku­

mentálására, igy maga az eljárás, illetve a mögöttes értelmezői döntések átláthatóvá válnak a szöveg fel­

használója számára."

A T E l - a j á n l á s t s z á m o s bírálat éri, általános jel­

legű és lényegi e g y a r á n t . A z 1200 oldalas d o k u ­ m e n t á c i ó t e r m é s z e t e s e n n e m k ö n n y ű o l v a s m á n y , a teljes r e n d s z e r m e g i s m e r é s e az S G M L i s m e r e t e mellett is k o m o l y e l m é l y ü l é s t i g é n y e l . K e z d ő T E I - a l k a l m a z ó k n a k nagy s e g í t s é g lehet a TEI Lite DTD 1, a m e l y e g y s z e r ű s í t e t t , á m a teljes v á l t o z a t ­ tal kompatíbilis k ó d k é s z l e t e t kínál.

A f e l h a s z n á l ó t ó l m e g k í v á n t e r ő f e s z í t é s e k m e l ­ lett a T E I j e l e n t ő s g é p i e r ő f o r r á s t is i g é n y e l , u g y a n ­ is a T E I D T D m e g l e h e t ő s e n bonyolult S G M L - a l k a l m a z á s n a k s z á m í t . A z első v á l t o z a t e l k é s z ü l ­ tekor, a 9 0 - e s évek e l e j é n n e m volt o l y a n P C - kompatíbilis szoftver, amely a teljes D T D f e l d o l g o ­ z á s á r a k é p e s lett v o l n a , a k ö z i s m e r t D O S - o s m e ­ m ó r i a k o r l á t o k miatt erre a k k o r i b a n c s a k Unix- és M a c i n t o s h - a l a p ú s z á m í t ó g é p e k voltak k é p e s e k Ezek az a k a d á l y o k a z ó t a elhárultak, d e a kezdeti n e h é z s é g e k n y o m á t ő r z i a z , hogy a T E l - k ó d o l ó k által legelterjedtebben használt S G M L - e d i t o r to­

v á b b r a is a M a c i n t o s h - a l a p ú A u t h o r / E d i t o r (Soft- Q u a d ) . K ö s z ö n h e t ő e n az S G M L e g y r e n a g y o b b n é p s z e r ű s é g é n e k az ipari d o k u m e n t á c i ó és a k ö n y v k i a d á s ( e l s ő s o r b a n sz-ótár- és lexikonkiadás) t e r ü l e t é n , n a p j a i n k b a n m á r r e n d k í v ü l s z é l e s az S G M L - k o m p a t í b i l i s s h a r e w a r e és k e r e s k e d e l m i s z o f t v e r e k v á l a s z t é k a .

A t e c h n i k a i és t a r t a l m i n e h é z s é g e k ellenére a T E l - a j á n l á s a k a d á l y t a l a n u l terjed, u g y a n i s g y a k o r ­ latilag nincs alternatívája, v a g y i s j e l e n l e g nincs m á s , ilyen m é l y s é g i g kidolgozott m e t a a d a t - a j á n l á s . A z a n g o l s z á s z s z ö v e g t u d o m á n y o k b a n m e g h a t á r o ­ z ó n a k s z á m í t ó t u d o m á n y o s t á r s a s á g , a M o d e r n L a n g u a g e A s s o c i a t í o n ( M L A ) 1997 a u g u s z t u s á b a n elfogadta mint kötelező szövegrögzítési formát22. Robin Cover S G M L - o l d a l a2 3 1998 elején k ö z e l ö t v e n o l y a n j e l e n t ő s e b b projektről t u d , a m e l y a T E l - a j á n l á s alapján m ű k ö d i k . N o h a a rögzített s z ö v e g e k t ö b b s é g e t o v á b b r a is a n g o l n y e l v ű , m a már j e l e n t ő s s z á m b a n t a l á l h a t ó k ö z ö t t ü k f r a n c i a , latin, o l a s z , n é m e t , h o l l a n d , s v é d , n o r v é g , s p a n y o l , j a p á n , g ö r ö g és h é b e r nyelvű s z ö v e g is.

K ü l ö n e m l í t é s t é r d e m e l a MULTEXT projekt 2\ illetve e n n e k kelet-európai v á l t o z a t a , a MULTEXT-

(9)

TMT 45. évf. 1998. 8 - 9 . sz.

East . A z E u r ó p a i U n i ó által t á m o g a t o t t M U L - T E X T projekt célja az, hogy a T E l - a j á n l á s alapján kialakított ú n . Corpus Encoding Specification D T D - nek m e g f e l e l ő t ö b b n y e l v ű m i n t a k o r p u s z o k a t hoz­

z o n létre, e z z e l t e s z t e l v e a t ö b b n y e l v ű s z ö v e g e k s z á m í t ó g é p e s f e l d o l g o z á s á n a k lehetőségeit, illetve a T E I a l k a l m a z h a t ó s á g á t n e m a n g o l nyelvű s z ö v e ­ g e k r e . A M U L T E X T - E a s t projekt k e r e t é b e n e g y e t ­ len r e g é n y t (Orweil 1 9 8 4 c. m ű v é t ) r ö g z í t e t t e k tíz n y e l v e n , az e g y e s v á l t o z a t o k a t e g y s é g e s a z o n o s í ­ tó r e n d s z e r r e l r e n d e l v e e g y m á s h o z . A tíz nyelv:

bolgár, c s e h , észt, lett, litván, m a g y a r , o r o s z , ro­

m á n , s z e r b - h o r v á t és s z l o v é n . (A m a g y a r v á l t o z a ­ tot Tihanyi László, a M o r p h o l o g i c , illetve O r a v e c z Csaba, az M T A N y e l v t u d o m á n y i Intézet m u n k a t á r ­ sa k é s z í t e t t é k . )

H a s o n l ó k í s é r l e t e k e t folytat a C o p e r n i c u s e g y ü t t m ű k ö d é s i p r o g r a m k e r e t é b e n a TELRI pro­

jekt26 is, Platón Á l l a m c í m ű m ü v é t rögzítették 17 n y e l v e n .

A M U L T E X T - E a s t s z ö v e g e n kívül m a g y a r o r ­ szági T E l - a l k a l m a z á s o k r ó l nincs t u d o m á s u n k , bár S G M L - a l a p ú s z ö v e g k o r p u s z o k r ó l és p r o j e k t e k r ő l igen: házi k é s z í t é s ű D T D - t h a s z n á l a N y e l v t u d o ­ m á n y i Intézet a k é s z ü l ő n a g y s z ó t á r s z ö v e g k o r p u ­ s z á h o z és az A k a d é m i a i K i a d ó is.

A r é s z l e t e k e t é r i n t ő , lényegi bírálatok és k é r d é ­ sek s z á m á r a a T E l - p r o j e k t L i s t s e r v - f ó r u m o t tart f e n n , m e l y e n a f e l h a s z n á l ó k é s z r e v é t e l e i r e a szer­

kesztők, illetve a t a p a s z t a l t a b b f e l h a s z n á l ó k v á l a ­ szolnak.

3.2.5 SGML ésaweb

A H T M L s o k a t s e g í t e t t és sokat ártott is az S G M L s z a b v á n y n a k . S e g í t e t t , h i s z e n a W o r l d W i d e W e b n é l k ü l az S G M L a l e g t ö b b s z á m í t ó g é p ­ h a s z n á l ó s z á m á r a t a l á n m é g m a is az az o b s k ú r u s m ű s z a k i s z a b v á n y v o l n a , a m i 1 9 8 7 - b e n , a m i k o r a T E I p r o j e k t v e z e t ő i e l h a t á r o z t á k , hogy ezt kell m e g t a n í t a n i a b ö l c s é s z e k n e k . A z e g y s z e r ű H T M L - b ö n g é s z ö k és - s z e r k e s z t ő k elterjedése ó t a az element, entity és atthbute f o g a l m a s z i n t e triviali­

t á s n a k s z á m i t . T e r m é s z e t e s e n a D T D és a hierar­

c h i k u s s z ö v e g s t r u k t ú r a t o v á b b r a is i s m e r e t l e n m a r a d t , h i s z e n - m i n t e m l í t e t t ü k - a H T M L e g y e t ­ len, s z i n t e k i z á r ó l a g tipográfiai célú D T D - t h a s z n á l .

A H T M L - a l a p ú w e b h i h e t e t l e n ü l g y o r s v i l á g m é ­ retű h ó d í t á s á n a k első é v e i b e n az o r t o d o x S G M L - f e l h a s z n á l ó k f a n y a l o g v a b e s z é l t e k a H T M L - r ő l ,

mint v a l a m i j á t é k s z e r r ő l . A s z e r v e r - k l i e n s s z e r k e ­ zetű d i n a m i k u s w e b a d a t b á z i s o k m e g j e l e n é s e a z o n b a n m e g v á l t o z t a t t a a helyzetet. Lou Bumard, a T E l - a j á n l á s e g y i k s z e r k e s z t ő j e - m a g a is o r t o d o x S G M L - f e l h a s z n á l ó - 1996-ban már igy ír27:

„Mégis miért használjuk a HTML-t? A gazdasági, politikai és szociológiai érvek mellett van még egy eddig figyelmen kívül hagyott szempont: a web tartalmának

jelenlös része eredendően tiszavirág-életű. Ezek az anyagok csak »itt és most« kívánnak halni, például termékel eladni vagy egyszerűen szenzációt kelteni EbbÖl következően semmi értelme ezekre több energiái pazarolni, mint a hasonló papírbrosúrákra. A gondot inkább az okozza, hogy éppen úgy HTML-t kell hasz­

nálnunk, ha egy fontos kézikönyvet digitalizálunk, mint ha éppen egy üdítőitalt reklámoznánk.

Valójában azonban még az értékesebb művek rögzítésénél is csak akkor tűnik fel a HTML gyengesé­

ge, ha a szerző vagy a kiadó szempontjából vizsgáljuk a helyzetet. Ha a képernyőkép tetszetős, az olvasó számára végső soron mindegy, hogy az korszerű objek­

tum-orientált adatbázis-kezeiöböl, postscript fájlból vagy pedig feketemágiával előállított HTfvIL-fájlból származik- e. ... A HTML-nek mint szerver-formátumnak van né­

hány nyilvánvaló hátránya. Noha a kezdeti költségek alacsonyak, HTML-dokumentumokkal aligha tanácsos komolyabb, hosszabb távú szolgáltatást indítani. A hivatkozások konzisztenciájának megőrzése már egy csak viszonylag dinamikus állomány esetében is rend­

kívül sok fejfájást okozhat."

A m e g o l d á s t , úgy t ű n i k , a t é n y l e g e s S G M L és a k u r r e n s H T M L - v e r z i ó ö t v ö z é s e j e l e n t h e t i , m i n d k e t ­ tőt arra h a s z n á l v a , a m i r e v a l ó : v a l ó d i S G M L f o r m á ­ t u m o t h a s z n á l n i a s z e r v e r o l d a l o n , és H T M L - t a kliensoldali m e g j e l e n í t é s h e z . I m e n é h á n y e hibrid m e g o l d á s előnyei k ö z ü l B u m a r d idézett cikke alapján:

A szerveroldali SGML előnyei:

> A d o k u m e n t u m r ö g z í t é s e , k ó d o l á s a illeszkedhet a s z ö v e g , illetve f e l h a s z n á l á s á n a k s a j á t o s s á g a ­ ihoz.

r A k e r e s é s k o n t e x t u s é r z é k e n y lehet, ezáltal s o k k a l p o n t o s a b b , h a s z n á l h a t ó b b e r e d m é n y t a d .

> A d o k u m e n t u m k ö n n y e n k o n v e r t á l h a t ó , illetve a d a p t á l h a t ó t e t s z ő l e g e s c é l o k r a .

A kliensoldali HTML előnyei:

'r A b ö n g é s z ő k k ö n n y e n h o z z á f é r h e t ő k m i n d e n h a r d v e r p l a t f o r m o n .

> A letölthető b ö n g é s z ő plug-in p r o g r a m o k k a l sokféle k i e g é s z í t ő f u n k c i ó m e g o l d h a t ó .

> A H T M L s t í l u s l a p o k t e r j e d é s é v e l a m e g j e l e n í t é s is k ö n n y e b b e n b e f o l y á s o l h a t ó .

Az első és l e g i s m e r t e b b S G M L - a l a p ú W W W s z e r v e r az O x f o r d E n g l i s h D i c t i o n a r y h e z használt P A T s z ö v e g k e z e l ő k i e g é s z í t é s e , ezt h a s z n á l j a a Michígani E g y e t e m e n m ű k ö d ő Humanities Text lnitiative2a projekt és a Virginiai E g y e t e m h e z t a r t o ­ zó Electronic Text Center23. E m e g o l d á s b a n a f e l h a s z n á l ó t ó l kapott k e r e s ő k é r d é s e k e t a s z e r v e r S G M L f o r m á t u m ú v á k o n v e r t á l j a , m a j d a m e g f e l e l ő s z ö v e g r é s z e k e t S G M L - b ő l H T M L - b e , és e z t küldi a f e l h a s z n á l ó n a k v i s s z a . E z m e g l e h e t ő s e n nagy t e l j e s í t m é n y ű s z e r v e r t i g é n y e l . E g y s z e r ű b b , o l ­ c s ó b b m e g o l d á s n a k t ű n i k a z , h a a s z e r v e r c s a k S G M L f o r m á t u m ú s z ö v e g e t szolgáltat, a m e g j e -

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

Bár vannak jelei, hogy bizonyos tanulók és bizonyos mûveltségterületek esetében a tudás- szerzés feltételei javultak, összességében még egyik területen sem áll

A lényeg az, hogy az adott előny indokolt legyen, ne legyen diszkriminatív, arányos és objektív szempontú legyen, illetve úgy részesítse előnyben a hátrá - nyos

jelei vannak annak, hogy a elfogadott paradigma inog... gukba csoportokat,

A tartós kereslet csökkenés jelei az egy és két csillagos szállodákban jellemzőek ahol az elmúlt hét évben csak keresletcsökkenés figyel- hető meg, ez

E drámai változás első jelei már mutatkoznak, bár az Akadémiai Könyvtár mint elsősorban bölcsész szakkönyvtár, talán később kell, hogy szembesüljön

Fontos célja az Európai Unió digitális könyvtárakra vonatkozó kezdeményezésének egy európai szer- zői jogi információs rendszer kiépítése az out of print és

donítják neki, amit ők. Néhány éve e lap hasábjain az online keresés és szolgáltatás értelmezésének veszélyes csapdáira hívtam fel a gépi információkeresésben

Gárdonyi is — ráeszmélve, hogy igazi önmagát a népélet feltárásával találja meg, és erre is kényszerítve világ- nézeti fejlődése által — éppen a