• Nem Talált Eredményt

2. Online publikálás (metaadatok és keretprogramok)

2.4. Dublin Core

A Dublin Core metaadat séma és elemkészlet hivatalos információs és dokumentációs forrása a Dublin Core Metadata Initiative (DCMI) honlap http://www.dublincore.org/ . A metaadatséma karbantartását, dokumentációját, és fejlesztését a DCMI végzi.

A Dublin Core (DC) bármely tudományágra alkalmazható metaadat séma, amely leíró metaadat elemeket tartalmaz. A sémára jellemző az egyszerűség és a rugalmasság. Széles körben való alkalmazásának egyik oka éppen egyszerűsége, könnyen érthetősége és átláthatósága. A Dublin Core sémára is jellemző, hogy folyamatos fejlesztések, egyeztetések eredményeként folyamatosan fejlődik. A fejlesztések egyik fontos irányát a tapasztalt hibákra, hiányosságokra adott válaszok jelentik, a másik irányt pedig az újonnan felmerülő kihívásokra adott válaszok.

A Dublin Core metaadat séma története 1995-ben, az Ohio állambeli Dublinban kezdődött. Az OCLC/NCSA Metadata Workshop keretében egy kb. 50 fős szakértői csoport gyűlt össze azzal a céllal, hogy összeállítsanak egy olyan kiindulási, vagy alap adatelem készletet, amely elégséges és megfelelő az elektronikus információforrások leírására. A cél természetesen az volt, hogy az egyre szaporodó elektronikus információforrások kereshetővé, és elérhetővé váljanak az adatelemek használata által. Az elektronikus információforrások leírására az addig használt eszközök már nem voltak alkalmasak. Az addig alkalmazott eszközök túl bonyolultak, és hozzáértést igénylőek voltak, így olyan új eszközre volt szükség, amelyet a digitális világ minél szélesebb körben képes, és hajlandó alkalmazni. Ezt a célt az egyszerűség és könnyen érthetőség szolgálta leginkább. Ugyanakkor az is egyértelműen látszott, hogy valamilyen szabványosításra, egységesítésre is szükség van ahhoz, hogy az információforrások ténylegesen kereshetővé váljanak. A szakértői csoportnak sikerült megállapodnia 13 elemről, amely elemkészlet szükségesnek és elégségesnek tűnt a kitűzött cél eléréséhez.

A séma nevének első eleme (Dublin) a workshop helyszínére utal. A második elem, a Core, azaz mag kifejezés pedig arra utal, hogy a kialakított elemkészlet tulajdonképpen egy olyan alap, amely tovább bővíthető.

1995-ben tehát 13 metaadat elemet határoztak meg és fogadtak el az említett szakértői össze-jövetelen. További egyeztetések és a séma további fejlesztései a kb. évenként tartott konferenciákon történtek meg. Így első körben az elemek listája kiegészült 15 elemre. A következő fontos változást az ún. „minősítők‖ bevezetése hozta.

Időközben a metaadat szabvány ISO szabvánnyá is alakult. Napjainkban ismét fontos fejlődés zajlik a szabványt illetően: a szemantikus web igényeinek és kihívásainak megfelelő fejlesztések, változtatások történnek. Így a QDC helyét már hivatalosan is átvette a DCMI Terms ajánlás. Nézzük meg a sémát és fejlődését részletesen.

A Dublin Core elemkészlete Magyarországon 2004-ben vált ISO szabvánnyá – az MSZ ISO 15836 Információ és dokumentáció. A Dublin Core metaadat elemkészlete címen adták ki. A Dublin Core 15 alapelemét tartalmazza a következő táblázat:

1. Title Cím az információforrásnak adott név

2. Creator Létrehozó az információforrás tartalmának létrehozásáért

elsősorban felelős entitás

3. Subject Tárgy- és kulcsszavak,

jelzetek

az információforrás tárgyának megadása

4. Description Leírás az információforrás tartalmának ismertetése

5. Publisher Kiadó az információforrás nyilvánossághoz

közvetítéséért felelős entitás

6. Contributor Közreműködő az információforrás tartalmához készült

hozzájárulás létrehozásáért felelős entitás

7. Date Dátum az információforrás létezése során előforduló

esemény időpontja (dátuma)

8. Type Típus az információforrás tartalmának jellege, vagy

fajtája

9. Format Formátum az információforrás fizikai vagy digitális

megjelenési formája

10. Identifier Forrásazonosító az információforrásra való, adott környezeten belüli egyértelmű hivatkozás

11. Source Eredeti információforrás hivatkozás arra az eredeti információforrásra,

amelyből a jelen információforrás származik

12. Language Nyelv az információforrás intellektuális tartalmának

nyelve

13. Relation Kapcsolat hivatkozás az információforrással kapcsolatban

lévő másik információforrásra

14. Coverage Tér-idő vonatkozás az információforrás tartalma vagy alkalmazási területe térben vagy időben (kiterjedés)

15 Rights Jogok információk az információforrással

kapcsolatos jogokról

A táblázat a magyarországi ISO szabvány adatait tartalmazza. http://mek.oszk.hu/dc/szabvany/134715.pdf (Letöltve: 2013.01.29.)

A Dublin Core szabvány az elemkészlet egyik elemét sem teszi kötelezővé – azaz az elemkészlet minden elemének használata szabadon választható, vagyis opcionális. A séma azt is kimondja, hogy az elemkészlet minden eleme szabadon ismételhető. Az elemek sorrendjét sem szabályozza a séma.

A Dublin Core sémának eddig két változatát volt szokás megkülönböztetni: az ún. egyszerű Dublin Core-t (Simple Dublin Core) és az ún. minősített Dublin Core-t (Qualified Dublin Core – QDC).

Az egyszerű Dublin Core kizárólag csak a 15 elemet tartalmazza.

A minősített Dublin Core (QDC) is ezeket az alapelemeket tartalmazza, viszont az alapelemek jelentései tovább finomíthatóak ún. minősítők használatával. A Dublin Core-nak ilyen irányú fejlesztésére éppen túlzott egyszerűsége miatt volt szükség. Széles körű használata során kiderült, hogy az alapelemeket sokszor nem azonos értelmezéssel használják felhasználói. Ezért vált szükségessé azok jelentésének pontosítása, szűkítése, finomítása. Így tehát egyes alapelemek ún. minősítőkkel (element refinements) egészíthetők ki, amelyeknek köszönhetően az elem jelentése és értelmezése következetessé, pontossá, egyértelművé válik. A minősítők használata nem kötelező. Dönthetünk úgy, hogy a minősített Dublin Core-t alkalmazzuk, és bizonyos elemek esetében használjuk a minősítőket, míg más elemek esetében nem alkalmazzuk azokat. A séma nem minden elemhez határoz meg használható minősítőket. A következő ábra mutatja, hogy mely elemek esetében, mely minősítők alkalmazhatóak a DC ajánlás szerint.

A minősített Dublin Core másik fontos elemét az ún. kódolási sémák (encoding schemes) használata jelenti. A QDC bizonyos elemek estében meghatároz külső kötött szókészleteket, listákat, vagy szabványokat, amelyek az adott elem értékének megadásához alkalmazhatóak. Szintén az itt következő ábra tartalmazza az DCMI által ajánlott kódolási sémákat, és hogy mely séma, mely elem értékének megadásakor alkalmazható.

DCMES Element Element Refinement(s) Element Encoding Scheme(s)

Valid

-A táblázat a DCMI Dublin Core Qualifiers dokumentumának adatait tartalmazza. -A dokumentum ma már nem

érvényes – a DCMI Metadata Terms dokumentum helyettesíti.

http://dublincore.org/documents/2000/07/11/dcmes-qualifiers/ (Letöltve: 2012.01.29.)

A minősítők és a kódolási sémák használatának bemutatására leginkább a Dublin Core Date/Dátum eleme mutatkozik alkalmasnak.

A Dátum elem a séma definíciója szerint: az információforrás létezése során előforduló esemény időpontja (dátuma). Ez tehát bármely dátum, vagy időperiódus lehet, amely az információforráshoz köthető annak létezése során. Ezt az általános meghatározást finomítják, szűkítik a Dátum elemmel együtt használható minősítők.

Created / Létrehozva az információforrás létrehozásának időpontja Valid / Érvényes információforrás érvényességének ideje, dátuma

Available / Hozzáférhető a dátum, amikor az információforrás elérhetővé válik, vagy fog válni

Issued / Kibocsátva az információforrás formális kibocsátásának (pl.: kiadásának) dátuma

Modified / Módosítva az információforrás módosításának időpontja

A Dátum elemhez kapcsolható még további három minősítő, amelyek használata nem igazán elterjedt. Ezek a következők: Accepted (Elfogadva), Copyrighted (Szerzőjogilag védve), Submitted (Feltöltve/Benyújtva).

A Dátum elem értékének megadásakor ajánlott kódolási sémák:

• W3CDTF http://www.w3.org/TR/NOTE-datetime

• DCMI Period http://dublincore.org/documents/dcmi-period/

Példák a Dátum elem értékének az ajánlott kódolási sémák alapján történő megadására:

Date.Created 2009-07-30 év, hónap, nap pontos megadásával

Date.Created 1915? év megadásával, bizonytalan keletkezési dátummal

Date.Issued 1958-1998 időperiódus megadása

A kódolási sémák által ajánlott formátumok vagy kötött szókészletek használata természetesen szintén nem kötelező. Ezek csak lehetséges érték formátumok, amelyekhez az adott helyi alkalmazási profil előírásai és szabályai szerint esetlegesen alkalmazkodnia kell a metaadatok készítőinek.

A minősített DC használata akkor megfelelő, ha a megadott metaadat értékekre igaz, hogy ha a DC elemekből elhagyjuk a jelentésüket finomító minősítőket, az értékek akkor is megfelelőek, és valósak az így „keletkező‖

egyszerű DC elemekhez. Ez az ún. némítás (vagy lebutítás – dumb down) szabálya. Példák:

DC.Format.Medium DVD DC.Format DVD

DC.Title.Alternative 100 Fotos - 100

Denkmäler der Az egyszerű és a minősített Dublin Core séma használata rendkívül elterjedt a digitális gyűjtemények, digitális könyvtárak világában.

Az egyszerű Dublin Core ráadásul úgy is működik a digitális világban, mint egyfajta tolmács nyelv – azaz egyszerűsége miatt ezt a sémát használják a különböző sémák közötti átjárás biztosítására, illetve a különböző sémát használó digitális gyűjtemények közötti együttműködések megvalósítására is.

2.4.1. Dublin Core metaadatok különböző kódolásban (szintaxisban)

A DC elemek és értékek nagyon sokféleképpen kapcsolódhatnak az általuk leírt információ-forráshoz. Ezen túl nagyon sokféle rendszerben, nyelvben, kódolásban tárolhatók, szolgáltathatók és jeleníthetők meg. A következőkben csak néhány gyakrabban használt kódolási lehetőségre térünk ki az egyes nyelvek, kódolások részletes leírása, magyarázata nélkül.

2.4.1.1. HTML

A HTML nyelvben a metaadatok kezelésére, és tárolására a <meta> elemek használatosak. A <meta> elem

‖name‖ attribútumának értéke tartalmazza az adott metaadat elemet, a ‖content‖ attribútumának értéke pedig a metaadat értéket. Nézzünk meg néhány példát különböző esetekre.

Egyszerű DC esetén:

<meta name = "DC.Creator"

content = "Gogh, Vincent van" />

<meta name = "DC.Title"

content = " Metaadatok készítése" />

QDC esetén a kódolási séma megadása (a séma megnevezése a ‖scheme‖ attribútum értéke):

<meta name = "DC.Subject"

content = "Das Wohltemperierte Klavier, Teil I" />

HTML dokumentumokban a <meta> elem a dokumentum fej részében (<head> </head>) helyezkedik el. A megfelelő névteretek meghatározása is a fej részben, a <link> elemben történik meg. A következő példában az egyszerű DC 15 elemét tartalmazó névtere kerül meghatározásra a ‖rel‖ és a ‖href‖ attribútumok használatával:

<html>

<head>

<title> A Dirge </title>

<link rel = "schema.DC" href="http://purl.org/DC/elements/1.0/">

<meta name = "DC.Title" content = "A Dirge">

<meta name = "DC.Creator" content = "Shelley, Percy Bysshe">

<meta name = "DC.Type" content = "poem">

<meta name = "DC.Date" content = "1820">

<meta name = "DC.Format" content= "text/html">

<meta name = "DC.Language" content = "en">

</head>

<body>

</body>

</html>

HTML dokumentumokban a metaadatok beágyazhatók az általuk leírt információforrásba. Erre példa a fenti HTML dokumentum, ahol a <head>-ben találhatók a metaadatok, és a <body> már magát a dokumentumot tartalmazza.

Külön adatbázisban is tárolhatók a metaadatok. Ez esetben az információforrástól külön álló metaadatrekordnak tartalmaznia kell az információforrást azonosító URI-t is: <meta name= "DC. Identifier" content=

"http://hdl.handle.net/2437/99985" />

<dc:identifier> http://hdl.handle.net/2437/99078 </dc:identifier>

<title>Expressing Dublin Core in HTML/XHTML meta and link elements</title>

<link rel="schema.DC" href="http://purl.org/dc/elements/1.1/" />

<link rel="schema.DCTERMS" href="http://purl.org/dc/terms/" />

<meta name="DC.title" lang="en" content="Expressing Dublin Corein HTML/XHTML meta and link elements" />

<meta name="DC.creator" content="Andy Powell, UKOLN, University of Bath"/>

<meta name="DCTERMS.issued" scheme="DCTERMS.W3CDTF" content="2003-11-01" />

<meta name="DC.identifier"

scheme="DCTERMS.URI"content="http://dublincore.org/documents/dcq-html/" />

<meta name="DCTERMS.abstract" content="This document describes howqualified Dublin Core metadata can be encodedin HTML/XHTML" />

<meta name="DC.format" scheme="DCTERMS.IMT" content="text/html" />

<meta name="DC.type" scheme="DCTERMS.DCMIType" content="Text" />

</head>

...

A példa a DCMI ajánlásaiban megtalálható elektronikus dokuemntumból való: POWELL, Andy: Expressing Dublin Core in HTML/XHTML meta and link elements. http://dublincore.org/documents/dcq-html/ (Letöltve:

2013.01.29.)

2.4.1.4. RDF/XML kódolásban

A Dublin Core RDF/XML kódolásban való használatát a fejezet végén, a szemantikus web rövid bevezetése után tárgyaljuk.

A Dublin Core séma szemantikus web céljainak megfelelő átalakítása folyamatosan zajlik. Ezen átalakulásnak köszönhetően a Dublin Core hivatalos dokumentációi szerint a QDC, azaz minősített Dublin Core séma helyét a Dublin Core Terms ajánlás vette át. Mindenképpen fontos tudnunk ezekről a változásokról, de azt is meg kell jegyeznünk, hogy természetesen a digitális gyűjtemények döntő többsége még nem a szemantikus web szemlélete szerint működik.

Ahhoz, hogy a DC új változatát megértsük, további információkra van szükségünk, elsősorban a szemantikus web elvéről, technológiájáról, világáról. Így a DCMI új ajánlására a fejezet végén térünk vissza.

Ellenőrző kérdések:

1. Miben különbözik a minősített Dublin Core metaadat séma az egyszerű Dublin Core sémától?

2. Milyen lehetséges kódolásai léteznek a Dublin Core sémának?