• Nem Talált Eredményt

Web-archívum made in Slovakia: Kísérleti projekt az elektronikus információforrások gyűjtésére és archiválására megtekintése

N/A
N/A
Protected

Academic year: 2022

Ossza meg "Web-archívum made in Slovakia: Kísérleti projekt az elektronikus információforrások gyűjtésére és archiválására megtekintése"

Copied!
2
0
0

Teljes szövegt

(1)

Web-archívum made in Slovakia: Kísérleti projekt az

elektronikus információforrások gyűjtésére és archiválására

A web mint kulturális örökség

A weben található elektronikus információforrások a kulturális örökség fontos részei. Valamennyi, a webes források archiválását célul kitűző állam számára nagy kihívást jelent a gyűjtés, tárolás és megőrzés komplex feladatának megoldása. Míg a svédek és a finnek országos szinten vállalkoznak a – .se és .fi végződésű doménnevekhez tartozó – webtartalmak archiválására, addig az amerikai Internet Archive (www.archive.org) az összes we- bes tartalom gyűjtésére törekszik.

Máshol szelektív gyűjtésre vállalkoznak (ausztrál Pandora projekt, amerikai Minerva projekt). 2004- ben Amszterdamban létrejött a Web Archive non- profit szervezet, amely az európai kulturális intéz- ményeknek nyújt lehetőséget webes tartalmaik nyilvános hozzáférésű, hosszú távú archiválására (http://europaarchive.org).

A Cseh Nemzeti Könyvtár és a Pozsonyi Egyetemi Könyvtár (PEK) a CULTURE 2000 európai prog- ram keretében vállalta a web archiválási módsze- reinek, szempontjainak kidolgozását. Ezzel egyide- jűleg Szlovákiában is megkezdték a web minőségi és mennyiségi felmérését, a szlovák nemzeti doménnel rendelkező weboldalak feltérképezését.

2006. májusi adatok szerint a szlovák nemzeti domén – .sk – keretében összesen 92 ezer domén- nevet regisztrált mintegy 46 961 felhasználó.

A kísérleti projekt

2006 áprilisában a PEK-ben kísérleti projekt indult azzal a céllal, hogy összegyűjtsék az ISSN-nel rendelkező webforrásokat. (A szlovák weben 260 olyan forrás található, amelynek van ISSN-je, ezek közül 164 csak elektronikus formában létezik.) A kiválasztott webforrások archiválására viszonylag szerény hardverfeltételek szolgálnak (Intel Pentium 4-es számítógép, 3 GHz-ces proceszorral és 2 GB

RAM-mal, 100 Mbit/s-os internetes kapcsolat). A használt szoftverek nyílt forráskódúak (a rendszer- hátteret a Debian GNU/Linux szolgáltatja). Az ar- chivált webes dokumentumok indexelését és re- konstrukcióját a NutchWAX

(http://archive-

access.sourceforge.net/projects/nutch) és a Wera (http://archive-

access.sourceforge.net/projects/wera) végzi. A projekt keretében 34,5 GB-nyi forrást archiváltak, a legkisebb 45 KB, a legnagyobb 5,3 GB. A források formátumai között hatalmas előnnyel vezet a HTML (68,5%), a JPEG formátum aránya 12,2 %, az összes többi megoszlik a további formátumok között (GIF, PDF, TEXT, DOC stb.). A HTML elő- nye valószínűleg annak tudható be, hogy a forrá- sok többsége saját webcímmel rendelkező cikkek- ből épül fel, valamint a stíluslapok (CSS-ek) hasz- nálatával egységes dizájn alakítható ki.

A képi formátumok között egyértelműen a JPEG a legnépszerűbb. A csekély számú (0,04%) multi- médiás forrás között legnagyobb részben video/x- ms-asf (54,8 %) és audio/mpeg formátumúak (14,4

%) fordulnak elő. A folyóiratok online publikálásá- nak kedvelt formátuma a PDF. A tömörítést főképp ZIP-formátumban végzik. Meglepő, hogy egyetlen OpenDocument formátumú forrást sem találtak, jóllehet egy most már a Microsoft által is támoga- tott ISO-szabványról van szó. Ugyanakkor viszony- lag gyakori a javascriptes alkalmazások használa- ta, kevesen (nyolcan) élnek viszont az RSS nyúj- totta lehetőségekkel.

Stratégiai célok

Mindent összevetve a Web Cultural Heritage pro- jekt keretében végzett felmérések eredményeként megfogalmazhatók azok a stratégiai célok, ame- lyek a webes források gyűjtéséhez és őrzéséhez nélkülözhetetlenek:

(2)

Beszámolók, szemlék, referátumok

● az online publikált eredeti elektronikus források köteles példányainak őrzésére, feldolgozására és hozzáférhetővé tételére önálló rendszert kell alakítani a Szlovák Nemzeti Könyvtár és a PEK együttműködésével;

● meg kell oldani az elektronikus források gondo- zásának törvényi hátterét: szükség van a köteles példányokról szóló, a kiadással, a nyomtatással és a szerzői jogokkal kapcsolatos törvényi sza- bályozás módosítására;

● meg kell oldani az elektronikus források hosszú távú őrzési módszereinek a kidolgozását, az idő- szakosan megjelenő elektronikus források azo- nosítására, a nemzeti ISSN Iroda segítségével;

● szervezeti és technikai feltételeket kell kidolgozni a nemzeti domén keretében publikált elektroni- kus források rendszeres gyűjtésére, archiválásá- ra, webarchívum megvalósítására;

● szakmai irányító központ kialakítása a PEK-ben az online hozzáférésű elektronikus források ar- chiválására vonatkozó módszerek és kísérletek technikai feltételeinek biztosítására;

● szervezeti és adminisztrációs feltételeket kell teremteni a közgyűjtemények, kiadók és szerzői jogok tulajdonosai közötti kooperáció összehan- golására.

Ezeknek a céloknak a megvalósítása megoldhatja a weben hozzáférhető elektronikus források gyűj- tésének és archiválásának törvényi, szervezeti és technikai feltételeit.

/ANDROVIČ, Alojz: Web-archive made in Slovakia:

Pilotní projekt zberu a archivácie elektronických informačných prameňov. = ITlib, 3. sz. 2006. p. 38–

41./

(Prókai Margit)

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

1996-tól, az országos felsőoktatási hálózat (ULAKBÍM) létrehozásától kezdve, az elektronikus információforrások közvetítését tekintik egyik el­..

tó rendszerek iránt a könyvtárak is érdeklődni kezdtek, így az ügynökségek első számítógépes termékei ezek a rendszerek

Végül pedig olyan megoldást kell majd találni, hogy a szellemi tulajdon és a könyvtárhasználat érdeke egyaránt tekintetbe vétessék. /BILINSKI, Lucjan: Czy direktywa 92 moze byc

Erősen specializált kutatási folyóiratok (1-2 kutató használatában) Specializált kutatási folyóiratok (6-12 kutató rendszeres, további kutatók kevésbé..

Ez úgy néz ki, hogy a könyvtár szerverén egy olyan interaktív formát helyeztek el, amelybe minden érdekelt beviheti az internetforrás leírását abból a célból,

sítenek (a szóródást is felfogva teljes áttekintést adnak egy-egy tudományág terméséről, biztosítják a retrospektív keresést, részben áthidalják a nyelvi

Az EDIL (Electronic Document Interchange between Libraries = Elektronikus dokumentumcsere könyv­.. tárak között)

Ezek 90%-a web-hely, 78%-a könyvtári katalógus, 76%-a elektronikus referensz segédlet, 61%-a elektronikus szótár, 59%-a elektronikus folyóirat, 51%-a elektronikus könyv,