A COVID járvánnyal
kapcsolatos webarchiválási tevékenységek – nemzetközi
és hazai körkép
Németh Márton
Országos Széchényi Könyvtár Webarchiválási Osztály
Networkshop Konferencia, 2021. április 9.
Az előadás vázlata
A webarchívumról és az aratástípusokról
A COVID-gyűjtemény alapgondolata
A címlista összeállítása
Címkék, rovatok szerepe
Határontúli címek gyűjtése
Adatok a gyűjteményről, az aratások ütemezése
A közösségi média archiválásának problémái
A minőségellenőrzés hiánya
Hozzáférés, szerzői jogi korlátok
Az IIPC gyűjtemény
Néhány más nemzeti modell
Aratástípusok
Webtér szintű
Tematikus
Műfaji
Intézményi
Esemény alapú
Címlista összeállítása
A seed-lista nyilvánosan is
elérhető a webarchívum
honlapján.
A címkehasználat szerepe
A konzekvens címkerendszer
hatékonyabb archiválást tesz lehetővé.
Archivált webhely, illetve webhelyrész
Határontúli címek
Hivatalos tájékoztató oldalak magyarul
Egyéb magyar nyelvű tartalmak
Adatok a gyűjteményről
129 seed cím
56 aratás
435 GB összméret
933 db WARC fájl
A közösségi média archiválási problémái
Archiválási nehézségek
Megjelenítési hibák
Félrevezető dátum kijelzés
Nem automatizálható
A minőségbiztosítás hiánya
A hibásan archivált webhelyeket más beállításokkal vagy más szoftverrel újra
kellene menteni.
Hozzáférés, szerzői jogi korlátok
IIPC Covid-19 gyűjtemény
Az IIPC gyűjtemény az Archive-It felületén
Az IIPC gyűjtemény tervezett
adatbányászati célú hasznosítása
Más nemzeti Covid-webarchívumok
https://cc.au.dk/en/warcnet/warcnet-papers