• Nem Talált Eredményt

A Petőfi Irodalmi Múzeum személynév állományának egységesítése és szűrése

N/A
N/A
Protected

Academic year: 2022

Ossza meg "A Petőfi Irodalmi Múzeum személynév állományának egységesítése és szűrése"

Copied!
24
0
0

Teljes szövegt

(1)

A Petőfi Irodalmi Múzeum személynév állományának egységesítése és szűrése

Hozzájárulás az NDA névtér projectjéhez

Networkshop 2008

Dunaújváros

Kómár Éva – Lengyel Mónika – Simon András

(2)

A Petőfi Irodalmi Múzeum szolgáltatásai

Életrajzi típusú adatbázisok – történetük, gyűjtőkörük

A HunTéka múzeumi alkalmazása

Névállomány szűrése és egységesítésének problematikája

Az egységesítés elméleti előkészítése

Az egységesítés végrehajtása – authority controll Miről lesz szó?

Networkshop – 2008 Dunaújváros

(3)

A Múzeum

Gyűjtőköre

Magyar irodalom tárgyi, képi, kéziratos, nyomtatott és hangzó dokumentumainak gyűjtése

Feladata

A muzeológiai forrásanyag felkutatása, gyűjtése, őrzése, feldolgozása, szolgáltatása és bemutatása kiállításokon

Háttérkutatások

A gyűjteményi feldolgozáson és szolgáltatáson túlmutató tudományos feltáró munka eredménye az alapkutatási adatbázisok

A Petőfi Irodalmi Múzeum szolgáltatásai

Networkshop – 2008 Dunaújváros

(4)

Magyar életrajzi index

Magyar emigráns írók és műveik

Magyar írók sírjai

Francia becsületrend magyar kitüntetettjei

Diplomások adattára

Kortárs magyar írók adattára

Magyar főnemesség genealógiája

Magyar családtörténeti adattár

Díjak és díjazottak

Életrajzi típusú adatbázisok – történetük, gyűjtőkörük 1.

Networkshop – 2008 Dunaújváros

(5)

Magyar életrajzi index

Networkshop – 2008 Dunaújváros

Életrajzi típusú adatbázisok – történetük, gyűjtőkörük 2.

(6)

Magyar emigráns írók és műveik

Networkshop – 2008 Dunaújváros

Életrajzi típusú adatbázisok – történetük, gyűjtőkörük 3.

(7)

Magyar családtörténeti adattár

Networkshop – 2008 Dunaújváros

Életrajzi típusú adatbázisok – történetük, gyűjtőkörük 4.

(8)

Az átállás indokai

Elavult technológia: Access

Az adatbázisok elszigeteltségének megszüntetése

Konklúzió

Egységes múzeumi és könyvtári integrált rendszer létrehozása, bevezetése

Networkshop – 2008 Dunaújváros

A HunTéka múzeumi alkalmazása 1.

(9)

Access – HunTéka konverzió specifikálása

HunMARC megfeleltetés

Szabványos elemeknél részletesebb adatkör

900-as mezőtartomány felhasználása A HunTéka múzeumi alkalmazása 2.

Networkshop – 2008 Dunaújváros

(10)

A HunTéka múzeumi alkalmazása 3.

Példák

Networkshop – 2008 Dunaújváros

(11)

A HunTéka múzeumi alkalmazása 4.

900-as mezőtartomány felhasználása

Networkshop – 2008 Dunaújváros

(12)

Névállomány szűrése és egységesítésének problematikája 1.

Több mint 600.000 név besorolási rekord

A különböző forrásokból érkező eltérő tartalmú rekordok egyaránt megtartandó adatokat

hordoznak

Egyes esetekben a megkülönböztetést szolgáló kiegészítő adatelemek a redundanciát növelik

Networkshop – 2008 Dunaújváros

(13)

Névállomány szűrése és egységesítésének problematikája 2.

Technikailag

háromféleképpen kerülhetett név az authorithy állományba:

Az életrajzi tömbből

A múzeum bibliográfiai adatbázisai felől, ha annak struktúrája miatt törzsadatként kellett kezelni

A bibliográfiai rekordok felől – újként

Networkshop – 2008 Dunaújváros

(14)

Névállomány szűrése és egységesítésének problematikája 3.

(15)

Névállomány szűrése és egységesítésének problematikája 4.

A személynév besorolási rekordok alapfunkciói:

A személy kizárólagos azonosítása

Személy kereshetősége

Szabványosság

Ellenőrzés biztosítása

Networkshop – 2008 Dunaújváros

(16)

Egységesítés elméleti alapjai

Eminens rekord fogalma:

Ugyanazon természetes személyt leíró rekordok közül a hitelesnek elfogadott

Alapmezők és járulékos mezők:

alapmező: név és születési dátum (100$a$j$d)

járulékos mező: további besorolási és kapcsolódó bibliográfiai adatok (6xx, 9xx)

Networkshop – 2008 Dunaújváros

(17)

Normalizált alakok előállítása:

Keresztnevek (helyesírás, gépelési hibák)

eltérő írásmódok kiküszöbölése

dátum értékek ellenőrzése

Networkshop – 2008 Dunaújváros

Előmunkálatok

(18)

Rekordok értékelése

év szerint

1: Arany Bálint 1854-1943

2: Nagy József 1965-

3: Schőner Dezső -1945

4: Szabó Ödön -198?

5: Frankenburg Adolf 1911-1884

járulékos mezőkkel való kitöltöttség és adathelyesség szerint

Networkshop – 2008 Dunaújváros

(19)

Egyesítés - behasonlítás

Azonos rekordok kiválasztása:

Varga | Jenő | 1878- | 1878 | | PPT Varga | Jenő | 1879-1964 | 1879 | 1964 | KAU Varga | Jenő | 1879-1964 | 1879 | 1964 | INT Varga | Jenő | 1879-1964 | 1879 | 1964 | INE Varga | Jenő | 1879-1964.| 1879 | 1964 | LNT Varga | Jenő | 1880- | 1880 | | PPT Varga | Jenő | 1882- | 1882 | | PPT Varga | Jenő | 1882- | 1882 | | PPT Varga | Jenő | 1883-1964 | 1883 | 1964 | INT Varga | Jenő | 1893. k. -| 1893 | | INT Varga | Jenő | 1895-1965 | 1895 | 1965 | INT Varga | Jenő | 1910- | 1910 | | PPT Varga | Jenő | 1941-1999 | 1941 | 1999 | INT Varga | Jenő | -1971 | | 1971 | INE Varga | Jenő | 1974- | 1974 | | PPT Varga | Jenő | -1986 | | 1986 | INE Varga | Jenő | -1989 | | 1989 | INE Networkshop – 2008 Dunaújváros

(20)

Egyesítés – kiegészítő tartalom – „határok”

Járulékos mezők, és adathelyesség

090 __ a PPT 090 __ a INE 100 __ a Varga 100 __ a Varga

j Jenő j Jenő

d 1910- d -1989

900 __ a 1910. 667 __ a gépészmérnök 902 __ a Fiume 905 __ a 1989. I. 19 924 __ a 1933 906 __ a Bp.?

o diploma éve 909 __ a 79

925 __ a JME 943 __ a MN 1989. febr. 16 926 __ a Gépészmérnök

Networkshop – 2008 Dunaújváros

(21)

Eminens rekordok megjelölése 1.

Osztályozás [1..5]

Forrás adatbázisok prioritás listája alapján

A 6xx, 9xx mezőkkel gazdagabban kitöltött

Sorrendben előbb lévő

Időanomália kezelése

Networkshop – 2008 Dunaújváros

(22)

Eminens rekordok megjelölése 2.

Mechanikus szűrés

Tökéletes egyezés esetén

Intelligens szűrés

Kapcsolódó művek kiadási dátuma

Névadatbázison belüli utalók (400, 500) alapján

Networkshop – 2008 Dunaújváros

(23)

Besorolási rekordok fizikai összeolvasztása

Automatizálható folyamatok

A járulékos mezők meghatározott algoritmus szerinti felül-, illetve melléírása

Ismétlődő tartalmak szelektálása

Bibliográfiai rekordkapcsolatok összevonása

Kézi beavatkozást igénylő munka

Családfa adatbázisokból származó rekordok

Networkshop – 2008 Dunaújváros

(24)

Összegzés

A célkitűzés és megvalósulása

NEM az emberi munka teljes kizárása

A szellemi munka folyamatának gépi egységekre bontása

A 600.000 átfésülendő rekord néhány ezerre való lecsökkentése

Networkshop – 2008 Dunaújváros

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

zeum, 1975; Uő, Magyar irodalmi folyóiratok, K–M, Bp., Petőfi Irodalmi Múzeum, 1977; Uő, Magyar irodalmi folyóiratok, Ma Este–Magyar Szemle, Bp., Petőfi Irodalmi Múzeum,

(A Petőfi Irodalmi Múzeum bibi. 4.) Kenyeres Zoltán: Gondolkodó irodalom.. Kocsis Rózsa: Igen és nem. A magyar avantgárd szín- játék története. Konrádyné Gálos Magda: Költői

kötethez csatolt idézet azt világítja meg, hogy milyen szellemben szerkesztette e heterogén sorozat magyar köteteit: „A nemzeti gyűlölködés nagy terebély fává nőhet

október 30-án nyílt meg a Petőfi Irodalmi Múzeum újonnan indított, a magyar irodalom történetét bemutató sorozatának első kiállítása, amely azt a hatalmas feladatot

E hosszan érlelődő hiányérzet indíttatta el velünk 1972-ben „A Petőfi Irodalmi Múzeum Bibliográfiai Füzetei" című sorozatot, amely legalább madártávlatból

Összeállította és a bevezető tanulmányokat írta Kalla Zsuzsa és Ratzky Rita, Budapest, Petőfi Irodalmi Múzeum, 1997, 186 1.. Petőfi

Nemrégiben vásárol- ta meg a Petőfi Irodalmi Múzeum könyvtára Gyulai Pál könyvtárából azt a George Sand- kötetet, a Mauprat-t, melyet Arany János dedikált Petőfi

Tarjányi Esz- ter – akinek ihlető szelleme végigkíséri az egész kiállítást – sajnos már csak egy rövid tanulmánnyal lehet jelen, 28 amely valójában nagy