• Nem Talált Eredményt

Az adatbázisok pontossága. Egy felmérés eredményei megtekintése

N/A
N/A
Protected

Academic year: 2022

Ossza meg "Az adatbázisok pontossága. Egy felmérés eredményei megtekintése"

Copied!
2
0
0

Teljes szövegt

(1)

• El kell törölni a szabad piac versenyelemét tönkre­

tevő, indokolhatatlan különadókat, amelyek a nem hazai információforrásokat és információkezelő eszközöket terhelik.

Utópia-e a szabad információáramlás ?

A vázolt célok megvalósítása rengeteg időt, pénzt és szellemi befektetést igényel, mindezt nemzetközi szinten. Ugyanakkor magának a feladatnak f e l b e c s ü l ­ hetetlen értéke v a n : amíg ezeket a követeléseket legyőzendő akadályoknak tekintjük, nem nyomhat agyon bennünket a t u d o m á n y o s és műszaki informá­

ciók g i g a n t i k u s tömege. A jelzett területeken gyakran

Beszámolók, szemlék, referátumok

dominálnak a politikai-gazdasági megfontolások.

Egyenrangú partneri viszonyban kell e g y ü t t m ű k ö d ­ nünk a problémák megoldása érdekében, hogy a globális szabad információáramlás ne maradjon meg­

valósíthatatlan utópia.

/ L U C K E N B A C H , Ft.: T h e free flow ot informál ion: a utópia? W a y s to ímprove scientific and technological In­

formation and Its international exchange. = Journal of Chemical Information and Computer S c i e n c e s , 2 B . köt. 2.

s z . 1 9 6 8 . P . 9 4 - 9 9 . /

ÍSzö//ó'sy£vaJ

Az adatbázisok pontossága. Egy felmérés eredményei

A nyugati gazdasági szakemberek és döntéshozók nemcsak belső, hanem külső adatbázisokat is hasz­

nálnak munkájuk, különösen prognóziskészítő tevé­

kenységük közben. Míg az előbbiek paramétereit is­

merik, az utóbbiakét nem. Pedig munkájuk sikere erősen függ ezeknek a külső gazdasági (business) adatbázisoknak a minőségétől, az általuk szolgálta­

tott adatok pontosságától.

Ezért volt indokolt az az adatbázis-szolgáltatók (vendors) körében végzett felmérés, amely a követ­

kezőkre terjedt k i :

• az adatgyűjtési módszerek,

• a gyűjtött adatok típusai,

• az adatokhoz való hozzáférés formátumai,

• az adatok pontosságának ellenőrzési, karban­

tartási módszerei és mások.

A felmérés módszere

A felmérés készítői mindenekelőtt annak f e l ­ derítésére koncentráltak, hogy az adatbázis- szolgáitatók miképpen biztosítják - ellenőrzik, III.

növelik - az adatok pontosságát. Ezért számos változót vizsgáltak. Például: az adatbázis nyers vagy számított adatokat tartalmaz-e; az adatbevitel mikép­

pen és milyen gyakorisággal megy végbe; milyen e l ­ lenőrzési módszerekkel és gyakorisággal élnek a pontosság garantálása érdekében; melyek a hibák elsődleges forrásai; a hibák felfedése után milyen a kiküszöbölés módszere és átfutása.

Az adatbázis-szolgáltatók katalógusaiból össze­

sen 185 olyan szolgáltató szervezetet azonosítottak, amelynek adatai alkalmasak a gazdasági előrejelzés­

re. Ennek a 137 USA-beli és 48 USA-n kívüli szerve­

zetnek küldték ki az imént felsorolt változók iránt érdeklődő kérdőíveket. A kérdőíveket - nemegyszer sürgetésre - a megkeresettek 31%-a juttatta vissza t ö b b é - k e v é s b é érdemi válaszokkal.

Az eredmények

A választ adó szolgáltatók 94%-a forrásadatbáziso­

kat kínál, vagyis olyanokat, amelyek n u m e r i k u s , szöveges-numerikus tényadatokat vagy/és teljes szövegű információkat tartalmaznak. Az adatbázisok zöme tehát mennyiségi prognózisok készítésére használható fel. A szolgáltatók 28%-ának van b i b l i ­ ográfiai adatbázisa (is). Ezeket minőségi és műszaki előrejelzésekre lehet igénybe venni.

A válaszoló szervezetek nagy része kettőnél több adatbázist szolgáltat. Az adatbázisokban a változók (paraméterekl száma 8-tól néhány ezerig terjed; a legtöbb adatbázisban a változók százai kereshetők online módon. A gazdasági adatok között árindexek, részvény-, demográfiai, piaci részesedési, export-, importadatok, továbbá a nemzeti össztermékre, a munkaerő összetételére, a szabadalmakra, véd­

jegyekre stb. vonatkozó adatok találhatók.

A felhasználónak mindenesetre gondosan meg kell vizsgálnia, hogy mely adatbázisok felelnek meg leginkább az igényeinek, mert a változók és a s p e c i ­ fikus adatok száma akkor is módosulhat, ha az adat­

bázis történetesen csak egy bizonyos szakterületet fed le. Fontos felhasználói szempont az is, hogy milyen formában kapja meg az adatokat a szolgáltató­

tól. A prognóziskészítő szempontjából különös jelentősége van annak, hogy mennyire összesített

numerikus adatokat várhat el egy-egy adatbázistól, vagy éppen ellenkezőleg, összesítetlen, nyers adato­

kat kereshet-e benne (ezek regionális vagy helyi szinten többet érnek, mint az összesített adatok).

A válaszolók csaknem háromnegyed része nyers numerikus adatokat kínál. A felmérésbe bevont szolgáltatók 30%-a grafikus információkat is nyújt.

Jól szervezett statisztikákat a szervezetek 58%-a, kész előrejelzéseket pedig 10%-a közöl.

56

(2)

TMT 3 8 . évf. 1 9 9 1 . 1 - 2 . s z .

Az adatok kiválasztási kritériumai között a legfon­

t o s a b b a forrás hozzáférhetősége és megbízhatósá­

ga. Az adatok teljességében az állami (szövetségi) és a vállalati forrásokra való támaszkodás esetén nagyrészt meg lehet bízni, ám a nemzetközi adatok teljességében már korántsem.

Az adatbázis-szolgáltatók 28%-a azonnal beviszi a friss adatokat, 47%-a valamilyen periodikusságú kötegelt adatbevitelt alkalmaz. A bevitel kötegeli módja hátrányosan befolyásolja a naprakészséget, ezért az azonnal "cselekvők" 28%-a meglehetősen kevés. A felhasználónak, különösen ha előrejelzést készít, a kötegelt feldolgozású adatbázisok haszná­

latakor ismernie kell az utolsó aktualizálás időpontját, nehogy "megjárja".

Az adathibák t ú l n y o m ó része átírási/beviteli hiba.

A második legnagyobb hibacsoport a forrás megbíz­

hatatlanságából adódott.

A felmérésben szereplő szolgáltatók csaknem 20%-a nem ellenőrzi adatainak pontosságát (1.

táblázat). A legtöbben nem foglalkoztatnak adatelem­

zőket vagy lektorokat, nem használnak matematikai vagy statisztikus ellenőrzési módszereket sem.

1. táblázat

A pontosság ellenőrzésére alkalmazott módszerek*

Módszer

A válaszolók száma = 4 3 Szám Százalék Nem ellenőrzi a pontosságot 9 18,6 Véletlen mintavételes ellenőrzés 14 3 2 , 5 Primer a d a t f o r r á s v i s s z a k é r d e z é s e 18 4 1 , 9 Teljes adatellenőrzés 13 30,2 Lektor/elemzŐ s z a k e m b e r 2 4,7 M a t e m a t i k a i ö s s z e f ü g g é s e k e t , 1 2,3 szórás számítást alkalmazó ellenőrzési

módszerek

• Számos szervezet t ö b b módszert is alkalmaz.

Ha valamely hibára fény d e r ü l , a szolgáltatók 48%-a alkalmaz átfogó ellenőrzést. 24%-uk azonban ilyenkor sem néz utána rendszeresen az adatok p o n ­ tosságának. A válaszadók 44%-a nem jelentette, milyen gyakran ellenőrzi az adatokat, 14%-a havi vagy ennél ritkább ellenőrzést alkalmaz. A szolgál­

tatók fele, ha kell, azonnal javítja az adatokat, ami leg­

többször 4 8 órán belüli javítást jelent. Tehát nem e l ­ hanyagolható veszély, hogy valamely előrejelzés hibás adatokra é p ü l , különösen akkor, ha valahol két­

hetenként vagy még gyakrabban készítenek modellt vagy prognózist.

A szélsőséges adatok kezelésének módjáról készült felmérés eredményeit mutatja a 2. táblázat. A szélsőséges adatok ugyanis igen nagy problémát

jelentenek az előrejelzésben, mert t ö b b n y i r e érthetet­

lenek, Ml. nehezen magyarázhatók. Az előrejelzés szempontjából az ilyen adatokat úgy kell közölni, a m i ­ lyenek, feltéve, hogy helyességüket ellenőrizték. A többi már a prognóziskészítöre tartozik.

2. táblázat

A szélsőséges adatok kezelésének módszerei

A válaszolók száma = 4 7 Módszer

Szám Százalék Feldolgozás " o l y a n , a m i l y e n " alapon 18 3 8 , 3 Törlés az a d a t o k közül 10 21,3 Statisztikai kiigazítás 15 3 1 , 9 Adatmegerösítés a f o r r á s n á l az azonnali 1 2,1 k o r r e k c i ó é r d e k é b e n

Különféle összetett módszerek 3 6,4

K ö v e t k e z t e t é s e k

A felmérés eredménye számos olyan kérdést vet fel, amely mind a szolgáltatók, mind a felhasználók számára fontos. Az előbbiek számára az adatforrások kiválasztási kritériumaira, a pontosság ellenőrzésére és a szélsőséges adatok kezelésére vonatkozóan kinál megszívlelendő tanulságokat. A szolgáltatók a források megbízhatóságának kiemelkedő fontosságát egyébként meg is értik. A felhasználók szemszögéből sok minden tehető az adatbázisok minőségének javítása érdekében, ha fennáll a k o m m u n i k á c i ó és az együttműködés a szolgáltató és ügyfelei között.

Például e l e k t r o n i k u s üzenetközvetítéssel a felhasz­

náló tudomására lehet hozni az aktualizálások idejét és az adatok kezelésének sajátosságait (szélsőséges adatok kezelését stb.),

A felhasználók — e felmérés tanulságait hasz­

nosítva - még gondosabban járjanak el a szolgál­

tatók által feldolgozott adatforrások értékelésében, az alá- vagy túlbecslés megállapításában. Ez lehetőséget ad a modellkészítőknek arra, hogy meg­

felelő korrekciókat alkalmazzanak.

Az adatbázisok pontosságának további vizsgálatát e felmérés módszerén kívül objektív módszerekkel is tanácsos elvégezni, különösen az olyan jellemző változók esetén, mint amilyenek az árindexek, a demográfiai adatok stb. Az adatbázisok pontossága meghatározó követelmény, mert minden sikeres ter­

vezés, megalapozott gazdasági döntés a helytálló prognózisokon múlik, s ezek pedig a pontos adatszol­

gáltatástól függenek.

/ M A H M O U D , E . - R I C E , G . : D a t a b a s e a c c u r a c y : results from a survey of d a t a b a s e vendors. = Information Management, 1 5 . köt. 5. s z . 1 9 8 8 . p. 2 4 3 - 2 5 0 . /

(Roboz Péter)

57

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

Bár több szempontból hátrányban vagyok elődömmel szemben, az kétségtelen, hogy óriási szakirodalmi anyag gyűlt össze az ötvenes évek (Szabó Lőrinc harmadik

Az, hogy még m a sincs monográfiánk például a népi írók mozgalmáról, vagy el- helyezetten Féja Géza életműve, az csupán a szellemi étet retardáltságát jelzi, ám az,

• Tiszta numerikus adatbázisok (eredeti felmérési és egyéb statisztikai számszerű adatok).. • Vegyes szöveges-numerikus

A vizsgálat eredményeinek értelmezéséhez feltétlenül szükséges hangsúlyoznunk, hogy míg a standard feladatok esetében az 1 pontos teljesítmény azt jelenti, hogy

Najmányi tudott kutatni, mesteri- en szerkesztett, és bár otthon volt a képek világá- ban, nem szimbolizált, dísztelen egyszerűséggel írt. Mondatai nyitott ablakra

Az- által, hogy az „AK-Digikönyvtár” összeköti a könyv- tárost mint professzionális információs szakembert az internet lehet ő ségeivel, a kamara tagjai számá- ra

A második faktor, a vizuális közös figyelmi jelenet tekintetében azt láttuk, hogy szintén fő hatással bír, azaz a palatális alakváltozatot preferálták a résztvevők, ami-

A tudományos és műszaki numerikus adatbázisok nem olyan népszerűek az online keresők körében, mint a gazdasági numerikus adatbázisok. Az utóbbi években azonban ez a