• Nem Talált Eredményt

Malinvaud, E.: Nagytömegű egyedi adatok statisztikai értékelése

N/A
N/A
Protected

Academic year: 2022

Ossza meg "Malinvaud, E.: Nagytömegű egyedi adatok statisztikai értékelése"

Copied!
3
0
0

Teljes szövegt

(1)

210 STATISZTIKAI lRODALMl FIGYELÓ

További ínformációforrásowk az ún. szinteti- kus tanulmányok. Ezek lényegében másodla—

gos információforrások további olyan feldol- gozásai, amelyek egy többé—kevésbé széles témakörön belül a rendelkezésre álló biblio- gráfiákat és tartalmi összefoglalókat könyv vagy tanulmány formájában dolgozzák fel (a tanulmány ebben a vonatkozásban is bősé-

ges példatárral szolgál).

A legnehezebb problémát kétségkívül az ún. ,.földalatti szakirodalom" jelenti a doku- mentátor számára. Ebbe a kategóriába so—

rolhatók egyrészt a korlátozott példányszám- ban megjelenő különböző publikációk, más- részt a nehezen hozzáférhető kiadványok:

belső jelentések. konferenciaanyogok, kutatá- si zárójelentések, doktori és egyéb tudomá- nyos értekezések, előadások anyagai.

A dokumentációs problémák általános megoldása szempontjából rendkívül nagy re- ményeket ébresztett a dokumentációs fel- adatok számítógép segítségével történő meg- oldása. Ezek a remények azonban mind ez ideig nem váltak valóra. Az automatikus do- kumentáció kérdését több szakmunka tár- gyalja. A feladat egyrészt az információk automatikus tárolásában, másrészt automati- kus mechanizmus segítségével történő vissza- keresésében áll. Az információk automatikus rögzítésének magában kell foglalnia a szer- nevét. a címét, legfontosabb biblio- gráfiai vonatkozásait, ezenkívül bizonyos kulcsszavakat vagy kulcsmondatokat. amelyek a mű tartalmát tükrözik. A tárolás rendsze- rint mágneses szalagon történik. A visszake- resést hasonlóképpen kulcsszavak vagy ,,pro—

fil" alkalmazásával végzik, amikor is az a cél, hogy eredményül pontos és viszonylag teljes dokumentációs anyagot kapjunk. A visszakeresés történhet alkalomszerűen vagy rendszeresen is. Sajnos, viszonylag kevesen fordulnak automatikus visszakereséshez, ami az egyes tudományos körök túlságos tradi- cionalizmusára és individualizmusára utal.

Egyesek úgy gondolják: a dokumentáció feladatait úgy lehetne egyszerűsíteni, ha a publik'álást szorítanák meg olyan értelemben, hogy eleve csak összefoglaló jel—legű tanul—

mányokat, kutatói eredményeket, számadato—

kat közlő cikkeket jelentetnének meg, s a részletkutatások eredményeit — gépelt vagy egyéb formában -— csak a legszűkebb ér- deklődési kör számára tennék hozzáférhető- vé. Ez aligha hozhat megoldást.

A szerző szerint a jelenlegi helyzetben még mindig a kartonok segítségével történő egye- di nyilvántartások vezetése és többé-kevésbé egyéni osztályozási rendszerek alkalmazása a domináns. Azonban itt is szükség van a munka javítására: a folyóiratok, szemlék, publikációk gondosabb megválogatásá'ra, a rezümék szelektálására. a munka szabványo- sítására (főleg a címleírás területén); több

idegen nyelvű bibliográfia és tartalmi kivo- nat publikációjára, kulcsszavak fokozottabb használatára stb. A szabványosított nyilván- tartási rendszeren túlmenően készülhetnek — az érdeklődési területnek megfelelően — kü- lönböző összefoglalások is. Mindenesetre ajánlatos, hogy biztosítva legyen a különbö—

ző elvek alapján készülő dokumentációs anyagok közötti összeköttetés, nem utolsósor—

ban csereanyagok, fényképmásolatok küldé- se útján. A továbbiakban sor kerülhet közös osztályozási rendszerek kialakítására is. Aján- latos továbbá a nyilvántartási rendszernek lyukkártyára vagy mágnesszalagra (mágnes- lemezre) való vitele is. Ezt nagymértékben megkönnyíti az, ha már a publikáció során (szómanyagot tartalmazó táblázatok eseté- ben, irodalomjegyzékeknél) egységes elvek szerint járnak el. Erre vonatkozólag a Nem- zetközi Statisztikai intézet bizonyára hasznos ajánlásokat tehetne, hiszen már a múltban is nagy figyelmet szentelt a dokumentációs

problémáknak.

(lsm. : Nyáry Zsigmond)

MALINVAUD. E.:

NAGYTOMEGO EGYEDI ADATOK STATISZTlKAl ÉRTÉKELÉSE

(Les grands échantillons de données individueIles et leur exploitation statistiaue.) Journal de la So—

ciété de Statistígue de Paris. 1977. 1. sz. 1—15. p.

A népszámlálások és egyéb széles körű adatgyűjtések nagytömegű adatbázist ered- ményeznek. Az ilyen jellegű adatgyűjtések módja hosszú idő óta nem változott lényege- sen. A kérdésfeltevés módját mindenkor meg—

határozta, hogy az ne váltson ki ellenérzést a megkérdezettből. s a jó fogadtatásnak mindenkor előfeltétele volt, hogy a kikérde—

zés ne tartson hosszú ideig, a pontos vála- szokat pedig mindig az egyszerűen megfo- galmazott kérdések biztosították legjobban.

A technika fejlődése azonban nagymérték—

ben megváltoztatta a nagymintájú adatgyűj—

tések feldolgozásának módját. A gépi adat- feldolgozás nemcsak munkamegtakarítást eredményez, nemcsak rövidebb idő alatt biz—

tosítja az egyedi adatok összesítését, hanem olyan kombinációs feldolgozásokra nyújt le- hetőséget, amilyenekre korábban nem volt mód.

A közigazgatási szervezet, az állami, a

pénzügyi és a szociális intézmények úgyszini tén nagytömegű információ birtokában van- nak. Kézenfekvő, hogy ezek a nyilvántartó- sok lényegesen olcsóbb adatforrások, mint a külön szervezett adatgyűjtések. Azzal azon- kban tisztában kell lenni, hogy a statisztika sajátos szempontjai ily módon kevéssé érvé- nyesíthetők. Nehézségek jelentkezhetnek még

(2)

STATISZTIKAI lRODALMl FIGYELÓ

2i1

akkor is, ha az adminisztrációs célokra szol—

gáló információk gyűjtéséne'l megpróbálták előzetesen egyeztetni az érdekeltek igényeit.

A statisztikus ugyanis nincs jelen az adat- gyűjtés pillanatában, s az esetleges pontat- lanságok utólagos tisztázására _már nincs le—

hetősége.

A nagyszámú adat önmagában véve biz—

tonságot ad a következtetések levonásánál.

200 adatból bizonyos kapcsolatok esetleg még nem rajzolódtak ki határozottan, illetve megbízhatóan. Egy tízezres adathalmaz alap—

ján viszont akkor is határozottabb következ- tetés vonható le. ha a korrelációs koefficiens

meglehetősen alacsony.

Az adatok kiaknázásának célravezető mód- ja, ha bizonyos feltételezéseket eleve felállí—

tunk, s elképzeléseinket az adatokkal ellen—

őrizzük. Egyes statisztikusok kétkedéssel fo- gadnak minden előzetes hipotézist. Hatáso- sabbnak és kevésbé önkényesnek tartják az olyan klasszikus módszereket, mint a regresz- szió—számítás és a varianciaanalízis. Kétség- telen, hogy ma már vannak olyan módszerek, amelyekkel kiválasztható a szóban forgó problémának leginkább megfelelő vizsgálati eljárás. Az olyan vizsgálatok számára azon- ban, amelyekre a hagyományos módszereket kialakították, nincs olyan hatásos módszer, amely teljesen kiküszöbölné az a priori fel- tételezéseket. A sokak által javasolt és két—

ségtelenül elsőrendű vizsgálati módszer, a faktoranalízis, úgyszintén előzetes meggondo- lásokból indul ki: el kell kerülni az egymás—

sal korrelált változók egyidejű bekapcsolását, óvakodni kell a nyilvánvaló kapcsolatok fi—

gyelembevételétől, amelyek hamis színben tüntetik fel a vizsgált jelenségeket, végül pe—

dig korlátozni kell a változók számát, külön—

ben a módszer nehézkessé válik.

Az a priori elképzelések hatásának csök—

kentése érdekében legjobb eljárásnak az ál- talánostól a speciális felé való közelítés tű- nik. Az adatok eloszlásának vizsgálatánál először az összlakossági és az egyes lakos- ságcsoportok elemzését kell elvégezni. Ebben a stádiumban nagy jelentősége van a faktor- analízísnek. Ugyancsak hatásos a kiugró ér- tékek kikapcsolása. Ezzel a módszerrel kikü- szöbölhető a kérdőívek kitöltésénél jelentke- ző félreértések egy része, főként azok, ame—

lyek a nem megfelelő mennyiségi egység használatából adódnak.

Egyes matematikusok tanulmányozták. hogy a kiugró értékek kiküszöbölésének szokásos, többé—kevésbé automatikus módszere helyett milyen más módszereket lehetne alkalmazni.

Megkísérewlték meghatározni a különböző szóban forgó eljárások sajátosságait azokban az esetekben, amikor a véletlen tényezők már nem goussi jellegűek, amikor például elnyújtottabb az eloszlásuk. Azt találták, hogy a használatOs módszerek nem adnak

7.

sokkal ,,durvább" eredményt, mint a vizsgált különböző módszerek. Igy az elmélet igazolt egy olyan régóta használatos gyakorlatot, amit a statisztikusok —- szubjektív tulajdonsá—

gatoi félve — csak fenntartással mertek al- kalmazni.

Az elemzések logikai sorrendjének kialakí- tasánál célszerű a következő eljárást végig-

kísérni.

—- Egy H általános modell keretein belül először egy Hg C H hipotézis kerül igazolásra; ha ezt el- vetjük, H specifikációja e külön hipotézis figyelem—

bevétele nélkül történik, hacsak Ho specifikációja becsléssel nem lehetséges. Itt jelentkezik az a kérdés is, hogy milyen szignifikanciaküszöb megfelelő az elő- zetes próbánál ahhoz, hogy a becslés a lehető leg—

hatékonyabb legyen.

-— Az általános modellt úgy kell tekinteni. mint H, és H; unióját. A kettő közül először azt választjuk, amelyik jobban illeszkedik, azután becsülünk.

- Vegyünk egy . . . Hn4_1DHn_1DHn . . . egy- máshoz kapcsolódó hipotézissort, majd el kell ha- tározni, hogy az adatokat figyelembe véve melyik hipotézist tartjuk meg. A kérdés tehát itt úgy merül fel. hogy a hipotéziseket csökkenő (az óltalánosbói a iegspeciáiisabbig) vagy növekvő sorrendben ve- gyük-e figyelembe. és milyen küszöböt fogadjunk el az egyes hipotéziseknél.

A két- vagy háromváltozós modellek kidol- gozásánál a statisztikusok sokszor nem veszik figyelembe az adatok jellegétől függő sajá- tos zavaró hatásokat. A cél inkább az ado- tok összességénél jelentkező kapcsolatok számszerűsítése. Leginkább két módszer hasz- nálatos: az egyik az alapvető kategóriákon belüli adatok eloszlását, a másik az egyes kategóriák átlagának eloszlását veszi figye- lembe. A legjobb módszer — ha van egyál- talán ilyen —- összekapcsolja az előbb emlí- tett két eljárást, de ez a módszer azoktól a hipotézisektől függ, amelyeket a modell a sajátos hatásokat illetően tartalmaz.

Egy véletlen tényezőket tartalmazó modell felállításánál természetesen nem kívánjuk megbecsülni az egyes adatoknál jelentkező véletlen tényező nagyságát. Csak az adatok összességénél adódó átlagos érték meghatá—

rozása a cél, s kiegészítésképpen a vélet—

len tényező szórása. Elképzelhető, hogy a használatos regressziós módszerekkel jól be—

csülhető a tényező átlagos nagysága, viszont a használatos módszerekkel számított normá- lis eloszlástól való eltérés feltételezhetően túlságosan kedvezőnek tünteti fel az elért pontosságot. Nagyon óvatosan kell értékelni a nagyszámú egyedi adat klasszikus elemzése során mutatkozó gyenge noxrmáleltéréseket.

A klasszikus többszörös regressziós modell mellett a matematikai statisztika és az öko—

nometría már régóta tanulmányoz két másik általános modellt. Az egyik az olyan több—

egyenletes modell, amelynek koefficiensei olyan korlátokhoz vannak kötve. amelyek ki—

fejezik a vizsgált jelenség struktúráját, a má- sik az olyan modell, amely lineáris kapcsola- tot tételez fel a hibával terhelt változók kö—

(3)

212 STATISZTIKAI lRODALMl FIGYELÖ

zött. Ez utóbbi egyébként kevéssé használa—

tos, mert identifikálása vagy a hibák vari- ancía-kovariancía matrixának információján alapszik vagy olyan eszközváltozók ismeretén, amelyek kapcsolatosak a modell adataival, de nincsenek kapcsolatban a megfigyelés hibáival.

Az egyedi adatoknál alkalmazott speci- fikálások így kimutatják azokat az eseteket, amelyekben csak az adatok egy részénél kell jelentős megfigyelési hibával számolni. és ahol ugyanakkor néhány elég egyszerű esz- közváltozó is található. A modellnek azonban legtöbbször olyan sajátosságai vannak, ame—

lyek megszokottak a tö'bbegyenletes model- lekben. Tehát olyan becslési módszereket kell alkalmazni, amelyek figyelembe veszik egy—

részt a szimultán egyenletekhez, másrészt a változók hibájára kidolgozott eljárásokat.

Ezek a számítások komplexek, de a jelenleg rendelkezésre álló eszközökkel megvalósítha- tók.

(Ism.: Nádas Magdolna)

SOBOTSCHlNSKl. A.:

STATISZTIKAI—MÓDSZERTANI ESZKÓZTÁR A GAZDASAG STRUKTÚRAVALTOZÁSAlNAK

MÉRESEHEZ

(Methodisch-statistísches lnstrumentarium zur Er- fassung des Strukturwandeis der Wirtschaft.) -—- All—

gemeines Statistisches Archiv. 1977. 1. sz. 43—55. p.

A gazdasági struktúraváltozások megfigye- lésének feltételei az utóbbi 5—10 évben több szempontból is lényegesen megváltoztak. A probléma közgazdasági vetülete a gazdasági folyamatok értelmezési körének kibővülése.

Míg korábban többnyire csak a makroökonó- miai szemléletű növekedésvizsgálatok álltak az érdeklődés középpontjában, addig ma már teret kapnak a gazdasági környezet problé- mái is: az újra nem termelhető természeti javak tartalékainak kezelése, a gazdasági folyamatok nem kívánatos mellékhatásai. Ez utóbbiak elhárításához szükséges egyre növekedő költségek ugyanis nem a vál—

lalatokat, hanem —- valamilyen formában — a közösséget terhelik. A népesedésstatiszti- kának növekedési modellek helyett a stag—

nálás vagy csökkenés kérdésével kell foglal—

koznia. amely — a korcsoportok súlyának vál—

tozásával együtt — hátrányosan érinti a mun- kaerőkínálatot, 'befolyásolja a munkahe- lyek, a kiképzendő tanulók s végső soron a fogyasztók számát is. A külgazdasági kap- csolatokat illetően a nyersanyag— és energia- problémák kiéleződése teremtett új feltétele-

ket.

A szerző nem bocsátkozik annak részletes vizsgálatába, hogy a változó gazdasági fel—

tételek statisztikai részről milyen új kérdés—

feltevéseket igényelnek. Cikkében azt mutat-

ja be, hogy milyen statisztikai rendszer áll rendelkezésre egyrészt az adott gazdasági struktúra, másrészt hosszú és középtávú vál—

tozásainak bemutatására, s végül milyen ösz- szefüggések tárhatók fel a struktúra és a rö- vid távú gazdasági eredmények között.

E követelményeknek az ipari termelőegy- ségek (Produzierendes Gewerbe) — jelenleg átalakítás alatt álló - statisztikai megfigye- lési rendszere még csak részben tud megfe—

lelni. Az átalakításnak éppen az a célja, hogy

— belátható időn belül — mind a hosszú, mind a rövid távú statisztikai megfigyeléseket egységes koncepció szerint végezzék. Az alap- tevékenységük szerint az iparba, az építő—

iparba stb. tartozó vállalatok valamennyi részlegét egységes elveknek megfelelően fif gyelik meg, amelyek alapján mód nyílik a részadatok különböző vizsgálati célok szerinti átcsoportosítására. Megfigyelési egységül a vállalatok, illetve az adott szakmához tarto-

zó vállalatrészek szolgálnak, míg a területi megfigyelések üzemekre és az adott szakmó- hoz tartozó űzemrészekre irányulnak. (Az em- lített eljárások részletesebb ismertetését lásd a szerző ,,Az iparstatisztika új rendszere" cí—

mű cikkében, melynek ismertetése a Statiszti- kai Szemle 1977. évi 64 számában jelent meg.) A vállalatok közötti kapcsolatok megfigye- lése kívül esik a hivatalos statisztika körén, ami lényegesen szűkíti a gazdaságistruktúra- vizsgálatok lehetőségeit. További korlátot je—

lent, hogy a megfigyelések csak a tipikus vál- lalati tevékenységekre terjednek ki. s nem ölelik fel a bankkapcsolatokat sem, bár ezek vizsgálata nagy jelentőségű lenne, példáula hosszú távú beruházási tervek és az azokat megalapozó döntési motívumok ismerete szempontjából.

A teljes gazdaság struktúrájáról (beleért- ve a nem termelő jellegű szervezeteket is) a munkahely-összeírások szolgáltatnak átfogó adatokat. A tízévenként (legközelebb 1981- ben) esedékes adatfelvétel keretében -— a mezőgazdaságtól eltekintve -— valamennyi gazdasági egység (vállalatok és munkahelye- ik) alaptevékenységéről, foglalkoztatottaik számáról és béréről, a jövőben pedig a vál- lalatok értékesítéseiről is gyűjtenek adatokat.

A regionális vizsgálatoknak ez a legfontosabb

adatforrása. ,

A munkahely-összeírás ezenkívül tájékozta- tást nyújt a több munkahellyel (teleppel) ren- delkező vállalatok szakmai tagozódásáról: ez alapján határolhatók el a ,,homogén", illet- ve ,,heterogén" tevékenységű vállalatok. Szé—

les körben használják az így nyert adatokat koncentrációs vizsgálatok céljaira is, vállalati és területi szinten egyaránt.

Az éves vagy ennél gyakoribb iparstatiszti- kai megfigyelések közül a struktúravizsgálatok szempontjából az alábbiaknak van elsődle- ges jelentősége.

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

hogy mindazok, akik kellő fel- készültség nélkül a statisztikai adatok egyszerű le- közlése'n túlmenőleg azok alapján kombinatív jel legű számításokat végeznek,

A könyv nagy részét kitöltő reprezentatív jel- legű statisztikai eredményekből kitűnik, hogy nem- csak az üdülők és a munkaadók, hanem az OTI érdeke is a

A könyv nagy részét kitöltő reprezentatív jel- legű statisztikai eredményekből kitűnik, hogy nem- csak az üdülők és a munkaadók, hanem az OTI érdeke is a

A könyv nagy részét kitöltő reprezentatív jel- legű statisztikai eredményekből kitűnik, hogy nem- csak az üdülők és a munkaadók, hanem az OTI érdeke is a

Még csak fél hat, és teljesen beborult, lebbenti szárnyával az utcát a hegyen lelt Éliás, a vizet, s mindent, ami mozdul, mintha csendesebb lenne a zörgés, mondja Tandori Dezső

Az összefüggések újrarendezett struktúrája ugyanakkor nem biztosíték, sokkal inkább lehetőség – „a reggel úgyis a minden/ átértelmezéséről szól”

[r]

Talán csak a kialvatlanság, talán csak az uszoda klóros vize, talán a monitor, talán a városi levegő, talán valami idáig fel nem ismert allergia égeti a szemem ma, amikor