A reprezentatív módszerrel nyert árindex hibájának számítása

(1)

ÉLTETÖ ÖDÖN:

A REPREZENTATTV MÓDSZERREL NYERT ÁRINDEX HIBÁJÁNAK SZÁMíTÁSA

Az utóbbi időben többen is foglalkoztak azokkal a problémákkal, ame—

lyek az árindexszámítás elméleti vizsgálatánál vagy gyakorlati végrehajtá—

sánál felmerültek.1 Ilyen probléma például az, hogy a népgazdaság mely területein lehet árindexet reprezentatív módszerrel számítani, illetve hogyan lehet kiszámítani a nem teljeskörű megfigyelés útján kapott árindex hibá—

ját. Ez utóbbi kérdés megoldása szükségesnek, mutatkozik azért is, mert a legtöbb területen az árindex számítása ténylegesen nem teljeskörű megfi—

gyelés alapján történik, hanem valamilyen reprezentatív módszerrel. Ennek a tanulmánynak a célja az, hogy megmutassa, milyen matematikai problé—

mák merülnek fel az árindexnek reprezentatív módszerrel történő számitá—

sával kapcsolatban, hogyan lehet kiszámítani az ilyen módon megállapított árindex hibáját, egyúttal bizonyos javaslatokat is tartalmaz a mintavétel módjára vonatkozólag.

Jelen tanulmányban nem kívánok azzal a másik kérdéssel foglalkozni, hogy hol és milyen körülmények között lehet árindexet reprezentativ mód—

szerrel számitani. Ennek a tanulmánynak egyrészt nem ez a célja, másrészt ez nemcsak —— sőt elsősorban nem — matematikai probléma. Mindazonáltal véleményem szerint nem lehet vitás, hogy a legtöbb területen lehet ár- indexet számítani nem teljeskörű felvétel alapján, sőt egyes területeken gyakorlatilag megvalósíthatatlan a teljeskörű adatfelvétel. Ha pedig nem az összes szóbajöhető adat alapján számítjuk ki az árindexet, tisztában kell lennünk azzal, hogy az így kiszámított érték nem a pontos árindex, hanem annak csak többé—kevésbé megbízható becslése.2 A probléma éppen az, ho—

gyan lehet a hibát kiszámítani, illetve hogyan lehet meghatározni a minta nagyságát (a reprezentáció mértékét) előre, ha azt akarjuk, hogy a repre—

zentáció alapján számított árindex hibája ne haladjon meg valamilyen előre megadott értéket.

_ 1 Lásd többek között például) dr. Hajpál Gyula: Az árindexek közgazdasági értelmezésének kérdései (Statisztikai Szemle. 1957. évi ti.. sz. SSL—376. old) és Drechsler László: Az árindexek súlyozásának kér—

dései. (Statisztikai Szemle. 1958. évi 7. sz. 617—632. old.) c. cikkét.

* Becslésen itt és a továbbiakban nem a. közgazdasági—statisztikai értelemben használatos szubjektív becslést, illetve közvetett számításokat értem, hanem azt, amit a becslés a matematikai statisz—

tikában jelent. A matematikai statisztikában becslésról akkor beszélnek, ha egy sokaság valamely jellemzőjét nem a sokaság minden elemének ismeretében, hanem reprezentatív minta adatai alapján számítják ki.

Ebben az értelemben a reprezentatív módon számított árindex becslése a teljeskörű megfigyelés útján

kapott árindexnek. ' ' .

14:

(2)

1 48 ÉLTE'DÖl DDON

Mielőtt a probléma pontosabb megfogalmazására rátérnék, néhány megjegyezést szeretnék előrebocsátani.

1. Amikor nem teljeskörű adatfelvétel alapján, hanem reprezentatív módszerrel, illetve nem teljeskörű megfigyelés alapján történik az árindex számítása, a reprezentációnak, a mintába kerülő cikkek, termékek kiválasz—

tásának bizonyos sajátos, másfajta reprezentativ mintáktól eltérő tulajdon—

sága van. Ez a sajátosság abban áll, hogy árindexszámitásnál elsősorban nagyvolumenű (a volument itt forgalmi érték, termelési érték értelemben használom) cikkeket, termékeket célszerű bevenni a megfigyelendő cikkek, termékek csoportjába, azért, hogy azáltal is növeljük becslésünk pontos—

ságát. Ez azt jelenti, hogy ha a szóbanforgó vizsgált alapsokaság N számú cikket, terméket tartalmaz, ezek összforgalmi, illetve termelési értéke E', a megfigyelt minta pedig n terméket tartalmaz, és é forgalmi, illetve terme—

lési értéket képvisel, akkor a %ésí— hányadosok értéke jelentősen eltér

É

egymástól, azaz más a reprezentáció mértéke akkor, ha a kiválasztott cik—

kek, termékek darabszámát tekintjük, s más, ha forgalmi, illetve termelési érték szempontjából nézzük a mintát. Tulajdonképpen forgalmi, illetve ter—

melési érték szempontjából a minta nem lesz a szó eredeti értelme szerint reprezentatív. Mindazonáltal az egyedi árindexek szempontjából ettől még reprezentatív lehet a minta.

2. Talán az árindex reprezentatív módszerrel történő számításának fent emlitett speciális tulajdonságai, valamint a kérdés exakt matematikai tár-—

gyalásának rendkívüli nehézségei a magyarázata annak, hogy a felvetett kérdésekre vonatkozólag sem a hazai, sem a külföldi szakirodalomban nem találtam megfelelő feleletet. Ahol egyáltalában szóba kerül ez a probléma,a ott annyira szimplifikálva és az előbb említett speciális jellegzetességtől el—

vonatkoztatva utal a szerző valamilyen megoldási lehetőségre, hogy az gya—

korlati szempontból nem jöhet szóba, a felvetett kérdésekre ui. feltétlenül hamis feleletet kapnánk. Ezért a probléma megoldására az árindexbecslés speciális tulajdonságait szem előtt tartva új matematikai módszerek kidol—

gozása látszott szükségesnek. Ezen új matematikai eredmények, képletek segítségével véleményem szerint az eddigieknél megfelelőbb megoldást lehet kapni a felvetett problémákra.

3. Mivel az indexszámítás elméletében és gyakorlatában egyaránt több—- féle formula is használatos, önként vetődik fel a kérdés, hogy az alább is—

mertetendő megoldás melyik használata esetén érvényes. Egyszerűség kedvé—

ért (a későbbiekből ki fog derülni miért) a továbbiakban árindexen a Las—

peyres-féle formulát fogom érteni, a képletek arra fognak vonatkozni. Hang—

súlyozni kívánom azonban, hogy az alábbi eredmények értelemszerűen érvényesek a Paasche—féle indexre is. Az eredmények akkor is használhatók, ha az árindexet a két index számtani vagy mértani átlagaként (Fisher—féle index) számítjuk. Igazak ui. a következők:

a) Két szám számtani átlagának hibája egyenlő a két szám hibájának számtani átlagával.4

b) Két szám mértani átlagának relatív hibája nem nagyobb a két szám relatív hibájának számtani átlagánál.

3 Lásd például. B. D. Mudge": Index Numbers. New York. 1931.

4 Ha speciálisan hibán a megbizhatosagi intervallum hosszát értjük. akkor a számtani átlag hibája nagy valószinűséggel kisebb a! két hiba számtani átlagánál.

(3)

A REPREZENTATIV ARINDEX HIBMANAK SZAMITASA

149

így a Laspeyres- és a Paasche—féle index hibájának ismeretében az

átlagolt indexek hibája is meghatározható.

4. A volumenindexek formulájának matematikai alakja hasonló az ár—

index—formulák alakjához, ezért volumenindexek reprezentatív módszerrel történő számításánál a hiba meghatározását illetően matematikai szempont- ból új probléma nem lép fel, tehát az alább ismertetendő és az árindex hibájának meghatározására szolgáló módszerek alkalmazhatók volumen- index

becslésének hibaszámításánál is. Az persze más kérdés, hogy érde- mes-e, 'hol, milyen körülmények között lehet volumenindexet reprezentatív módszerrel számítani. Itt csak a hiba meghatározásának lehetőségét kíván—

tam hangsúlyozni.

5. Végül rá szeretnék mutatni, hogy valamely indexszám több ok miatt is lehet hibás, illetve pontatlan. Okozhat pontatlanságot a nem teljeskörű megfigyelés tényén kívül az alkalmazott index—formula nem megfelelő volta, vagy az a tény is, hogy a bázisidőszak és a megfigyelési időszak alapsokasága csak részben áll ugyanazokból a termékekből, cikkekből. Az alábbiakban az árindexnek csak a mintavételből eredő hibája meghatározásával foglal—

kozom.

*

Tartalmazzon a vizsgált alapsokaság ——-— állhat ez például egy iparág összes termékeiből vagy például a külkereskedelmi forgalomban szereplő összes cikkekből stb. —— N terméket. (N azon termékek, cikkek száma, amelyek mind a bázis—, mind pedig a megfigyelési időszakban szerepeltek az alapsokaságban.) A Laspeyres-formulát alkalmazva az árindexet az,

N

Zpkl gko

kel [ :;

N

EPA-u Gko

lizi

kifejezés adja meg, ahol szokás szerint ka—ek, illetve pko -ek jelentik a meg—

figyelési, illetve bázisidőszakban az árakat, gk., pedig a k—adik termék, illetve cikk volumenét a bázisidőszakban. Ha nem teljeskörű adatfelvételt csinálunk, azaz az alapsokaság N eleme közül csak n—et figyelünk meg, akkor az ár-

indexet az

n

EPM gko

_ R:].

11

2 Pko Gko ke].

kifejezéssel számítjuk. Amíg 1 adott alapsokaság esetén állandó, addig a' valószínűségi változó, értéke ui. attól függ, hogy éppen mely elemeket vet—

tük bele a mintába, azaz az alapsokaság mely termékeire, cikkeire végez- tünk megfigyelést. Ez természetesen minden reprezentáció alapján történő becslésnél így van. Itt a helyzet azért bonyolultabb, mert i olyan való—

színűségi változó, amelyik két valószínűségi változó hányadosa, i kifejezé- sében ui. a számláló is, nevező is külön—külön valószínűségi változók, érté—

kük a mintavételtől függ. Az ilyen típusú, ún. hányados—becslések matema—

(4)

1 50 , anem ooo):

tikailag igen nehezen kezelhetők. Mindazonáltal ismeretes egy közelítő formula ilyen hányados—becslések szórására.5 E formula akkor használható, ha

fennáll, hogy

1 n 1 N

"_ Zpko gkoN _— ypko űko

" kal N k:1

Ez azonban éppen az árindex-becslésnek az 1. megjegyzésben említett speciális tulajdonsága miatt — a mintába elsősorban a nagyvolumenű ter—- mékek, cikkek kerülnek bele — a mi esetünkben biztosan nem teljesül.

Ezért, ha az említett formulát használnánk, akkor i szórását s így hibáját is lényegesen nagyobbra becsülnénk, mint amekkora a valóságban. Az aláb- biakban egy egyszerű példával illusztrálom az ismert formuláknak a mi esetünkben való használhatatlanságát.

Tegyük fel, hogy valamelyik iparág összesen 1000 terméket gyárt és az iparág össztermelésének értéke a bázisidőszakban egymillió forint. Tegyük fel továbbá, hogy az 1000 termék közül IDO—nak termelési értéke képviseli az össztermelési érték 90 százalékát, a többi 900 pedig a maradék 10 száza—

lékot. Számítani akarjuk az árindexet oly módon, hogy az 1000 termék közül IDO—nak figyeljük meg az árváltozását. Ez darabszámra 10 százalékos rep—

rezentációt jelent, de mintánk az iparág össztennelési értékének nyilván—

valóan nem 10 százalékát fogja képviselni, hanem elsősorban nagyvolumenű

termékeket választva be a mintába kb. a 90 százalékát. Ezért ha az alap-

' sokaság, illetve a minta elem—száma alapján az ismert képletekkel akarnék a mintabeli szórásból i hibáját számítani, akkor ez ebben a számszerű esetben kb. kilencszer nagyobbnak adódna, mint amekkora a valóságban.

Az előbbiek alapján világos, hogy az említett formulát az árindex—

becslés hibájának meghatározására nem lehet használni, más, a valóságot jobban megközelítő formulát kell keresni a szórás számítására.

1, illetve i formuláját felírhatjuk súlyozott átlag formájában is.

N

I : 2 PM) Gko _ Pk! ,

kal N Pko

2 Pio flio

ial

illetve

Pico Gko Pl.—1

kx1 n Pko

2 Pio 'Iío

izl

Látható, hogy 1 valóban az egyedi árindexek súlyozott átlaga. Az i is súlyozott átlag egy adott mintában, azonban a súlyok értékei maguk is a mintavételtől függnek, tehát nem állandók, hanem valószínűségi változók.

Ha azonban ezt is figyelembe akarjuk venni, akkor a szórás meghatározása

—— különösen az egyedi árindex—ek eloszlása ismeretének hiányában —— meg—

oldhatatlannak látszik. Ezért célszerűnek látszik i-t olyan súlyozott átlagnak tekinteni, amelynél a súlyok nem valószínűségi változók? banan adott ál- landók, s mint ilyennek meghatározni a szórását.

5 Lásd például W. G, Cochran: Sampling Technigues. New York. 1953. 117. old.

(5)

A REPREZENTA'HV ARINDEX HIBAJANAK SZAMITASA 151

Súlyozott átlag szórásának kiszámítására ismert formula áll rendel- kezésre. Ennek azonban megint az a hibája, mint a fentiekben említett for—

mulának, ti. nem veszi tekintetbe az árindex-becslésnél jelentkező speciális tulajdonságokat, s így gyakorlatilag szintén nem használható, mert a szórást ezzel is többszörösen nagyobbnak kapnánk, mint amekkora a valóságban.

Az árindex—becslés hibájának meghatározására tehát új utakat kellett

keresni, új formulát levezetni. Valóban sikerült olyan matematikai modell felállítása, amely jól megközelíti a valóságot, figyelembe veszi a mintavétel—

nek az 1. megjegyzésben leírt sajátosságát, s amelynek segítségével levezet—

hető volt olyan formula, amellyel az árindex-becslés szórását, illetve hibáját gyakorlatilag is használható módon lehet sz:-imítani.6

Mielőtt a formulák ismertetésére rátérnék, a könnyebb áttekinthetőség kedvéért néhány jelölésbeli egyszerűsítést vezetek be. Legyen

Pico 9140 : % Pk! aka ;" Jk

N,

2 Pm: ílkn f': X

kal

Ezekkel

ka k 1

kal

Bizonyos egyszerű feltételek fennállása esetén levezethető (a szereplő valószínűségi változókra vonatkozó matematikai kikötéseket és a matemati—

kai levezetést a Függelékben vázolom), hogy egy N elemből álló alapsoka—

ságból n elemet kivéve az így nyert i árindex-becslés szórásnégyzete köze—

lítőleg a következő formulával számítható:

!) n : Ért—'mi N a

gxxi— (%%) (kal /(k§1'xk) ) n _

n n a n a 'áwk—zwk)"

(Za) (sz) ——(2za)

kal kal kal

2 _.

a'i ———

' Meg kell iegyemem, hogy az alábbi formulák levezetése Sarkadi Károlynak. a MTA Matematikai Kutató Intézete tudomá—nyos munkatársának, a matematikai tudományok kamdidátusának hathatós közre—

működésével sikerült. '

(6)

1 52 ELTETD! ODON

Ez bimnyos átalakítással és fent bevezetett jelölésekkel a következő formában is írható:

or; ,, Z , (ik—w /1/

2 kal X

1 _ Zách/xi kal

N

A formula használata feltételezi X : Z pm gko —nak, I nevezőjének

kzl

ismeretét. Ez a mennyiség valóban ismert az ármdex—vizsgálatoktól függet—

lenül. Éppen ezért vettem alapul a Laspeyres formulát a számításokhoz.

A Laspeyres—formulában ún. éppen az a mennyiség ismert, amelynek isme—

rete szükséges, ti. I nevezője. Ezzel szemben a Paasche—formulánál nem a nevező, hanem a számláló az ismert. Ezért a Paasche—formula alkalmazása esetén nem magának i—nek, hanem reciprokának 1/i-nek a hibáját lehetaz /1/ formula alapján meghatározni. Ebből természetesen i hibája is meghatá—

rozható. Egyébként a legtöbb esetben az i 1 körüli szám s így i—nek és ——1— -

'I;

nek hibája lényegében ugyanaz lesz.

Térjünk vissza az /1/ formula részletesebb vizsgálatához. A formulában

szereplő mennyiségek a kapott minta alapján számíthatók, az X ismert. Ki-

N

vételt képez a 2 mi kifejezés, amely közvetlenül nem számítható a mintá- kal

ból. A súlyok eloszlására vonatkozó egyszerű feltételezéssel azonban ez a mennyiség is megbecsülhető a mintából. A feltételezés csupán annyi, hogy a mintában szereplő sek—k relatív szórása kb. megegyezik a maradék N—n számú x,, relatív szórásával. E feltétel mellett

N n n a

., , (X——::)$ n(N——n——l) X—w a:

mh Rá 2 mi, -7— 4— 2 nak -—— -———

1 k:1 N—n (n—l) (N—n) a: kal n

E becslés segítségével tehát (rí a kapott minta, X és N ismeretében kiszámítható. /1/-ből látható, hogy az árindex—becslés szórása az egyedi árindexek szóródásán kívül jelentősen függ attól, hogy a mintában szereplő termékek, cikkek termelési, illetve forgalmi értéke hányadrészét teszi ki az egész alapsokaság össztermelési, illetve forgalmi értékének, azaz hogy volu—

men szempontjából mekkora a reprezentáció mértéke. Minél nagyobb a reprezentáció mértéke volumen szempontjából, azaz minél kisebb a X/x há—

nyados, annál kisebb lesz árindex—becslésünk szórása. Természetesen függ a szórás a minta elemszámától is, még pedig fordítottan arányos vele. Ez ugyan a formulából közvetlenül nem olvasható le, de könnyen belátható.

!) !].

Adott 2 a:,c : ac érték mellett ui. a 2 mi kifejezés értéke véletlen ki-

kml kal

választás esetén nagy valószínűséggel annál kisebb lesz, minél nagyobb a

!!

k:

minta elemszáma, n — 2 mi csökkenésével /1/ formulában a számláló második

1; 1

(7)

A REPREZENTATIV ÁRIEDEX HIBAJANAK SZAMITASA 153

tagja növekszik, s így a számláló csökken, a nevező második tagja viszont csökken, s így a nevező növekszik, azaz végeredményben 0-3 csökken.

A szórás ismeretében meg lehet határozni becslésünk hibáját is, azaz meg lehet adni egy ún. megbízhatósági intervallumot a becslés jóságára.

Ennek a megbízhatósági intervallumnak a hossza adott minta és szórás mel—

lett függ még a becslésnek mint valószínűségi változónak az eloszlásától, valamint a választott valószínűségi szinttől. A mi esetünkben be lehet bizo- nyítani, hogy az i becslésnek mint valószínűségi változónak az eloszlása közelítőleg normális eloszlású lesz, ha az alapsokaság elemszáma N és a minta elemszáma n mindketten elég nagyok (például n legalább százas, N pedig ezres vagy tízezres nagyságrendű). Ez a feltétel a gyakorlati esetek—

ben általában teljesül, ezért a megbízhatósági intervallum meghatározásá—

nál faktorként használhatjuk a normális eloszlásnak a kívánt valószínűségi szinthez tartozó értékét. így becslésünk hibáját az

liml[§u-a'i

képlet segítségével számolhatjuk, ahol u az adott valószínűségi szinthez tar—

tozó értéke a normális eloszlásnak, például 95 százalékos valószínűség ese—- tén u : l,96.

Megjegyzem még, hogy a matematikai modell bizonyos finomításával levezethető egy másik, /1/—hez hasonló, de annál bonyolultabb formula i

szórásnégyzetére. Ez a formula a következő:

N 2 N N

"1 .

(2 mi) zat 296?

kal ? kal kal

n 2 H 11 !]

( mi) ; Zac; ,, ?

k:1 kmi kal 1 % _

a'; ,, (%t— _— ?!)2 lla/

n n k _1 N 2 '

3 2 *

Zac ): ( zh)

kal kal kal

l —— 2 W;—

n n

(szfMZwi)

_kal _kal

A formula alapjául szolgáló matematikai modell és a levezetés a Füg- gelékben található meg.

Gyakorlati számításokra azonban ez a formula kissé bonyolultnak lát—

szik, ezért a további számításokban az /l/ formulát fogom használni.

*

Amikor egy alapsokaság valamely jellemzőjét az alapsokaságból kivett minta alapján akarjuk becsülni, akkor nemcsak arra akarunk feleletet kapni, hogy az adott mintából számitott becslésünk mennyire pontos, hanem leg—

többször felmerül az a probléma is, hogy mekkora mintát kell kivennünk ahhoz, hogy a szóbanforgó jellemzőt a mintából —— adott valószínűséggel ——

előre megadott hibánál nem nagyobb hibával tudjuk becsülni.

Természetesen az árindex reprezentatív módszerrel történő számításá—

nál is felmerül az a kívánság, hogy adott hiba és valószínűségi szint mellett előre meg lehessen mondani, hogy mekkora mintát kell kivenni, illetve pon—

(8)

154 ÉLTEIÚ ÚDÖN

tosab'oan: az alapsokaság N számú terméke, cikke közül hánynak az árvál—

tozását kell megfigyelni ahhoz, hogy az árindexet megfelelő nagy valószínű- séggel legfeljebb a megadott hibával tudjuk becsülni. Könnyű belátni, hogy nem célszerű a kérdést ilyen formában feltenni, ti. árindex—becslés esetén erre a kérdésre nem lehet egyértelműen választ adni. Ui. az /1/ formulából is látható, hogy az árindex-becslés hibáját igen nagymértékben az határozza meg, hogy a megfigyelt termékek, cikkek hányad részét képviselik az össz—

termelési, illetve forgalmi értéknek. Visszatérve az előzőkben emlitett pél—

dára, nem lehet olyan kijelentést tenni, hogy bizonyos hiba túl nem lépésé—

hez például 100 termék árváltozását kell megfigyelni az 1000 közül, hiszen ha ez a 100 kiválasztott termék a 100 nagyvolumenű, akkor az össztermelési értéknek 90 százalékát képviselő termékcsoport árváltozásait figyeltük meg, s biztos, hogy elég pontosan fogjuk tudni becsülni az árindexet; ha ellenben 100 kisvolumenű terméket választunk ki, amelyek az össztermelési értéknek esetleg csak 1—2 százalékát képviselik, akkor nagy valószinűséggel csak

nagyon durván fogjuk tudni becsülni az árindexet.

Általában is az a helyzet, hogy a szóbanforgó alapsokaságok olyan termékekből, cikkekből tevődnek össze, amelyek volumen szempontjából igen különbözők, az árindex értékének kialakításához igen különböző mér—

tékben járulnak hozzá. Ez azt jelenti, hogy n számú kisebb volumenű ter—

mék, illetve cikk árváltozását figyelve meg, az így kapott árindexből csak nagyon bizonytalanul tudunk következetetni a vizsgált sokaság árindexére.

Ezzel szemben, ha ugyancsak n nagyvolumenű terméket, cikket vonunk be megfigyelési körünkbe, amelyek együttesen az össztermelési, illetve for—

galmi érték 50—60, esetleg még nagyobb százalékát képviselik, akkor sok—

kal biztosabbak lehetünk abban, hogy a mintából számított árindex nem fog lényegesen eltérni a tényleges árindextől. Ezért nem helyes a kérdést úgy fogalmazni, hogy hány terméket kell kiválasztani az árindex megfelelő pon—

tosságú becsléséhez.

Ez természetesen nem jelenti azt, hogy a minta elemszámának semmi

jelentősége nincs a hiba nagysága szempontjából. Csak azt hangsúlyozom, hogy árindex reprezentatív módon való számítása esetén a hibát elsődlegesen nem az határozza meg, hogy hány elemből áll a minta, hanem az, hogy a minta termelési, illetve forgalmi érték szempontjából a vizsgált sokaság hányad részét teszi ki. Ezért a szükséges mintanagyságra vonatkozó kérdést is a következőképpen kell megfogalmazni: mekkora mintát kell venni, a volumen szempontjából milyen reprezentációra van szükség ahhoz, hogy a vizsgált alapsokaság árindexét megfelelő nagy valószínűségi szinten úgy lehessen becsülni, hogy a becslés hibája ne haladjon meg egy előre megadott értéket?

Erre a kérdésre már lehet Választ adni, feltéve, hogy a szóbanforgó alapsokaságra vonatkozólag rendelkezünk már bizonyos információval, aminek alapján a szórást becsülni tudjuk. Ha ni. a megfigyelendő alapsoka—

ságról semmit sem tudunk, illetve semmiféle jogos feltevést nem tudunk tenni a szórásra vonatkozólag, akkor sem árindex-becslés esetén, sem pedig akármilyen más becslés esetében nem lehet előre megadni az adott hiba be—

tartásához szükséges mintanagyságot.

Tegyük fel tehát, hogy a vizsgálandó alapsokaságból rendelkezünk egy előző mintával. (Ez lehet például az előző évi árindex számításához vett minta; bár az alapsokaság összetétele, az egyedi árindexek elöszlása', súlyai

(9)

A REPREZENTATIV ÁRINDEX HIBÁJÁNAK SZÁMITASA 155

időközben bizonyos Változásokon mentek át, egy előző évi minta mégis nyújt valami információt a szórásra vonatkozólag.7 (Legyen az előre megadott maximális hiba: ]i—I l: d. Meghatározandó a minta nagysága vo—

lumen szempontjából úgy, hogy a mintából számított i árindex—becslés hi—

bája adott valószínűséggel ne legyen nagyobb d—nél. Célunk tehát éppen a

N n

a'; formulájában szereplő % : Z pm gm/ Z Pit-091109 hányados meghatáro—

k: 1 kal

zása.

Annak érdekében, hogy a számítást áttekinthetőbbé tegyem, még néhány jelölésbeli egyszerűsítést vezetek be. Legyen

X N

__ .2 __

_; M o Zak.—_. Z

kal

no n na

BmW—"P : s zaz—z zza: %

kel. kal kal

ahol 710 egy előző minta elemszámát jelenti.

Ezekkel az /1*/ formula (l. a Függeléket) a következő alakot ölti:

aaz—___— s

a *

Ha most a Z., wz közelítést használjuk (e közelítés nélkül nem lehet

meghatározni a ?):X/x arányt), akkor a d : u — "'a illetve a"; ::de ösz—

szefüggések alapján v2-re a következő kifejezést kapjuk:

z_ d'X' Z _ 1 daz [9/

íja-(uis *7)'(—*_u38) d

Ha no jelenti aszámitás alapjául szolgáló előzetes minta elemszámát, Z, z és S ebből a mintából számíthatók, cl és a valószínűségi szint megadásával it is adott. Megoldásként természetesen v—nek csak pozitív gyöke jöhet te—

kintetbe.

Előfordulhat, hogy nem egy előző mintavétel, hanem egy előző teljes—

körű felvétel adatai állnak rendelkezésünkre a szóbanforgó alapsokaságra vonatkozólag. Természetesen ebben az esetben is választ akarunk kapni arra a kérdésre, hogy egy következő reprezentatív feltételhez mekkora minta szükséges, ha azt akarjuk, hogy árindex—becslésünk hibája ne halad—

jon meg valamely előre megadott hibát. Ebben az esetben n., : N, így Z ::

zo és S kifejezésében N—ig kell összegezni, s így az előbb alkalmazott köze—

lítéssel

—— zov

vh d2X3 Jr] 1 Jr asz marad;—ms 3

" u'S. ' uis — atz—Hits H

" Természetesen nem vonatkozik ez olyan esetre, amikor egyik évről a másik-ra a vizsgált területen alapvetö árváltozások történtek; Igy pad—ául az 1939n958. évi ipari melői árindex vizsgálatán/ól nem lehet az 1957—1958. évi szór—ásra támaszkodni, hiszen közben 1959. január 1-én az ipari termelői árakban alapvetö általános változások történtek.

(10)

1 56 ELTE'M! ODGN

Mind előzetes minta, mind pedig előzetes teljeskörű adatfelvétel esetén a szükséges mintanagyság meghatározásánál az előbbiekben említett közelí—

tést kell alkalmaznunk, ezért az adott hiba betartásához szükséges minta-—

nagyságot is mindkét esetben csak közelítőleg lehet meghatározni. A szűk-—

séges mintanagyság meghatározása azonban egyébként is mindig többé—ke—

vésbé közelítő jellegű, hiszen a számítás nem a vizsgálandó sokaság szórá—

sára (azt csak a mintavétel után tudjuk számítani), hanem előző adatok szó—

rására vagy valamilyen feltételezett szórásra támaszkodik.

Ha tehát a szóbanforgó alapsokaságra vonatkozóan rendelkezünk egy előzetes mintával vagy egy előző teljeskörű felvétel adataival, akkor a /2_/

vagy /3/ összefüggések segítségével közelítőleg meghatározható az adott hiba betartásához szükséges reprezentáció mértéke a minta volumenére vonatkozólag, azaz, hogy az össztermelési, illetve forgalmi érték hány szá—

zalékát kitevő mintát kell megfigyelnünk. Ha sem előzetes minta, sem előző teljeskörű felvétel nem áll rendelkezésünkre, akkor mint említettem, az első mintavételnél nem lehet előre megszabni a hibát, hanem azt csak a minta—- vétel után lehet kiszámítani (egyébként mindig célszerű a hibát utólag, a kivett minta alapján is kiszámítani).

*

Láttuk, hogy árindex—becslés esetén adott hibahatár betartásához nem a szükséges mintaelemszámot, hanem a minta volumenben kifejezett szüksé—

ges nagyságát lehet előre meghatározni. Ezzel azonban a probléma még nincs teljesen megoldva. Hiszen, ha tudjuk, hogy akkora mimát kell ki—

választani, hogy az az össztermele'si, illetve forgalmi értéknek például a 30 százalékát képviselje, még nem lehet megkezdeni a mintavételt, hanem előbb még arról is dönteni kell, hogy az adott mintanagyságon belül hány terméket, cikket válasszunk ki, s hogyan történjék a kiválasztás. Ez a kér—

dés tulajdonképpen már a mintavétel módja problémaköréhez tartozik.

Arra vonatkozóan, hogyan történjék árindex—becslés esetén a minta ki—

választása, nem lehet általános szabályokat megadni, hiszen ez nemcsak matematikai probléma, hanem számos más tényező is befolyásolja. Az ár- index—becslés szórására kapott formulát megvizsgálva láttuk, hogy a

N n

EPM) !Iko / EPM) gko hányados adott értéke mellett a becslés hibája annál

kz—l kal

kisebb, miné több terméket, cikket veszünk be a mintába. Ezek szerint a volumenre vonatkozó reprezentáció adott értéke mellett a becslést úgy le—

hetne pontosabbá tenni, ha minél több kisvolumenű terméket, cikket ven—

nénk bele a mintába. Gyakorlati szempontból azonban ez nem lenne he—

lyes. A mintavétel és az adatok feldolgozásának költsége és ideje általában arányosan növekszik a megfigyelt mintaelemek számának növekedésével.

Tehát, ha túl sok kisvolumenű terméket, cikket figyelnénk meg, akkor ez a becslés hibájának kisebbmérvű csökkenése mellett a költségek és feldolgo—

zási idő jelentős növekedését vonná maga után, azaz nem éri meg a pon—

tosság kis növekedése a jelentkező nagy költségtöbbletet. Ez a mintavételi eljárás tehát semmiképpen sem gazdaságos.

Mint említettem nem lehet általános szabályt adni arra, hogy árindex—

számítás esetén mia helyes mintavételi mód. Egy adott feladat esetén a mintavétel előtt alaposan tanulmányozni kell a vizsgálandó alapsokaság struktúráját, jellegzetességeit. Az egyik megvizsgálandó szempont lehet az,

(11)

A REPREZENTA'l'íV ÁRINDEX HIBÁJANAK SZAMíTASA 157

hogy van—e valamilyen sztochasztikus kapcsolat az árváltozások és az egyes termékek, illetve cikkek termelési, illetve forgalmi értéke között, azaz van-e, vagy legalább is feltételezhető—e olyan jelenség, hogy például a nagyvolu—

menü termékek, cikkek árai másképp változtak, mint a kisvolumenűeké. Ha biztosak lehetünk abban, hogy a vizsgálandó alapsokaságnál nincs ilyen je—

lenség, azaz semmiféle sztohasztikus kapcsolat nem tételezhető fel az ár—

változások és a volumenek között, akkor a leggazdaságosabb, leghelyesebb mintavételi eljárás az, hogy csak nagyvolumenű termékek, cikkek árválto—

zásait figyeljük meg. Adott hiba betartása mellett ui. így kell a legkevesebb terméket, illetve cikket kiválasztani a mintába.

Ha azonban nem lehetünk eleve biztosak afelől, hogy nincs sztochasz—

tikus kapcsolat a volumennagyság és az árváltozás között (s véleményem szerint a legtöbb esetben ez a helyzet áll fenn), akkor csak nagyvolumenű termékek, illetve cikkek megfigyelését nem lehet helyesnek tartani. Ekkor ui. eleve lemondunk arról, hogy a vizsgálandó sokaság bizonyos része kép—

viselve legyen a mintában s emellett nem tudjuk, hogy a sokaság meg nem figyelt része árváltozások szempontjából nem viselkedik-e másként, mint a megfigyelt rész. Különösen hibás eredményt adhat ez a mintavételi mód abban az esetben, ha az egyenként elenyésző volumenű termékek, cikkek összességükben az alapsokaság termelési, illetve forgalmi értékének jelentős, például 30—40 százalékát képezik.

Ilyen esetben véleményem szerint a minta akkor fogja az árváltozások szempontjából reprezentálni az alapsokaságot, ha rétegezett mintavétellel dolgozunk, mégpedig úgy, hogy a szóbanforgó alapsokaság elemeit termelési, illetve forgalmi érték alapján 3—4 rétegbe osztjuk oly módon, hogy egy ré—

tegben nagyjából azonos termelési, illetve forgalmi értéket képviselő termé- kek, illetve cikkek legyenek.

A mintát ezekután úgy célszerű venni, hogy mindegyik rétegből ke—

rüljenek mintaelemek a mintába, természetesen a nagyvolumenű termé—

kek, cikkek tegyék ki a minta zömét, a közepes, illetve kisvolumenű réte—

gekből csak annyi terméket, cikket kell belevenni a mintába, hogy annak alapján becsülni lehessen a kisebb volumenű rétegek árindexet.

Természetesen akkor is lehet rétegezni valamilyen más szempont alap—

ján, ha nincs sztochasztikus kapcsolat a volumennagyság és az árváltozás között, hanem az árváltozások valamilyen más ismérvvel vannak kapcso—

latban. Ui. a becslés pontosságát akkor növelhetjük, ha az egyes rétegeken belül az egyedi árindexek nagyjából azonosak. Ha tehát például feltehetjük, hogy bizonyos termékcsoportoknál az árváltozások különbözők, akkor cél- szerű a rétegezést e termékcsoportok alapján végezni.

Rétegezett mintavétel esetén az árindexet az egves rétegek árindex—

szeinek súlvozott átlagaként kell meghatározni. A súlyozás a rétegek össz- termelési, illetve forgalmi értéke alapián történik. Ha 5, jelenti az r—edik réteg árindexet, X, a réteg termelési, illetve forgalmi értékét, akkor

H ' in /4/

ahol az összegezést a különböző rétegekre kell elvégezni. A rétegezés alap—

ján történő árindex-becsléshez láthatóan szükség van atz—Él hányadosok

(12)

1 53 15me ovon ismeretére, azaz legalább megközelítőleg ismernünk kell, hogy az egyes rétegek termelési, illetve forgalmi értéke az össztermelési, illetve forgalmi értéknek hányad részét teszik ki.

,

A mintavétel módjának ismeretében választ lehet adni arra a kérdésre is, hogy a mintának volumenben kifejezett adott nagysága mellett hány ter- méket, cikket kell megfigyelni. Erre az — újból hangsúlyozom —-— másod- lagos kérdésre a következőképpen lehet Válaszolni: ha ismeretes a minta nagysága, azaz tudjuk, hogy hány forint termelési, illetve forgalmi értékű terméket, cikket kell összesen megfigyelni és tudjuk azt is, hogy a mintát milyen arányban akarjuk a rétegek között felosztani, akkor ismerjük a minta egyes rétegeire eső forintban kifejezett értéket is. Osztva ezt az illető rétegbe eső termékek, cikkek átlagos termelési, illetve forgalmi értékével, megkapjuk, hogy a kérdéses rétegből kb. hány terméket, cikket kell meg—

figyelnünk. A konkrét termékeknek, cikkeknek kiválasztását az egyes réte—

gekből már a véletlen kiválasztás szabályainak szem előtt tartásával kell végrehajtani.

*

Az előzőkben ismertetett, az árindex—becslés szórására vonatkozó formula tulajdonképpen az egyszerű Véletlen mintavétel esetére vonatkozik.

Mint fent láttuk, a mintavétel gyakorlati megvalósítása viszont általában rétegezett mintavételt igényel. Ismeretes, hogy megfelelő rétegezés általá—

ban csökkenti a becslés szórását. Hogyan lehet mármost meghatározni a rétegezett mintavétellel kapott árindex—becslés hibáját?

Mivel rétegezés esetén az árindex a rétegek árindexének súlyozott átlaga, az egyes rétegek árindexei sztochasztikus függetlenségének feltéte-

lezése mellett a /4/ formulából következik, hogy ____X?

X?

2

(Tir /5/

2—

Vim/É

):

azaz az egyes rétegek árindex-becslése szórásának ismeretében a rétegezés alapján számított árindex-becslés hibája is meghatározható. Az egyes réte—

gekben a szórást az /1/ formula alapján kell számítani, természetesen az alapsokaság helyét itt az alapsokaság szóbanforgó rétege, a minta helyét pedig a mintának a rétegbe eső része foglalja el.

*

Végül az előzőkben kifejezett módszerek illusztrálására egy számpéldán végigviszem a számításokat. A példa természetesen fiktív adatokra épül, eléggé egyszerű esetet tételez fel, mindazonáltal nincs annyira a valóságtól elvonatkoztatva, hogy ne lenne tanulságOS a számítások keresztülvitele.

Vizsgáljuk például valamilyen iparágban a termelői árindexet. Tegyük fel, hogy az iparág összesen 50 különböző terméket állít elő és a bázisidőszakban az összterme—

lési érték 100 millió forint volt. Tegyük fel továbbá, hogy ennek az össztermelési értéknek 70 százalékát 5—8 millió forintos nagyságrendű, nagyvolumenű termékek, 20 százalékát egymillió forintos nagyságrendű, közepes volumenű termékek, 10 százalé—

kát pedig 100000 forintos nagyságrendű kisvolumenű termékek alkotják. A következő táblázat feltünteti mind az 50 terméknek a bázisidőszakbeli termelési értékét és egyedi árindexet. A gyakorlatban természetesen nem ismerjük az egész alapsokaság adatait, hiszen akkor nem kellene reprezentativ módon számítani az árindexet.

(13)

A REPREZENTATIV ARINDEX HIBÁJANAK SZAMITASA 159

1000 Ft: 1000 Ft

k pko akozxk 100 va'-k k Tico akosxk IDO-ik

1 9256 108,57 26 685 102,17

2 8175 106,12 27 427 96,75

3 6899 107,36 28 198 105,41

4 7123 103,28 29 236 100,59

5 5324 105,17 30 318 98.73

6 6138 107,29 31 481 97,65

7 7145 104,27 32 112 103,17

s 5242 105,63 33 534 101,34

9 7487 108,54 34 97 105,62

10 6711 106,48 35 491 100,3s

11 1121 101,38 36 635 99972

37 591 104,64

12 954 102,19 38 384 101,27

13 1046 100,32

- 39 479 102,57

14 2893 107,3s 40 293 100,19

15 833 98,12 41 654 99,13

16 987 99,72

42 178 101 72

17 1114 102,4s '

43 456 95,4s

18 3552 10335 44 330 103,15

19 1004 103,41 45 517 10431

20 878 97,36

_ 46 273 97,62

21 1812 101,3o 47 183 101,34

22 921 101,43 48 509 104,32

23 815 104,75 49 341 101,02

24 1177 105,97 50 545 98 08

25 891 98;27 '

A táblázat úgy, készült, hogy az első 10 termék alkotja az A réteget, ezek a nagy- volumenű termékek, a következő 15 közepesvolumenű termékből áll a B réteg, s végül a többi 25 termék képezi a kisvolumenű C réteget. Az egyes rétegek árindexei külön- böznek egymástól. Tegyük fel most, hogy előzetes minta vagy más meggondolások alapján úgy határoztunk, akkora mintát veszünk ki, hogy az az össztermelési érték 50 százalékát képviselje, vagyis 50 millió forintot. Rétegezett mintát veszünk, még pedig ugy, hogy az A rétegből kiveszünk 6 terméket, összesen kb. 42 millió forint éltékbel'l, s B rétegből 5 terméket kb. 6,6 millió forint értékben, s végül a C rétegből 4terméket figyelünk meg. így összesen 15 termék árváltozását figyeljük meg. Darabszámot tekintve a reprezentációnk 30 százalékos, ami jelentősen eltér az 50 százalékos volu—

men reprezentációs mértéktői. Véletlen kiválasztás útján az egyes rétegekből a követ—

kező termékek kerültek be a mintába:

A rétegből az 1, 4, 6, 7, 8 és 10 sorszámú;

B rétegből a 14, 19, 20, 22 és 24 sorszámú;

C rétegből a 28, 35, 44 és 48 sorszámú.

A minta így összesen 50,018 millió forint termelési értéket képvisel, valamivel többet, mint az össztermelési érték felét.

A mintából a /4/ formula alapján számítva az árindex 105,232-nek adódik.

Számítsuk ki előbb ennek a becslésnek a hibáját az egyszerű véletlen minta—

vételre érvényes szórásiormula alapján. A részletes számításokat itt helykímélés cél—

jából nem közlöm, végeredményben azt kapjuk, hogy

a, : 0,614

s így 95 százalékos valószínűséggel mondhatjuk, hogy a fenti becslés hibája nem nagyobb, mint 1,2, azaz a valódi árindex 104,0 és 106,4 között van.

Ha most kiszámítjuk rétegenként a mintából az árindexet és azok szórását, az /'5/ képlet alapján a rétegezett mintából számított árindex—becslés szórására

a; : O,553

(14)

1 60 21me 0002:

adódik, a hiba pedig 95 százalékos szinten 1,08 lesz, vagyis a valódi index 104,15 és 106,31 között helyezkedik el 95 százalékos valószínűséggel.

Ha az egész alapsokaság alapján kiszámítjuk a valódi árindexet, akkor 105,08—at kapunk, vagyis a valódi árindex valóban benne van a számított megbízhatósági inter—

vallumban, még pedig közel az intervallum közepéhez.

Összehasonlítás kedvéért megemlítem, hogy az /1a/ formulát használva az egy—

szerű véletlen mintavétel esetére árindex—becslésünk szórása

a; : 0,576

és 95 százalékos szinten a hiba 1,13—nak adódott.

Úgy gondolom, hogy e példa megkönnyíti az árindex—becslések ismer—

tetett matematikai formulák alapján történő hibaszámításának gyakorlati keresztülvitelét, egyben illusztrálja. a módszer használhatóságát.

*

Végezetül hangsúlyozni kívánom, hogy az itt közölt megoldást egyálta—

lában nem tekintem véglegesnek. Elképzelhető, hogy sikerülni fog a fel—

állított modell finomítása, azaz elsősorban a formulák matematikai leveze—

téséhez használt matematikai feltételek enyhítése, illetve módosítása. Mind- azonáltal ez nemcsak elméleti munka. Feltétlenül szükségesnek tartom, hogy különböző területekről teljeskörű vagy reprezentatív felvétellel nyert ada—

tok mélyreható analízise útján pontosabb képet kapjunk az egyedi árindexek és a súlyok eloszlásáról, valamint arról, hogy a levezetésnél használt fel—

tételek milyen mértékben teljesülnek.

Ezenkívül azt is hangsúlyoznom kell, hogy ez a tanulmány távolról sem oldja meg az ár— vagy volumenindexek reprezentatív módszerrel történő számításánál fellépő különböző problémákat. Hiszen annyi elméleti és gya—

korlati probléma léphet fel a különböző területeken, hogy azokat mind számbavenni és meg is oldani nem egy tanulmány, de egy könyv ke—

reteit is meghaladná, nem is beszélve arról, hogy egy ember nem is vállal—

kozhat arra, hogy a különböző területeken fellépő problémákba a megoldás—

hoz nélkülözhetetlen mélyebb betekintést megszerezze.

Mindazonáltal remélem, hogy e tanulmány ezen igen érdekes és fontos problémakörnek a megoldását egy lépéssel előbbre Viszi.

FUGGELÉK

Az alábbiakban bemutatom milyen feltételekből, s hogyan lehet levezetni az /1a/

szórásnégyzet formulát. Ezt követően pedig megadom azt a matematikai modellt, amelyből az itt közölt bizonyításhoz hasonló módon az /1/ formula levezethető, de a le—

vezetést az utóbbi esetben csak vázolom.

A /1a/ formula bizonyítását mutatom meg részletesen azért, mert egyrészt ennek bizonyítása a feltételekből rövidebb, áttekinthetőbb, másrészt matematikai szempont—

ból a levezetés során kevesebb elhanyagolást kell tenni, mint az /1/ formula bizonyí—

tása esetén.

A továbbiakban az /l/ formula előtt bevezetett jelöléseket fogom használni; azon—

kívül M (5) szimbólum fogja jelenteni a $ valószínűség változó várható értékét (elméleti átlagát), D, (5) pedig a szórásnégyzetét.

N

Zan.-

kal

N : N

kára ** * z

1:

(15)

A REPREZENTATIV ÁRINDEX HlBAJANA-K SZAMI'I'ASA 161

!]

fix/k " w

. a k .

z :: ——————— : uz

n 2 ,, k

kal

wk 2901;

k:1 kal

Az /1a/ formulához vezető matematikai modellben az ik-kat független, egyforma szórású valószínűségi változóknak tekintjük. I—t magát is egy végtelen alapsokaság—

ból vett nagy minta jellemzőjének, azaz valószínűségi változónak fogjuk fel. így fenn—

áll: Mm : M (1) (l—t egy véges alapsokaság konstans jellemzőjének tekintve M (i) 76 1, azaz i nem torzítatlan becslése I-nek.) A modellben az .rk -kat nem tekintjük valószínű—

ségi változóknak, hanem adott konstansoknak.

A feladat %" hibáját jellemző M (i — I)2 meghatározása.

M . I 2 D2 . I D2 (i, xk . N mk .

z— : z— : 7, — 7, :—

( ) ( ) fán RIÁ k

*" 2 x,. " 2 x,

i:1 izl

11 wk 947, N xk

I'— DZ —— ' i.—— ** i :

2 n N [* 2 N k

k—_—1 kana-1

2 x,. Éva- 2961

izl i:1 1—41

Itt az alapsokaság elemeit már úgy számoztuk át, hogy a mintába kivett n elem kapja az első n indexet. Felhasználva az ik —k feltevés szerinti függetlenségét és az vek—k konstans voltát a fenti kifejezés tovább így írható:

1102

, 2 N

._. n ——1——— 1 x2D3(i)—1— ___—ma'):

2 11 N k k 2 N 2 k

k:1 in 21971" kan—H (Egri

izl izl izl

n 11 N

ze Za Ig;

: kal __ 2 kzl % ——— 02 ("*-k)

11 2 11 N N 2

(M

kzl

(MH—M)

kal k_—_1

(M)

kal

Az utóbbi kifejezésnél felhasználtuk azt a feltételt, hogy az ik-k szórása egy—

forma.

Most ugyanezt a meggondolást alkalmazzuk 1 helyett ik —ra és I helyett i-re:

!]

Em

xk k:1 _l,_

e(:

D2 (ik)

M (ik—i)? : 1 _ 2

xi

n 2

::1

...

Szorozzunk yei-tel és összegezzünk I—től n-ig:

n

n . kzl kal _

wv zeMm—m: Za—e e————7 WW)

kzl kal n 11

Exk Z 9314

kal. ka],

2 Statisztikai Szemle

(16)

162 13me ODÖN

De

n n n

(F2) Ex; Mar—m: M ( Zac; (ak—m) % Ez; (ik—aaa

kal kal kal

n

feltéve, hogy a minta. elég nagy ahhoz, hogy 29030 (lik—i? elég közel legyen várható érté-

kal

kéhez. (El)—ből kifejezve D' (ig-t (F2) figyelembevételével kapjuk: '

n N

Eau-§, Yang Eat—§

kal __ 2 kal * kal

n ! 11 N N :

(sz)

_kal

(mut)

_kal _kal

(sz)

_kul

,,

. ,

a': : . Zac; (tk—t)"

ll N :

Számlálót, nevezőt osztva( Ez; ne; )-tel és szorozva ( á sok) -tel kapjuk az [la] formulát.

Abban az esetben, amikor egy előzetes minta alapján adott hiba betartásához szükséges mintanagyság meghatározására akarjuk számítanii szórását,a levezetésésa formula kissé módosul. Ekkor úi. (Fú—nél nem n—ig, hanem nr.-ig kell összegezni, ahol n,. azkelőzetes minta elemszáma. Igy a tanulmányban már bevezetett egyszerűsítő jelö—

lések el

296;

X! X kal

mi __ 7 11

gzaxí "" mi

2062 2702 Zwt

kal kul kal

—— e

n ma

Ez; 4ng)

kal k:1

X

(12 :: uz 0'3- összefüggés alapján ebből a v :— hányadosra egy másodfokú egyen—

a:

n

letet kapunk. Mivel a keresett 'v—n kívül 206; is ismeretlen, v—t csak úgy tudjuk kal

n no .

meghatározni, ha a Zwi % Zwi közelítéssel élünk, ez utóbbi ui. az előzetes

kal kal

mintából kiszámítható. Ha pedig egy megelőző teljeskörű adatfelvétel alapján akarjuk az adott hiba betartásához szükséges minta—nagyságot meghatározni, akkor m, helyébe N kerül.

(17)

A REPREZENTATIV ÁRI'NDEX HIBAJANAK SZÁMITASA

163

Az /1/ formulához vezető modellben az ik-kat ekvivalens valószínűségi változók—

nak tekintjük, az Lt egy véges alapsokaság konstans jellemzőjének. Az nek-kat itt is adott állandó súlyoknak fogjuk fel. A levezetésnél, amely hasonló a fentihez, de hosz—

szadalmasebb és több elhanyagolást igényel, a következőkből indulunk ki:

!)

211); D2 (ik) Zxk a:, GGV (ik, il)

D2 (i) :: ku]. %. kae 1

(34

ka].

(M

karl

ahol cov (ik, i,) : M(iki1)—M(ih) Mg,)

Ekvivalens változók esetén D* (ik) és cov (ik, i,) nem függ a k, illetve l índexektől, D* (ik) :: D' és cov (ik, d,) : c. A

D* (I) :: 0 és

N N

29313 D* : ZWk—IW

kal kul

relációkból m és c meghatáfozható.

Ha eg előzetes minta alapján azért akarjuk a szórást meghatározni, hogy adott hiba túl nem lépéséhez szükséges mintanagyságot kiszámítsuk, akkoraz [la/ formulá—

hoz hasonlóan módosul az /1/ formula, s ha n., az előzetes minta elemszáma, akkor

X?-

N

2

... 5010 n 2

ma 1931 kzlxk 1: mi

1'! . ; : _.7; a

, ' % no no 121 X? ("* )

Ez; n — aai/m _

kal Zan,"; kal

k———1

11 no

Ebből X/x::fv—t akkor tudjuk számítani, ha, itt is még a. ki'mi. %kZLwí közelítést

:1 ,:

alkalmazzuk.

2!!!