• Nem Talált Eredményt

Asszociációs kapcsolat

In document Bevezetés a sportstatisztikába (Pldal 67-71)

eloszlástípusok. Aszimmetria mérése

1. Asszociációs kapcsolat

Az asszociációs kapcsolat mérését egy példa segítségével mutatjuk be.

Egy labdarúgócsapat hazai és idegenbeli bajnoki mérkőzését kísértük figyelemmel. 80 mérkőzés eredményéből vizsgáltuk a csapat hazai és idegenbeli teljesítményét. 48 mérkőzés hazai pályán, 32 idegenben volt. A győztes, illetve vesztes mérkőzések számát az alábbi tábla tartalmazza:

16.1. táblázat - A felmérés eredményei

1Természetesen a több ismérv (változó) közötti kapcsolatot is lehet elemezni statisztikai módszerekkel, azonban könyvünkben csak a legegyszerűbb eseteket említjük meg.

Kapcsolatvizsgálatok

Játékhely A vizsgált csapat eredménye Összesen

Győzelem Vereség

Otthon 39 9 48

Idegenben 11 21 32

Összesen: 50 30 80

Forrás: saját szerkesztés

Határozzuk meg az eredményesség és a játékhely közti kapcsolatot!

Az asszociációs kapcsolat esetében az adatokat egy kombinációs táblába rendezzük, amely a minőségi ismérvek szerinti gyakoriságokat tartalmazza. Az ilyen típusú táblákat – mint már szóltunk róla – ún.

kontingenciatábláknak nevezi a statisztikai irodalom. Felírhatjuk a tábla általános formáját (33. tábla):

16.2. táblázat - A kontingenciatábla

A ismérv változatai B ismérv változatai Összesen

B1 B2

A1 f11 f12 S1

A2 f21 f22 S2

Összesen: O1 O2 n

Forrás: saját szerkesztés n – az összes elemszám,

f11 – az A ismérv első és a B ismérv első változatához rendelt gyakoriság (hasonlóan értelmezhetők a többi cella gyakoriságai!),

S1 – az első sor (az A ismérv első változatához tartozó) gyakoriságok összege, O1 – az első oszlop (a B ismérv első változatához tartozó) gyakoriságok összege.

Belátható az alábbi összefüggés:

S1 + S2 = O1 + O2 = n.

A sorok, illetve az oszlopok összegeit peremgyakoriságoknak nevezzük.

Alternatív ismérvek esetén a kapcsolat mérésére alkalmazhatjuk az ún. Yule-féle mutatót, ami a táblában szereplő gyakoriságok „keresztszorzataiból” állítható elő:

A mutatószám – mivel két adat különbségének és ugyanazon adatok összegének hányadosa – minden esetben –1 és +1 közötti értéket vesz fel.

Példánkban a Yule-mutató:

A mutató ismeretében megállapíthatjuk, hogy erős sztochasztikus kapcsolat van a játékhely és az adott labdarúgócsapat teljesítménye között. Az előjelnek nem tulajdonítunk jelentőséget, mivel a táblában a sorok vagy oszlopok kicserélése – amire semmilyen ellenérv nem hozható fel – megváltoztatná, negatívvá tenné az előjelet.

Kapcsolatvizsgálatok

Természetesen a fenti kapcsolat szorosságára vonatkozó megállapítás statisztikai jellegű, csak tendenciaszerűen, valószínűségi jelleggel értelmezhető.

A mutatószám alkalmazása során azonban fokozottan figyelni kell arra, hogy valamennyi átlóban lévő elem különbözzön nullától. Ha csak egy esetben nulla a gyakoriság, a mutatószám akkor is determinisztikus kapcsolatot jelez, ha az egyébként nem áll fenn.

Tételezzük fel, hogy egy megfigyelés során az alábbi eredményt kaptuk:

16.3. táblázat - A megfigyelés alapadatai

Játékhely A vizsgált csapat eredménye Összesen:

Győzelem Vereség

Otthon 39 0 39

Idegenben 11 30 31

Összesen: 50 30 80

Forrás: Saját szerkesztés A Yule-féle mérőszám:

A fenti esetben nem áll fenn a determinisztikus kapcsolat, ugyanis a csapat otthon nem veszít (csak idegenben), azonban a győzelmek száma erősen megoszlik a játék helye szerint.

Kettőnél több ismérvváltozat esetén más mérőszámot kell alkalmazni. A Cramer-együttható feloldja az alternatív ismérvek dilemmáját és ugyanakkor érzéketlen a kirívó (egyik cellában nulla értékkel bíró) esetekkel szemben, alapgondolata az alábbi:

Amennyiben a független viszonyt feltételező gyakoriságok és a tényleges gyakoriságok között eltéréseket találunk, akkor a sztochasztikus kapcsolat meglétére gondolhatunk. A kétféle gyakoriság eltérése közötti különbségeket egy mérőszámban kell kifejezni.

Az ún. peremgyakoriságok segítségével kiszámíthatjuk a függetlenség esetén feltételezett gyakoriságokat, amelyeket *-gal különböztetünk meg:

Az előző példa adatai alapján készítsük el a további számításokat!

A peremgyakoriságok segítségével a függetlenség esetén feltételezett gyakoriságok:

A feltételezett, független gyakoriságokat az eredeti táblához hasonlóan foglalhatjuk össze:

16.4. táblázat - A függetlenség esetén feltételezett gyakoriságok

Játékhely A vizsgált csapat eredménye Összesen:

Győzelem Vereség

Otthon 30 18 48

Idegenben 20 12 32

Összesen: 50 30 80

Forrás: Saját számítás

Kapcsolatvizsgálatok

Ha a kiinduló és a fenti tábla belső adatait összehasonlítjuk, látjuk, hogy a gyakoriságok eltérnek egymástól, ezért feltételezhetjük a sztochasztikus kapcsolatot.

A tényleges és feltételezett gyakoriságok közötti eltéréseket egyetlen mutatószámba kell „sűríteni”, amihez az alábbi számítás segítségével jutunk el.

Elsőként minden cellában kiszámítjuk az alábbi relatív különbséget:

ahol: az fij az i-edik sorának és j-edik oszlopának gyakorisága.

Az eltérésekből képzett összeg (valamennyi cellát figyelembe véve, amit a dupla szummázás jelöl!) a (Khi-négyzet) néven ismert matematikai–statisztikai eloszlás értéke.

A önmagában még nem felel meg a sztochasztikus kapcsolatok mérőszámaival szemben megfogalmazott feltételnek. Alsó határa ugyan 0, de felső határa jelentősen meghaladhatja az 1-et. Ezt a dilemmát oldja fel a Cramer-féle mutatószám, amelynek képlete:

Ahol a tört nevezőjében az s a két változó ismérvváltozatainak minimumát (a kevesebb ismérvváltozat számát) jelöli. (Ez alternatív ismérvek esetén nem tér el, mindkét ismérv esetében kettő.)

Természetesen a feltételezett gyakoriságok kiszámítása kettőnél több ismérvváltozatra is kiterjeszthető, így a Cramer-mutató kiszámításának lehetősége általánosan adott.

A Cramer-féle mutató eleget tesz a sztochasztikus kapcsolati mérőszámokkal szemben támasztott követelménynek is, mivel:

0 ≤ C ≤ 1

Folytassuk a számításokat bemutató példánk adataival!

A Cramer-féle mutatószám példánkban:

A mérőszám szerint a játékhely jellege és a csapatok teljesítménye közötti sztochasztikus kapcsolat közepesnek mondható. A C2 mérőszám is értelmezhető, amely azt mutatja meg, hogy – esetünkben – a játékhely mintegy 23%-ban (0,472 = 0,23) determinálja a labdarúgócsapat teljesítményét.

A korábbi Yule-féle mérőszámnál most alacsonyabb intenzitású kapcsolatot számszerűsítettünk. A kétféle mérőszám eredményét egymással nem lehet összemérni, a Cramer-együttható „szigorúbban” mér. Előnye azonban az utóbbinak, hogy nemcsak alternatív ismérvek esetén használható.

Az asszociációs kapcsolat mérését szemlélteti az alábbi példa, felhasználva a Cramer-féle mutató előnyeit. Itt ugyanis egyik minőségi ismérv nem alternatív.

Tételezzük fel, hogy a teljesítmény szerint vizsgált kapcsolatot kiterjesztették a döntetlenre is. A vizsgálat eredményét a 35. tábla tartalmazza:

16.5. táblázat - A csapat eredményei

Játékhely A vizsgált csapat eredménye Összesen

Győzelem Vereség Döntetlen

Város 30 9 9 48

Község 6 15 11 32

Összesen: 36 24 20 80

Kapcsolatvizsgálatok

Forrás: Saját számítás

A függetlenséget feltételező gyakoriságok:

16.6. táblázat - Gyakoriságok függetlenség esetén

Játékhely A vizsgált csapat eredménye Összesen

Győzelem Vereség Döntetlen

Otthon 21,6 14,4 12 48

Idegenben 14,4 9,6 8 32

Összesen: 36 24 20 80

Forrás: Saját számítás

A χ2-eloszlás értékét a 37. tábla segítségével határozhatjuk meg:

16.7. táblázat - Munkatábla

Játékhely A vizsgált csapat eredménye Összesen

Győzelem Vereség Döntetlen

Otthon 3,266 2,025 0,75 6,041

Idegenben 4,9 3,037 1,125 9,062

Összesen: 8,166 5,062 1,875 15,103

Forrás: Saját számítás

A játékhely meghatározó képessége mintegy 9,4%-os, az ismérvek közötti kapcsolat gyengének mondható.

In document Bevezetés a sportstatisztikába (Pldal 67-71)