4. Létező párosítási helyzetek megvizsgálása
4.5. Szimulációs eredmények
4.5.1. Eredmények
A random generált értékekből készült futtatások adatainak normalitását vizsgálva meg-állapítottam, hogy az értékek eloszlásának ferdesége a különböző algoritmusok által generált párosítások száma (MP, GSP, BP, a Mohó, Gale-Shapley, és Bostoni algorit-mus által generált párosításokban a párok száma) esetében nem volt tendenciózus, de az értékek (ME, GSE, BE, a Mohó, Gale-Shapley, és Bostoni algoritmus által generált pá-rosításokban a számított értékek eredménye) eloszlása mindig közelebb volt a normál eloszláshoz. A grafikonokon ábrázolt függvények megszakadása jelzi, hogy a sokaság adatainak szórása nulla, azaz minden hallgató párosításra került, mint például a két he-lyet hirdető kurzusoknál a 10 alternatíva felkínálásakor (47. ábra).
47 ábra – 2 hely van a kurzuson (az x tengely a kiválasztható helyek száma)
48 ábra – 3 hely van a kurzuson (az x tengely a kiválasztható helyek száma)
49 ábra – 4 hely van a kurzuson (az x tengely a kiválasztható helyek száma)
A random generált értékekből készült futtatások adatainak normalitását vizsgálva meg-állapítottam, hogy az értékek eloszlásának csúcsossága a különböző algoritmusok által generált párosítások száma esetében nem tendenciózus, de az értékek eloszlása mindig közelebb van a normál eloszláshoz.
50 ábra – 2 hely van a kurzuson (az x tengely a kiválasztható helyek száma)
51 ábra – 3 hely van a kurzuson (az x tengely a kiválasztható helyek száma)
52 ábra – 4 hely van a kurzuson (az x tengely a kiválasztható helyek száma)
A különböző algoritmusok által generált párosítások számát (53 táblázat), és az általuk elért hasznosságértékeket (55 táblázat) a következő két táblázat tartalmazza. Jól látszik, hogy a különböző algoritmusokkal alkotott párosítások átlagértéke közt a legnagyobb eltérés is csupán 0,17, ami elhanyagolható, 5%os hibahatáron belüli érték. Az is jól áb-rázolódik, hogy mind a jelentkező által megadott helyek száma, mind pedig az adott kurzuson meghirdetett helyek száma pozitívan hatott a kialakult párok számára. Az is jól látható, hogy a Gale-Shapley vezet az adott körülmények közötti legmagasabb szá-mú párhoz.
a jelentkező által megadott helyek száma
Boston 17,40 19,97 20,00
53 táblázat - A különböző párosítási algoritmusok által generált párosítások száma a választható helyek függvényében
54 ábra - A különböző párosítási algoritmusok által generált párosítások száma a választható helyek függvé-nyében
A táblázatos adatokat grafikonon ábrázolva jól vizualizálható, hogy minél több hely van egy-egy kurzuson, annál több pár hozható létre - annál jobb eredmény érhető el a páro-sítással. Az is egyértelműen leolvasható, hogy a betöltött helyek számának növekedése nem a választott párosítási algoritmus függvénye, mindhárom algoritmus esetében be-következik.
Mohó GS Boston Mohó GS Boston Mohó GS Boston Mohó GS Boston Mohó GS Boston
1 2 3 4 5 6 7 8 9 10
2 hely a kurzuson 3 hely a kurzuson 4 hely a kurzuson
a jelentkező által megadott helyek száma 2 hely a kurzuson 3 hely a kurzuson 4 hely a kurzuson
55 táblázat – A különböző párosítási algoritmusok által generált hasznosság étékek a választható helyek függvényében
56 ábra - A különböző párosítási algoritmusok által generált hasznosság étékek a választható helyek függvé-nyében
A párosítások számával szemben az algoritmusok által generált párosítások értékeinél szignifikáns eltérések mutatkoznak: a Mohó tendenciózusan alacsonyabb hasznosságot generált, mint a GS, és a különbség egyre nőtt, ahogy nőtt a kurzuson levő helyek szá-ma, de csökkent a hallgatók által megjelölhető helyek számának növekedésével.
Meglepő eredmény, hogy a Boston algoritmus segítségével elért párosítás össz-hasznossága abban az esetben, amikor csupán két hely van a kurzusokon, valamint ami-kor a hallgatók csupán kevés alternatívát rangsorolnak alacsonyabb a Mohó algoritmus által kialakított párosításénál.
Ahogy a választható helyek száma és a kurzuson meghirdetett helyek száma nő, a Bos-ton algoritmus által kialakított párosítás egyre "jobbá válik" (magasabb abszolút és a Mohó algoritmushoz viszonyított relatív hasznosságot generál) - ami természetes az algoritmus belső logikája ismeretében. Az adatok tehát alátámasztják az elméleti rész-ben bemutatottakat. Ami a kutatás szempontjából igazán fontos, hogy ahogy nő a vá-lasztható helyek száma, úgy csökken a Gale-Shapley előnye a Bostonhoz képest, de az előny sose fordul át negatívba.
0 100 200 300 400 500 600 700
Mohó GS Boston Mohó GS Boston Mohó GS Boston Mohó GS Boston Mohó GS Boston
1 2 3 4 5 6 7 8 9 10
2 hely a kurzuson 3 hely a kurzuson 4 hely a kurzuson
Ahogy a Pearson korreláció is mutatja, a különböző algoritmusok által generált értékek között szignifikáns kapcsolat van (Szig.: 0,000). A következő táblázat a párosítások által generált értékek egymáshoz viszonyított kapcsolatát mutatja. Látszik, hogy a há-rom algoritmus által generált értékek páronként összefüggnek, azonban az is leolvasha-tó, hogy a kapcsolat erőssége változó.
M#GS GS#B M#B
2 hely 3 hely 4 hely 2 hely 3 hely 4 hely 2 hely 3 hely 4 hely
1 0,747 0,818 0,836 0,924 0,887 0,838 0,595 0,592 0,563
2 0,573 0,684 0,575 0,596 0,755 0,799 0,255 0,301 0,273
3 0,596 0,645 0,217 0,673 0,51 0,516 0,311 0,163 0,12
4 0,592 0,3 0,16 0,607 0,466 0,222 0,309 0,119 0,214
5 0,587 0,268 0,375 0,38 0,271 0,194 0,133 0,369
6 0,603 0,25 0,375 0,216 0,087 0,179 0,354 0,372
7 0,612 0,392 0,375 0,138 0,179 0,395 0,374
8 0,617 0,392 0,375 0,178 0,393 0,371
9 0,403 0,392 0,375 0,155 0,394 0,376
10 0,431 0,392 0,375 0,443 0,394 0,376
57 táblázat – A vizsgált algoritmusok által generált értékek viszonya
A 57. táblázatban azt vizsgáltam, hogy a különböző eljárások, által generált értékek átlagai valóban szignifikánsan különbözőek-e. Érdekes eredmény, hogy míg a Gale-Shapley-Boston és a Mohó-Gale-Shapley páronként szignifikánsan különböző, addig a Mohó- Boston nem, ahogy ez az átlagok különbségéből, és a korábbi átalagokat bemu-tató táblából is jól látszott. A Mohónál és a Bostonnál is szignifikánsan magasabb érté-keket generál a Gale-Shapley
Kérdés azonban, hogy a kapott különbség szignifikánsnak tekinthető-e. Ennek eldöntése érdekében számos peremfeltételt teljesítenie kell a vizsgált változóknak (a vizsgált cso-portokban az elemszám közel azonos, normál eloszlású, a függő változó szórása azonos a különböző csoportokban). A korábban bemutatott grafikonok eredményei alapján már csak a szórásra vonatkozó premisszát kell megvizsgálnom.
Mohó-G-S 1,849 ,179
58 táblázat – A Levene-próba eredménye
Levene-próba eredménye azt mutatja, hogy a szórások egyenlőségének feltétele csak a Mohó és a Boston algoritmusok eredményei esetében valósult meg. Ennek megfelelően a t-próba eredménye csak ebben az esetben megfelelő biztonságú.
4.5.2. Konklúzió
A fejezetben bemutatott eredmények tükrében elmondható, hogy a párosítások számát tekintve egyik algoritmus sem volt szignifikánsan jobb, mint a másik. Ezzel szemben az algoritmusok által generált párosítások hasznossági értékei eltérést mutatkoznak: a Mo-hó tendenciózusan alacsonyabb hasznosságot generált, mint a Gale-Shapley, és a kü-lönbség egyre nőtt, ahogy nőtt a kurzuson levő helyek száma, de csökkent a hallgatók által megjelölhető helyek számának növekedésével. Megfigyelhető volt továbbá, hogy a Boston először rosszabb eredményt hoz a Mohó algoritmusnál, majd a választható he-lyek és a kurzuson meghirdetett hehe-lyek számának növekedésével a generált hasznosság értékek egyre jobbá váltak.