• Nem Talált Eredményt

Gyakori elemhalmazok és asszociációs szabályok

N/A
N/A
Protected

Academic year: 2023

Ossza meg "Gyakori elemhalmazok és asszociációs szabályok"

Copied!
100
0
0

Teljes szövegt

(1)

Gyakori elemhalmazok és asszociációs szabályok

Ilsinszki Balázs

!

2014. 03. 10.

Nagyméretű adathalmazok kezelése

(2)

Anyag felosztása

1. Gyakori elemhalmazok 2. Asszociációs szabályok

(3)

Anyag felosztása

1. Gyakori elemhalmazok 2. Asszociációs szabályok

Pelenka Sör

valószínűleg

(4)

Probléma

Közös polcra

Kedvezmény

Árúkapcsolás

...

Melyik termékeket veszi együtt sok vásárló?

(5)

Probléma

Közös polcra

Kedvezmény

Árúkapcsolás

...

Melyik termékeket veszi együtt sok vásárló?

Van jobb ötlet?

(6)

Probléma

Melyik termékeket veszi együtt sok vásárló?

Pelenka Sör

valószínűleg

Haszon

Akció:

vásárlói elégedettség Pszt!

(7)

Anyag felosztása

1. Gyakori elemhalmazok 2. Asszociációs szabályok

(8)

Anyag felosztása

1. Gyakori elemhalmazok

1.1 Fogalmak

1.2 Előkészítés és adatok tárolása 1.3 A probléma matematikai oldala 1.4 Egyszerű algoritmus

1.5 GYEK algoritmusok 1.6 APRIORI algoritmus

1.7 További GYEK algoritmusok

(9)

Anyag felosztása

1. Gyakori elemhalmazok

1.1 Fogalmak

1.2 Előkészítés és adatok tárolása

(10)

1.1 Fogalmak

I = {i1,i2,...,im}

tranzakció: tj ⊆ I

bemeneti sorozat:

Termék

Vásárlás

Vizsgált vásárlások

(11)

J ⊆ I elemhalmaz

fedése: azon tranzakciók sorozatával, aminek részhalmaza a J.

támogatottsága: a fedés elemszáma. supp(J)

gyakori: támogatottsága nem kisebb egy előre megadott támogatottsági küszöbnél. min_supp

gyakoriság és gyakorisági küszöb: supp(J) / |T|

(12)

Anyag felosztása

1. Gyakori elemhalmazok

1.1 Fogalmak

1.2 Előkészítés és adatok tárolása 1.3 A probléma matematikai oldala

(13)

1.2 Előkészítés

Tranzakció elemeket lexikografikusan lehet rendezni, azaz lehet rendezést definiálni az elemek I halmazán.

E l e m e k h e z c í m k e r e n d e z é s e : A , B , C hozzárendelése egy-egy elemhez. Vásárlások:

T := <{ABD},{CE},{AFG},{BDCE}>

(14)

Tárolás

Bemeneti sorozat tárolása:

Horizontális adatbázis

Vertikális adatbázis: Előnyös

Relációs adatbázis

(15)

Anyag felosztása

1. Gyakori elemhalmazok

1.2 Előkészítés és adatok tárolása 1.3 A probléma matematikai oldala 1.4 Egyszerű algoritmus

(16)

1. 3 Keresési tér

Irányított gráf:

Csúcsok: elemhalmazok, például: I1, I2, I3, I4.

Élek: I1⊂I2, |I1| + 1 = |I2|

A, B, C

A, B

I4

I1

A, C

I2

B, C

I3

A

B

C

I5

I6 I7

(17)

1.3 Keresési tér mérete

Elemek száma: 10^5 - 10^6

Tranzakciók száma:10^9 - 10^10 Szerencsére:

Gyakori elemhalmazok mérete kicsi

|tj| << |I|

(18)

–Leonardo da Vinci

“Simplicity is the ultimate sophistication.”

(19)

Anyag felosztása

1. Gyakori elemhalmazok

1.3 A probléma matematikai oldala 1.4 Egyszerű algoritmus

1.5 GYEK algoritmusok

(20)

1.4 Egyszerű algoritmus

Minden tranzakciót egyszer olvasunk be. Minden tranzakció minden részhalmazához számlálót

hozunk létre vagy létező számláló esetén növeljük az értéket.

Eredmény:

Optimális IO művelet szempontjából.

Számlálók száma 2^|tj| miatt nagy memóriaigény.

(21)

Anyag felosztása

1. Gyakori elemhalmazok

1.4 Egyszerű algoritmus 1.5 GYEK algoritmusok 1.6 APRIORI algoritmus

(22)

1.5 GYEK algoritmusok

Gyakori elemhalmazokat kinyerő algoritmus

!

Két elvárás:

Teljes: ha minden gyakori elemhalmazt megtalál.

Helyes: ha csak a gyakori elemhalmazokat találja meg.

(23)

1.5 GYEK működése

Három lépés ismételgetése:

Jelöltek állítása: ismétlés nélkül!

Támogatottság meghatározása

Gyakoriak kiválasztása

(24)

Anyag felosztása

1. Gyakori elemhalmazok

1.5 GYEK algoritmusok 1.6 APRIORI algoritmus

1.7 További GYEK algoritmusok

(25)

1.6 APRIORI algoritmus

Jellemzői:

Egyik legkorábbi GYEK algoritmus.

Szélességi bejárást valósít meg a keresési térben.

Minden iterációban az adott szint elemeivel foglalkozik. A halmaz elemszáma minden iterációban eggyel nő.

(26)

1.6 APRIORI működése

Jelölések:

l szintszám

Jl: az l-elemű jelöltek halmaza

Gyl: az l-elemű gyakori elemhalmazok

Bodon Ferenc, Buza Krisztián: Adatbányászat

(27)

1.6 APRIORI működése

Jelölések:

l szintszám

Jl: az l-elemű jelöltek halmaza

Gyl: az l-elemű gyakori elemhalmazok

Bodon Ferenc, Buza Krisztián: Adatbányászat

(28)

1.6.1 Jelöltek előállítása

l-elemű gyakori elemhalmazok ismertek. Olyan párokat keresünk J1, J2, amire teljesül:

J1 lexikografikusan megelőzi J2-t.

J1-ből és J2-ből a legnagyobb elemet törölve ugyanazt a halmazt kapjuk.

Új jelölt := J1 U J2. Az új jelölt l+1 elemű lesz. Az új jelölt generátorai J1 és J2.

(29)

1.6.1 Jelöltek előállítása 2.

Jelölt előállítás kulcsa: Gyakori elemhalmaz minden részhalmaza gyakori! Ezért tudunk szintenként építkezni.

A jelölt előállítása ismétlés nélküli.

(30)

1.6.1 Jelölt előállítás példa

GY3 = {ABC, ABD, ACD, ACE, BCD}

ACD, ACE pár generálja ACDE-t jelöltnek?

(31)

Jelölt előállítás példa

GY3 = {ABC, ABD, ACD, ACE, BCD}

ACD, ACE pár:

ACD lexikografikusan megelőzi ACE-t.

ACD/D = ACE/E

ACDE halmaz NEM jelölt, mert nem minden részhalmaza gyakori: ACD, ACE, ADE, CDE.

(32)

1.6.1 Jelölt előállítás példa 2.

GY3 = {ABC, ABD, ACD, ACE, BCD}

ABC, ABD pár:

ABC lexikografikusan megelőzi ABD-t.

ABC/C = ABD/D

Tehát: ABC és ABD generálja ABCD-t. ABCD halmaz jelölt, mert minden részhalmaza gyakori:

ABC, ABD, ACD, BCD.

(33)

1.6.1 Jelölt előállítás észrevétel

Tehát: ABC és ABD generálja ABCD-t. ABCD halmaz jelölt, mert minden részhalmaza gyakori:

ABC, ABD, ACD, BCD.

Kérdések:

A B C D m i é r t j e l ö l t m i é r t n e m g y a k o r i elemhalmaz?

Az algoritmus miért három lépést ismételget?

(34)

1.6.1 Jelölt előállítás észrevétel 2.

Tehát: ABC és ABD generálja ABCD-t. ABCD halmaz jelölt, mert minden részhalmaza gyakori:

ABC, ABD, ACD, BCD.

Válasz: ABCD nem feltétlenül gyakori:

ABC min_supp tranzakcióban szerepel, ahogy ABD, ACD, BCD is.

ABCD támogatottsága 0.

(35)

1.6 APRIORI működése

Jelölések:

l szintszám

Jl: az l-elemű jelöltek halmaza

Gyl: az l-elemű gyakori elemhalmazok

Bodon Ferenc, Buza Krisztián: Adatbányászat

(36)

1.6 APRIORI működése

Jelölések:

l szintszám

Jl: az l-elemű jelöltek halmaza

Gyl: az l-elemű gyakori elemhalmazok

Bodon Ferenc, Buza Krisztián: Adatbányászat

(37)

1.6.2 Támogatottság meghatározása

Szófa segítségével:

É l e k e n e l e m e k c í m k é i találhatók.

Csúcsok élei rendezve vannak.

Működése:

A szófa bizonyos részeit rekurzívan járjuk be.

L e v é l e l e m e k n e k v a n számlálója.

Bodon Ferenc, Buza Krisztián: Adatbányászat

(38)

1.6 APRIORI működése

Jelölések:

l szintszám

Jl: az l-elemű jelöltek halmaza

Gyl: az l-elemű gyakori elemhalmazok

Bodon Ferenc, Buza Krisztián: Adatbányászat

(39)

1.6.3 Gyakoriak kiválasztása

Szófában töröljük azokat a leveleket, amiknek a

támogatottsága kisebb mint min_supp.

!

Az egész algoritmus során elég egy szófát karban

tartani!

Bodon Ferenc, Buza Krisztián: Adatbányászat

(40)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 0: kezdő lépés

(41)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 0: jelölt állítás

A Y

Mivel l=0, ezért a jelölt állítás során 1-elemű jelölteket kaptunk.

(42)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 1: támogatottság meghatározása

A Y

1 2 1 4 1 5 3 2 3 1 3

A tranzakciókat egyesével megvizsgálva növeljük a szófa leveleinek számlálóját.

(43)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 1: gyakoriak kiválasztása

A Y

1 2 1 4 1 5 3 2 3 1 3

Szófában töröljük azokat a leveleket, amiknek a támogatottsága kisebb mint min_supp.

(44)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 1: gyakoriak kiválasztása

A Y

1 2 1 4 1 5 3 2 3 1 3

(45)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 1: gyakoriak kiválasztása

Y

4 5 3 3 3

E K M O

GY1={E, K, M, O, Y}

(46)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 1: jelölt állítás

E K M O Y

K M O Y M

O Y

O Y

Y

Mivel l=1, ezért a jelölt állítás során 2-elemű jelölteket kaptunk. A szófában a gyökérből induló Y élre nincs szükség.

(47)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 1: jelölt állítás

E K M O

K M O Y M

O Y

O Y

Y

(48)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 2: támogatottság meghatározása

E K M O

K M O Y M

O Y

O Y

Y

4 2 3 2 3 3 3 1 2 2

(49)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 2: gyakoriak kiválasztása

E K M O

K M O Y M

O Y

O Y

Y

4 2 3 2 3 3 3 1 2 2

(50)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 2: gyakoriak kiválasztása

E K M O

K O M

O Y

4 3 3 3 3

A szófában az gyökérből induló M, O élekre nincs szükség.

(51)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 2: gyakoriak kiválasztása

E K

K O M O Y

4 3 3 3 3

(52)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 2: jelölt állítás

E K

K O M O Y

4 3 3 3 3

GY2={EK, EO, KM, KO, KY}

EK és EO generálja EKO-t?

(53)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 2: jelölt állítás

E K

K O M O Y

4 3 3 3 3

GY2={EK, EO, KM, KO, KY}

(54)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 2: jelölt állítás

E K

K O

M O

O Y Y

GY2={EK, EO, KM, KO, KY}

Lehetséges jelöltek

(55)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 2: jelölt állítás

E K

K O

M O

O Y Y

GY2={EK, EO, KM, KO, KY}

EKO jelölt:

EK, EO, KO

(56)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 2: jelölt állítás

E K

K O

M O

O Y Y

GY2={EK, EO, KM, KO, KY}

KMO NEM jelölt:

KM, KO, MO

(57)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 2: jelölt állítás

E K

K O

M O

Y Y

GY2={EK, EO, KM, KO, KY}

KMO NEM jelölt:

KM, KO, MO

(58)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 2: jelölt állítás

E K

K O

M O

Y Y

GY2={EK, EO, KM, KO, KY}

KMY NEM jelölt:

KM, KY, MY

(59)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 2: jelölt állítás

E K

K O

O

Y

GY2={EK, EO, KM, KO, KY}

KOY NEM jelölt:

KO, KY, OY

(60)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 2: jelölt állítás

E

K O

GY2={EK, EO, KM, KO, KY}

KOY NEM jelölt:

KO, KY, OY

(61)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 3: támogatottság meghatározása

E

K O

3

(62)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 3: gyakoriak kiválasztása

E

K O

GY3={EKO} 3

(63)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

l szintszám 3: jelölt állítás

E

K O

3

Nincsenek halmazpárok, akik új jelöltet tudnának generálni: ciklus vége!

(64)

1.6.4. Példa szófával

T1 EKMNOY T2 DEKNOY T3 AEKM T4 CKMUY T5 CEIKOO min_supp = 3

Eredmény

A ciklus futása során ezekkel a gyakori elemhalmazokkal találkoztunk:

GY1={E, K, M, O, Y}

GY2={EK, EO, KM, KO, KY}

GY3={EKO}

(65)

1.6 APRIORI memóriaigény

A cél a szófa csúcsszámának minimalizálása.

!

Té t e l : A m i n i m á l i s s z ó f a probléma NP-nehéz.

Bodon Ferenc, Buza Krisztián: Adatbányászat

(66)

1.6 APRIORI trükkök

Gyorsítási lehetőségek:

Tranzakciók első végigolvasása után a ritka elemek törlése.

l. iterációban az l-nél kisebb elemszámú tranzakciók törlése.

Tranzakció törlése ha már nincs benne jelölt.

Tranzakcióban a nem jelölt elemek törlése.

(67)

Anyag felosztása

1. Gyakori elemhalmazok

1.6 APRIORI algoritmus

1.7 További GYEK algoritmusok

(68)

1.7 Más GYEK algoritmusok

Eclat és FP-Growth:

Mélységi keresést hajtanak végre.

Rekurzív

Gyorsabbak, de nagyobb memóriaigény.

(69)

Anyag felosztása

1. Gyakori elemhalmazok

1.1 Fogalmak

1.2 Előkészítés és adatok tárolása 1.3 A probléma matematikai oldala 1.4 Egyszerű algoritmus

1.5 GYEK algoritmusok 1.6 APRIORI algoritmus

1.7 További GYEK algoritmusok

(70)

Anyag felosztása

1. Gyakori elemhalmazok 2. Asszociációs szabályok

(71)

Anyag felosztása

2. Asszociációs szabályok

2.1 Fogalmak

2.2 Szabályok előállítása 2.3 Probléma

2.4 Probléma forrása

2.5 Hierarchikus asszociációs szabályok 2.6 Asszociációs szabályok használata

(72)

Anyag felosztása

2. Asszociációs szabályok

2.1 Fogalmak

2.2 Szabályok előállítása

(73)

2.1 Asszociációs szabályok

Asszociációs szabály: I elemehalmaz és T bementi sorozat.

R egy c bizonyosságú és s támogatottságú asszociációs szabály, ahol I1 és I2 diszjunkt halmazok:

Érvényes asszociációs szabály:

min_supp támogatottság felett

min_conf bizonyosság felett

(74)

Anyag felosztása

2. Asszociációs szabályok

2.1 Fogalmak

2.2 Szabályok előállítása 2.3 Probléma

(75)

2.2 Szabályok előállítása

Lépések:

1. lépés: Gyakori elemhalmazok meghatározása (APRIORI algoritmus) s ≥ min_supp

2. lépés: Igy elemhalmazt bontsuk fel I1 és I2 diszjunk halmazokra: Igy = I1 U I2, majd a

bizonyosság ellenőrzése. Ha c ≥ min_conf, akkor érvényes asszociációs szabályt kaptunk.

Hány bontás van?

(76)

2.2 Szabályok előállítása

Elemhalmaz bontása:

I gyakori elemhalmaz bontása során I1 kiválasztva, ahol I1 I kiválasztva.

I1 -> I/I1 nem érvényes. Kell-e vizsgálni I1' -> I/I1', ahol I1' ⊂ I1 szabályt?

Például: I gyakori halmazra = { alma, banán, kolbász }

alma,

banán kolbász

c < min_conf

banán alma,

kolbász

c' ? min_conf

I1 I/I1 I1' I/I1'

(77)

2.2 Anti-monoton tulajdonság

I1 -> I/I1 nem érvényes. Kell-e vizsgálni I1' I1 szabályt?

A támogatottság anti-monoton tulajdonsága miatt nem.

I1' I1 a támogatottságok viszonya: supp(I1') ≥ supp(I1)

alma,

banán kolbász

c < min_conf

banán alma,

kolbász

c' ? min_conf

I1 I/I1 I1' I/I1'

(78)

2.2 Anti-monoton tulajdonság

I1 -> I/I1 nem érvényes. Kell-e vizsgálni I1' I1 szabályt?

A támogatottság anti-monoton tulajdonsága miatt nem. I1' I1 a támogatottságok viszonya: supp(I1') ≥ supp(I1)

Példa:

I1 := {alma, banán}. Összesen öten vették ezt a kombinációt.

I1' := {banán}. Öten vettek {alma, banán} kombinációt és lehet, hogy van olyan, aki vett banánt, de nem vett almát.

(79)

2.2 Anti-monoton tulajdonság

I1 -> I/I1 nem érvényes. Kell-e vizsgálni I1' I1 szabályt?

A támogatottság anti-monoton tulajdonsága miatt nem.

I1' I1 a támogatottságok viszonya: supp(I1') ≥ supp(I1)

c bizonyosság:

(80)

Anyag felosztása

2. Asszociációs szabályok

2.2 Szabályok előállítása 2.3 Probléma

2.4 Probléma forrása

(81)

2.3 Levezetési szabály

Levezetési szabály, érvényes szabály I1 -> I2:

Minden I1 -> I2' is érvényes, ahol I2' ⊂ I2.

Minden I1∪ i -> I2'\{i} is érvényes.

!

Melyik szabályokat használjuk?

(82)

2.3 Problémák

Sok az érdektelen szabály.

Asszociációs szabályok száma túl nagy.

Asszociációs szabályok félrevezetőek lehetnek.

(83)

2.3 Problémák

Sok az érdektelen szabály.

Pontosabban a levezetési szabályok létezése miatt vannak szabályok, amiknek érdektelen speciális esetei vannak.

(84)

2.3 Problémák

Asszociációs szabályok száma túl nagy.

A küszöbértékek emelésével kevesebb lesz a szabály, de ekkor érdekes szabályokat is elveszíthetünk.

(85)

2.3 Problémák

Asszociációs szabályok félrevezetőek lehetnek.

Büfé példa:

100 ember HAmburgert, 100 ember HOt dogot és 100 ember HA és HO-ot vesz.

Minden HA vételhez vesznek MAjoznézt is. Más nem vesz MA-t.

HO -> MA egy érvényes asszociációs szabály. Nem szabad csökkenteni a HO árát!

(86)

Anyag felosztása

2. Asszociációs szabályok

2.3 Probléma

2.4 Probléma forrása

2.5 Hierarchikus asszociációs szabályok

(87)

2.4 Szabályok függetlensége

A bizonyosság a feltétele valószínűséget próbálja meg vizsgálni.

c bizonyosság:

Ha I1 és I2 elemhalmazok függetlenek, akkor a bizonyosság nem hordoz hasznos információt.

Függetlenségi mutatók bevezetése.

(88)

2.4 Szabályok függetlensége

X és Y események függetlenek egymástól, ha P(X, Y) = P(X) P(Y)

A lift függetlenségi mutató ezt igyekszik megragadni.

(89)

2.4 Szabályok függetlensége

További függetlenségi mutatók:

Empirikus kovariancia

Binomiális próba

F i s h e r- f é l e e g z a k t próba

(90)

2.4 Szabályok rangsora

Három paraméter, amit egyszerre kell figyelembe venni:

Támogatottság

Bizonyosság

Függetlenség

Hogyan rangsoroljuk az érdekes és érvényes szabályokat?

(91)

Anyag felosztása

2. Asszociációs szabályok

2.4 Probléma forrása

2.5 Hierarchikus asszociációs szabályok 2.6 Asszociációs szabályok használata

(92)

2.5 Hierarchikus

asszociációs szabályok

Kategóriákat figyelembe vevő asszociációs szabályok. A hierarchiát a termék-taxonómia rögzíti.

Hierarchikus asszociációs szabály: I2 egyetlen eleme sem őse I1 valamely elemének

(93)

2.5 Hierarchikus

asszociációs szabályok

Módosítások:

Gyakori elemhalmazok meghatározásánál a tranzakciókat ki kell egészíteni az elemek őseivel is.

A tranzakciók első vizsgálatakor csak a taxonómia gyökérelemeivel foglalkozunk.

Eredmény:

A szabályok száma tovább nő!

(94)

Anyag felosztása

2. Asszociációs szabályok

2.5 Hierarchikus asszociációs szabályok 2.6 Asszociációs szabályok használata

(95)

2.6 Korreláció vs ok-okozati kapcsolat

A és B között korreláció van. Ez azért lehet, mert:

A okozza B-t.

B okozza A-t.

C okozza A-t és B-t.

A és B egymást erősítik.

Véletlenek különös együttállása.

(96)

2.6 Korreláció vs ok-okozati kapcsolat

1. példa: Cipőben alvás fejfájással való ébredést okoz.

(97)

Korreláció vs ok-okozati kapcsolat

1. példa: Cipőben alvás fejfájással való ébredést okoz.

Alkohol

(98)

2.6 Korreláció vs ok-okozati kapcsolat

1. példa: Cipőben alvás fejfájással való ébredést okoz.

2. példa: A magassarkú cipő skizofréniát okoz.

3. példa: Azok a gyereket rövidlátók lesznek, akik égő lámpa mellett alszanak. [Nature, 1993]

(99)

2.6 Korreláció vs ok-okozati kapcsolat

1. példa: Cipőben alvás fejfájással való ébredést okoz.

2. példa: A magassarkú cipő skizofréniát okoz.

3. példa: Azok a gyereket rövidlátók lesznek, akik égő lámpa mellett alszanak. [Nature, 1993]

Valóság másként működhet: Ha elfogy a tok akkor nem lehet egy helyen megvenni a három terméktípust.

fényképezőgép -> memóriakártya

fényképezőgép -> tok

(100)

Köszönöm a figyelmet!

Bodon Ferenc, Buza Krisztián: Adatbányászat

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

Ве1%уо%уазгаИ КНтка, Сазг1гоеп1его16ргаг Тапзгёк 8 Рёсзг Тикотапуе%уе1ет, АкаМпоз ОгуозЫкотапуг Каг, 1.зг.. Ве1%уд%уазгаЫ КНтка, КагсНо16%шг ёз

Apparent efficiency of serially coupled columns in isocratic and gradient elution 152.

ruptis indicis vocibus sufficienter elu cet, quid discrim inis intersit hodiernam inter in ­ dicant et hungaram nativam nobis

Németh Andor s Földnélküly János„ /Karinthy Frigyes és Lengyel Menyhért vígjátéka a Belvárosi

Nuclear Training Reactor of the Technical University Budapest Received February 8. Presented by Dir. In the practice one uses a discrete interval description of the

A relatively simple optical method to control uniformity of surface roughness in a wide roughness range, and a measuring head that can be mounted on CNC

Vagy egyszerűen, túl- erőben voltak, többen lehettek, mint azok heten, és arra ment a harc, hogy kifosszák őket, ami nyilván sikerült is nekik, mert különben jóval több

If the 95% confidence interval is calculated for the expected value from 100 different sample, than approximately 95 interval contains the true expected value out of the 100.