Relációsémák felbontása - Dr. Balázs Péter, egyetemi docens Dr. Németh Gábor, adjunktus

6. Normalizálás 46

6.3. Relációsémák felbontása

• X⁽³⁾ = {A₁, A₃, A₄, A₅, A₇} és a halmaz nem bővíthető, azaz {A₁}⁺ ={A₁, A₃, A₄, A₅, A₇}.

A szuperkulcs és a funkcionális függés definíciója alapján adódik, hogy egy K ⊆A attribútumhalmaz akkor és csak akkor szuperkulcs, haK → A, vagy másként, haK⁺=A. Ez alapján és a fenti algoritmus segítségével már megadhatunk egy eljárást, amellyel meg tudjuk határozni egy séma kulcsát.

Legyen kezdetben K =A, ami mindig szuperkulcs, majd hagyjunk el K-ból sorra attribútumokat és ellenőrizzük, hogyK⁺=A még teljesül-e.

6.2.3. példa hal-maz már nem szűkíthető úgy, hogy még szuperkulcs maradna, azaz K ={A₁, A₂} kulcs.

Az attribútumhalmaz lezártjához hasonlóan egy függéshalmaz lezártjátis meghatározhatjuk. Egy F függéshalmaz F⁺ lezártján az F-ből levezethető összes függést tartalmazó halmazt értjük. AzF⁺egy bázisának nevezzük egy olyan részhalmazát, amelyből F valamennyi függése levezethető. Belátható, hogy F⁺ = {X → Y|Y ⊆ X⁺}. Ez alapján az F⁺ halmaz a következő algoritmussal határozható meg.

1. Vegyük az összes lehetséges X ⊆ A részhalmazt és határozzuk meg hozzá annak X⁺ lezártját.

2. Minden Y ⊆X⁺-ra vegyük fel az X →Y függést F⁺-ba.

6.3. Relációsémák felbontása

Ebben a fejezetben azt mutatjuk be, hogy hogyan bontható fel egy reláció-séma kisebb sémákra úgy, hogy a redundancia csökkenjen.

Legyen R(A) egy relációséma, és X, Y ⊂ A úgy, hogy X ∪Y = A és X∩Y 6=∅. Az R(A) séma felbontása (dekompozíciója) X és Y szerint egy

R₁(X) és egy R₂(X) sémát jelent. Az R séma feletti T táblát pedig az R₁ feletti T₁ =π_X(T) és azR₂ = felettiT₂ =π_Y(T) táblákkal helyettesítjük.

Belátható, hogy tetszőleges felbontás esetén T ⊆T1 onT2. Ehhez azt kell megmutatnunk, hogy tetszőleges t ∈ T sor esetén léteznek olyan t₁ ∈ T₁ és t₂ ∈T₂ sorok, hogyt₁ és t₂ összekapcsolásával éppen a t sort kapjuk. Ennek azonban éppen megfelel az a t1 ∈T1 sor, amit a t ∈T sorπX projekciójával kapunk, valamint az at₂ ∈T₂sor, amit at ∈T sorπ_Y projekciójával kapunk.

Ekkor ugyanist(X) =t₁(X) és t(Y) =t₂(Y), továbbá X∩Y 6=∅ miatt a t₁ ést₂ sorok összekapcsolhatók, éppen a t∈T sort eredményezve.

Egy felbontást hűségesnek nevezünk, ha T ⊇ T₁ on T₂ is teljesül, azaz T =T₁ onT₂.

6.3.1. példa

A FÓRUM_KÖVETÉSE tábla esetében az

X ={felhasználónév,email,név,hírfolyam azonosító}, Y ={hírfolyam azonosító,megnevezés}

mentén vett felbontás hűséges. Az alábbi táblákat eredményezi, melyek természetes összekapcsolásával valóban éppen aFÓRUM_KÖVETÉSE táblát kapjuk:

Y ={email,név,hírfolyam azonosító,megnevezés}

mentén vett felbontás nem hűséges, hiszen az alábbi táblákat eredmé-nyezi:

6.3. RELÁCIÓSÉMÁK FELBONTÁSA 53

pbalazs@inf.u-szeged.hu Balázs Péter 1 Adatbázis kérdések

pbalazs@inf.u-szeged.hu Balázs Péter 2 PHP hírek

pbalazs@inf.u-szeged.hu Balázs Péter 4 Milyen gépet vegyek

pkardos@inf.u-szeged.hu Kardos Péter 2 PHP hírek

pkardos@inf.u-szeged.hu Kardos Péter 3 Ki a legjobb tanár gnemeth@inf.u-szeged.hu Németh Gábor 1 Adatbázis kérdések

gnemeth@inf.u-szeged.hu Németh Gábor 2 PHP hírek

gnemeth@inf.u-szeged.hu Németh Gábor 3 Ki a legjobb tanár bodnaar@inf.u-szeged.hu Bodnár Péter 4 Milyen gépet vegyek

Ezek összekapcsolása pedig egy, az eredetinél bővebb táblát eredmé-nyez.

T1noT2

felh. név email név hírfolyam azonosító megnevezés

pbalazs pbalazs@inf.u-szeged.hu Balázs Péter 1 Adatbázis kérdések gnemeth pbalazs@inf.u-szeged.hu Balázs Péter 1 Adatbázis kérdések

pbalazs pbalazs@inf.u-szeged.hu Balázs Péter 2 PHP hírek

pkardos pbalazs@inf.u-szeged.hu Balázs Péter 2 PHP hírek

gnemeth pbalazs@inf.u-szeged.hu Balázs Péter 2 PHP hírek

pbalazs pbalazs@inf.u-szeged.hu Balázs Péter 4 Milyen gépet vegyek bodnaar pbalazs@inf.u-szeged.hu Balázs Péter 4 Milyen gépet vegyek

pkardos pkardos@inf.u-szeged.hu Kardos Péter 2 PHP hírek

pbalazs pkardos@inf.u-szeged.hu Kardos Péter 2 PHP hírek

gnemeth pkardos@inf.u-szeged.hu Kardos Péter 2 PHP hírek

pkardos pkardos@inf.u-szeged.hu Kardos Péter 3 Ki a legjobb tanár gnemeth pkardos@inf.u-szeged.hu Kardos Péter 3 Ki a legjobb tanár gnemeth gnemeth@inf.u-szeged.hu Németh Gábor 1 Adatbázis kérdések pbalazs gnemeth@inf.u-szeged.hu Németh Gábor 1 Adatbázis kérdések

gnemeth gnemeth@inf.u-szeged.hu Németh Gábor 2 PHP hírek

pbalazs gnemeth@inf.u-szeged.hu Németh Gábor 2 PHP hírek

pkardos gnemeth@inf.u-szeged.hu Németh Gábor 2 PHP hírek

gnemeth gnemeth@inf.u-szeged.hu Németh Gábor 3 Ki a legjobb tanár pkardos gnemeth@inf.u-szeged.hu Németh Gábor 3 Ki a legjobb tanár bodnaar bodnaar@inf.u-szeged.hu Bodnár Péter 4 Milyen gépet vegyek pbalazs bodnaar@inf.u-szeged.hu Bodnár Péter 4 Milyen gépet vegyek

Ha a felbontás nem hűséges, akkor a kisebb táblák természetes összekap-csolásával általában nem állítható vissza az eredeti tábla. Ilyenkor új, az eredeti táblában nem szereplő (általában értelmetlen) sorok is keletkeznek, ami azt jelenti, hogy információt veszítünk a dekompozíció során. A célunk ezért az, hogy minden esetben hűséges felbontást alkalmazzunk. A következő tétel arra szolgáltat elegendő feltételt, hogy egy felbontás hűséges legyen.

6.3.1. tétel : Heath tétele

LegyenR(A) egy relációséma ésA=B∪C∪DazAattribútumhalmaz egy diszjunkt felbontása (azaz B∩C =∅, C∩D =∅ és B ∩D =∅).

Ha C →D, akkor azR₁(B ∪C), R₂(C∪D) felbontás hűséges.

Bizonyítás. LegyenT egy tetszőlegesRfeletti tábla ésT₁ valamintT₂ a szétbontás során kapottR₁ valamintR₂ feletti táblák. AT ⊆T₁ onT₂ a korábbiak alapján nyilvánvaló. Azt kell tehát bizonyítanunk, hogy T₁ on T₂ ⊆ T. Legyen t ∈ T₁ on T₂ egy tetszőleges sor. Ez egy T₁ -beli és egy T₂-beli sor összekapcsolásával állt elő, így kell, hogy legyen olyan t₁ ∈ T₁ és olyan t₂ ∈ T₂ sor, hogy t₁(C) = t₂(C). A T₁ és T₂ táblák viszont a T tábla projekciójaként adódtak (T₁ = πB∪C(T) és T₂ =πC∪D(T)), tehát létezik egy olyan u₁ ∈T sor, melyreu₁(B∪C) = t₁(B ∪C), továbbá létezik egy olyan u₂ ∈ T sor, melyre u₂(C∪D) = t₂(B∪C) . Mivelt₁(C) = t₂(C), ígyu₁(C) =u₂(C) is fennáll, de akkor aC →D miatt u₁(D) =u₂(D) is teljesül. Tehát u₁ =t, azaz t∈T.

6.3.2. példa

A FÓRUM_KÖVETÉSE tábla esetében a korábban már vizsgált X ={felhasználónév, email, név, hírfolyam azonosító}

Y ={hírfolyam azonosító, megnevezés}

mentén vett felbontás Heath-tétele szerint hűséges a B = {felhasználónév, email, név}, C = {hírfolyam azonosító}, D = {hírfolyam azonosító, megnevezés} választással.

Ha a függőségeket is figyelembe vesszük, akkor egy R(A, F) relációsé-ma felbontása X és Y szerint olyan R₁(X, F₁) és R₂(Y, F₂) sémákat jelent, aholF₁ úgy választandó, hogyF₁⁺ azF⁺azon részhalmazával egyezzen meg, amely csakX-beli attribútumokat tartalmaz,F₂pedig úgy választandó, hogy F₂⁺ az F⁺ azon részhalmazával egyezzen meg, amely csak Y-beli attribútu-mokat tartalmaz. Egy felbontást függőségőrzőnek nevezünk, ha F₁ ∪F₂ az F egy bázisát adják. Belátható, hogy egy hűséges felbontás nem feltétlenül függőségőrző.

In document Dr. Balázs Péter, egyetemi docens Dr. Németh Gábor, adjunktus (Pldal 51-54)