• Nem Talált Eredményt

lineáris modellek

N/A
N/A
Protected

Academic year: 2022

Ossza meg "lineáris modellek"

Copied!
36
0
0

Teljes szövegt

(1)

ÁlLATGENETIKA

A projekt az Európai Unió támogatásával, az Európai Szociális Alap

társfinanszírozásával valósul meg.

Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP-4.1.2-08/1/A-2009-0010 projekt

Debreceni Egyetem

Nyugat-magyarországi Egyetem Pannon Egyetem

(2)

Lineáris algebra és

lineáris modellek

(3)

Lineáris algebra

Mátrix: általában számokból (változókból) alkotott sorokban és oszlopokban rendezett táblázat.

Minden mátrix n sorból és m oszlopból áll, így a mátrixokat n x m dimenziósnak (méretűnek) szokás nevezni.

ik

mn m

m

n n

a a

a a

a a

a

a a

a A

1 1

2 22

21

1 12

11

(4)

A egyetlen sorból álló mátrixot sormátrixnak, az egyetlen oszlopból álló mátrixot oszlopmátrixnak

nevezzük.

13 12

11

a a

a A

31 21 11

b b b B

Az egyetlen sorból és egyetlen oszlopból álló mátrix egyetlen szám (skalár).

(5)

Mátrixok darabolása

B d

b a

2 1

1

4 5

2

2 1

3

2 1

1

4 5

2

2 1

3 C

3

a b 1 2

1 d 2

2 1

4 B 5

A kiindulási mátrixot több részmátrixra bontjuk

(6)

Mátrixműveletek

Összeadás Kivonás

Feltétele: A két mátrix dimenzióinak meg kell egyeznie.

2 1

0 A 3

1 2

2 B 1

3 3

2 B 4

A

C 1 1

2 B 2

A D

C b

a b

a B

A

ik mn ik mn ik ik mn

D b

a b

a B

A

ik mn ik mn ik ik mn

(7)

2 6

0 2

1 3

0

* 1 2 C

Szorzás

Szorzás skalárral

Két mátrix szorzása

Fontos!

k m m

n k

n

A * B

C

20 15

8 4 6

3 5 *

C 2 A

* B B

* A

aij

* k A

* k C

p

1 k

kj ik

pj ip

j 2 2

i j

1 1

i

ij a *b a *b a *b a *b

C 

(8)

Mátrixműveletek szabályai

T T T

A

* B

B

* A

C

* B

* A C

* B A

C

* B C

* A C

* B A

C

* A B

* A C

B

*

A

(9)

Transzponálás (AT v. A’ )

2 1

1

4 5

2

2 1

3 A

2 4

2

1 5

1

1 2

3

2 1

1

4 5

2

2 1

3 A

T T

T T

T T

A

* B

* C C

* B

* A

Egy A mátrixból a sorok és oszlopok felcserélésével

képzett mátrixot az A mátrix transzponáltjának nevezzük.

(10)

Egységmátrix (E)

A E

* A

0 0

0

0 1

0

0 0

1 E

j i

, 0

j i

, E

ij

1

A A

*

E

(11)

Invertálás (A -1 )

1

1

* A E A * A

A

d c

b A a

1 1 1

A

* B

B

* A

a c

b

* d c

* b d

* a A

1

1

Ha det(A)<>0, az inverz létezik, és az A mátrix nem-

szinguláris. Ha det(A)=0, az A mátrix szinguláris, és

nem létezik egyetlen inverze (általánosított inverze

viszont igen).

(12)

Invertálás (A -1 )

4 2

5 A 3

22 3

22 2

22 5

22 4

3 2

5

* 4 22

1 3

2

5

* 4 ) 2 (

* 5 4

*

3

A

1

1

(13)

Ismert együtthatók mátrixa

Inverz mátrix felhasználása – egyenletrendszerek megoldása

c

* A

x

c

* A

x

* A

* A

c x

* A

1

1 1

Kiszámítandó ismeretlenek oszlopvektora

Ismert együtthatók oszlopvektora

(14)

Inverz mátrix felhasználása –

egyenletrendszerek megoldása - példa

1 x

3 x

4 x

2 x

4 x

3 x

1 x

3 x

3 x

3 2

1

3 2

1

3 2

1

3 4 1

4 3 1

3 3 1 A

0 1

1

1 0

1

3 3

7 A 1

1 0

2

1 2 1

* 0 1

1

1 0

1

3 3

7 c

* A

x 1

1 2 1 c

(15)

Lineáris modellek

A mért függő változók oszlopvektora

* X y

Az egyenletrendszerben a becsülni kívánt változókhoz

tartozó együtthatók

A becslési hiba oszlopvektora Normál eloszlású,

átlaga nulla

Az általánosított lineáris modell alakja:

A becsülni kívánt változók

oszlopvektora

(16)

Lineáris modellek

A függő „y” változó lineáris függvénnyel történő leképezése több független (vagy becslő ) változóval.

A többváltozós regressziós modell a legegyszerűbb lineáris modell.

n n

2 2 1

1

x x x

y 

A βi regressziós együtthatók jelentése: Az xi egy egységnyi változása, amennyiben a többi változó állandó, βi mértékű változást eredményez y-ban.

A modell paramétereit az egyváltozós regresszióhoz hasonlóan a legkisebb négyzetek elvével határozzák meg, ahol a hibanégyzetek összegének

minimalizálása a cél.

(17)

Becslő és Indikátor változók

Tételezzük fel, hogy „p” apaállat ivadékainak adatai ismertek.

A lineáris modell a következő:

ij i

ij s

Az i. apától származó y

j. ivadék adata

A főátlag. Ez teszi lehetővé, hogy si átlaga nulla legyen, és

si értékei az átlagtól vett eltérést fejezzék ki.

A j. ivadék eltérése az i.

apaállat családátlagától.

Varianciája a családon belüli varianciát becsüli.

A becsülni kívánt apaállatok hatásának

oszlopvektora

(18)

Becslő és Indikátor változók

ij i

ij s

y

Tételezzük fel, hogy „p” apaállat ivadékainak adatai ismertek.

A lineáris modell a következő:

A fenti modellt átírhatjuk lineáris modellé indikátorváltozók használatával.

Az indikátorváltozó:

ij p

1 k

ik x

ij * x

y

i sire

, 0

i sire

, x

ik

1

A lineáris modell a következő:

(19)

Az indikátorváltozókat tartalmazó modelleket ANOVA, vagy varianciaanalízis modelleknek hívjuk.

Azokat a modelleket, amelyekben a főátlagon kívül nincsenek indikátorváltozók, együtthatóik folytonos, vagy diszkrét

értékek lehetnek, regressziós modelleknek nevezzük.

Mindkettő az Általánosított Lineáris Modell (General Linear Model /GLM/) speciális esete.

ijk ijk

ij i

ijk s d *x

y

ANOVA modell

regressziós modell

Példa: féltestvér/teljestestvér modell, a tulajdonságot a β az életkorra korrigálja.

(20)

Lineáris modellek mátrixalakja

Legyen adott három változó, és négy mérési vektor.

i 3

i 3 2

i 2 1

i 1

i

x x x

y

Mátrix alakban: y X

4 3 2 1

y y y y y

3 2 1

43 42

41

33 32

31

23 22

21

13 12

11

x x

x

x x

x

x x

x

x x

x X

4 3 2 1

A becsülni kívánt

paraméterek Az együtthatók mátrixa

(21)

Az apamodell mátrixalakja

A modell:

y

ij

s

i ij

Tételezzünk fel három apaállatot. Az elsőnek kettő, a másodiknak egy, a harmadiknak három ivadéka van.

A GLM az alábbiak szerint néz ki:

33 32 31 21 12 11

y y y y y y

y

3 2 1

1 0

0 1

1 0

0 1

1 0

0 1

0 1

0 1

0 0

1 1

0 0

1 1

X

33 32 31 21 12 11

(22)

Legkisebb négyzetek módszere (Ordinary Least Squares /OLS/)

Ha a hibavektor elemei (a rezidiumok) normál eloszlásúak, az OLS megoldása visszavezethető a Maximum-Likelihood módszerre.

Ha a rezidiumok homogének, és korrelálatlanok, σ2(ei)= σe2, σ(ei,ej)=0. Ezért minden rezidiumnak azonos súlya van.

Xb y

y ˆ y

Amennyiben β-t b-vel becsüljük, és az y értékek becslésére ebből értékeket számítunk, a hibavektor a következő lesz:

A hibák négyzetösszege a következők szerint számítható:

Xb y

* Xb

y eˆ

* eˆ

T T

n

1 i

2

y becslése

(23)

Ha vesszük a mátrixok deriváltjait, látható, hogy a becslések kielégítik a következő összefüggést:

y

* X

* X

* X

b

T 1 T

Ez az OLS becslése a β vektornak.

Mivel a hibavektor elemei korrelálatlanok és homogének, a b mátrix elemei közötti kovariancia:

2 e T 1

b

X * X *

V

A /Var(e)/ a képlettel becsülhető,

ahol a rang(X) az X együttható-mátrix egymástól független oszlopainak számát jelöli.

) X ( rang n

* ) eˆ

e ( Var

T 2

e

(24)

Példa: Regresszió az origón keresztül

i

i

e

X

* y

Ahol és ,

amiből:

T n 2

1

x x

x

X 

n

1 i

2 i

T

X x

X

n

1 i

i i

T

y x * y

X

β OLS becslése, valamint a becsült varianciák az alábbiak:

2 i

i T i

T 1

x y

* y x

* X

* X

* X

b

2

( b ) ( X

T

* X )

1

(25)

Példa: Polinomiális regresszió és interakció

i 2

i 2

i 1

i

* x * x e

y

Az általánosított lineáris modell (GLM) egyszerűen kezeli a becslő változók különböző függvényeit, így a becsülni kívánt paraméterek lineárisak maradnak. Pl.: y=α+β1*f(x)+β2*g(x)+…+e

Kvadratikus regresszió:

2 1

2 n n

2 2 2

2 1 1

x x

1

x x

1

x x

1

X

(26)

i 2

i 2

i 3

2 i 2

1 i 1

i

* x * x * x * x e

y

Az interakciókat (pl. ivar x életkor) is hasonlóan kezeli:

Ha az x1-et állandónak vesszük, x2 egységnyi változása y-t β23*x1 mértékben változtatja meg.

Hasonlóképpen, az x1 egységnyi változása y-t β12*x2 mértékben változtatja meg.

3 2 1

2 n 1

n 2

n 1

n

22 21

22 21

21 11

21 11

x

* x x

x 1

x

* x x

x 1

x

* x x

x 1

X

(27)

Hatások figyelembe vétele fix, vagy random hatásként

A lineáris modellek két nagy célnak próbálnak megfelelni:

•a modell paramétereinek becslése,

•a megfelelő varianciák becslése

Például a legegyszerűbb regressziós modellben (y=α+β*x+e)

α és β értékeit, valamint e varianciáját becsüljük. Természetesen ei=yi-(α+ β*xi) értékeket is tudjuk becsülni.

Fontos, hogy az α ésβ értékek, amelyeket becsülni kívánunk,

állandó hatások (fix faktorok ), míg az ei értékek egy eloszlásból származnak. Az ei-t ezért véletlen hatásnak (random effektnek) tekintjük.

(28)

A „vegyes” („mixed”) modellek állandó és véletlen hatásokat egyaránt tartalmaznak.

Az állandó és véletlen hatások közötti ilyen megkülönböztetés különösen fontos a modellek elemzésekor.

Ha a becsülni kívánt paraméter állandó konstans, akkor az állandó hatás.

Ha a becsülni kívánt paraméter valamilyen eloszlásból származik, és erre az eloszlásra mi következtetéseket kívánunk levonni, akkor véletlen hatás.

Általában az állandó hatások becsléséről, és a véletlen hatások előrejelzéséről beszélünk.

(29)

Példa: apa modell

ij i

ij

s e

y

állandó hatás

véletlen hatás állandó, vagy véletlen

hatás?

Attól függ. Amennyiben van 10 apaállatunk, és mi CSAK ennek a 10 apaállatnak az értékére vagyunk kíváncsiak, nem

vizsgáljuk a populáció egyéb részét, akkor tekinthetjük

ÁLLANDÓ hatásnak. Ebben az esetben a μ, s1-től s10-ig az apaállatok, és σ2e becslése szükséges, és a modellt az

yij=μ+si+eij, 2(eij) = 2e alakban írhatjuk fel.

(30)

Példa: apa modell

ij i

ij

s e

y

Hasonlóképpen, amennyiben nemcsak ez a 10 apaállat érdekel minket, hanem a kiindulási populációra is szeretnénk

következtetéseket levonni, akkor az si-t VÉLETLEN hatásnak tekintjük. Ebben az esetben a μ-t, és a σ2s, σ2w varianciákat becsüljük. Mivel az si értékek becsülik (vagy előrejelzik) az i.

apaállat tenyészértékét, ezeket szintén becsülni (előrejelezni) szeretnénk. A véletlen hatásként történő figyelembevétel esetén a modellt az yij=μ+si+eij, 2(eij) = 2e, 2(si) = 2s alakban

írhatjuk fel.

(31)

Általánosított Lineáris Modell (GLS)

Tételezzük fel, hogy a hibaértékek (rezidiumok) eloszlásának nem ugyanolyan a varianciája (pl.

heterogenitást mutat). Természetesen a súlyozott

hibanégyzetek összegét nem szeretnénk minimalizálni,

mivel ezek az összegek alacsonyabb varianciánál nagyobb súlyokat kapnának.

Hasonlóképpen, amennyiben a hibaértékek korrelálnak, ezt ugyancsak figyelembe kívánjuk venni (pl. egy megfelelő

átalakítással megszüntetni a korrelációt) a négyzetösszegek minimalizálása előtt.

A fenti esetek mindegyikére az OLS megoldás helyett a GLS megoldás szükséges.

(32)

A GLS modellben a hibaértékek „e” vektorának kovariancia mátrixát „R” jelöli, ahol Rij = (ei,ej).

A lineáris modell alakja: y = Xb + e, cov(e) = R A GLS módszerrel „b” becslése β-ra:

A becslő modell variancia-kovariancia értékei az alábbiak szerint számíthatók:

y

* R

* X

* )

X

* R

* X (

b

T 1 1 T 1

2 e 1

1 T

b

( X * R * X ) *

V

(33)

A modell yi = + xi alakú, ahol

Példa

) w ,

w , w ( Diag

R 11 21 n1

A hibaértékek korrelálatlanok, de heterogén eloszlásúak, (ei) /wi

Például, az i. minta az átlaga az ni egyednek, ahol

2(ei) = e2/ni. Itt wi = ni

n 1

x 1

x 1

X  

(34)

Előadás összefoglalása

• Mátrixműveletek (összeadás, kivonás, szorzás, invertálás)

• Lineáris modellek általános alakja

• Legkisebb négyzetek módszere és az általánosított legkisebb négyzetek módszere

• Tényezők figyelembevétele állandó, vagy véletlen hatásként

(35)

Előadás ellenőrző kérdései

• Számítsa ki a mátrix inverzét!

• Mi a feltétele két mátrix szorzásának?

• Hogyan néz ki az általánosított lineáris modell (GLM)?

• Mi alapján dönti el, hogy egy tényezőt állandó, vagy változó hatásként vesz figyelembe a modellben?

• Mi a különbség az OLS és a GLS módszerek között?

3 5

4 2

(36)

KÖSZÖNÖM FIGYELMÜKET

Következő

ELŐADÁS/GYAKORLAT CÍME

Tenyészértékbecslés, BLUP

Előadás anyagát készítették:

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

De talán gondolkodásra késztet, hogy hogyan lehet, illetve lehet-e felülkerekedni a hangoskönyvek ellen gyakran felvetett kifogásokon, miszerint a hangos olvasás passzív és

Krugman mint írja: „Azt gondol- nánk, hogy ha meg akarjuk becsülni, hogyan hatnak az állami kiadások a gazdaságra, akkor egyszerűen csak meg kell néznünk a korrelációt

Ehhez ismerni kellene az egyes sebességi állandókat, mert ha a k2 termékképzési sebességi állandó olyan kicsi, hogy csak elhanyagolható változást okoz a konstans

Ha a valószínűségi változó elméleti jellemzője az a paraméter, és az statisztikai mintából kívánjuk becsülni, akkor elvárjuk, hogy az statisztika értékei

differenciálegyenlet megoldásait lényegében csak akkor tudjuk konkrét képlettel kiszámolni, ha az egyenlet állandó együtthatós (homogén vagy inhomogén)

Lineáris egyenletrendszer paraméterei az és a , ezért három modellt állíthatunk fel, annak megfelelően, hogy csak az egyik, csak a másik, vagy mind a két paraméter

A statisztikai hatás vizsgálatához az adatbázisból nyert adatokat minden egyes paraméter esetén könnyen értékelhető tartományokba rendeztük, és vizsgáltuk, hogy

• Meg kell tudnunk becsülni, hogy mi a lehetséges események bekövetkezésének