• Nem Talált Eredményt

Lineáris, vagy nem lineáris

N/A
N/A
Protected

Academic year: 2022

Ossza meg "Lineáris, vagy nem lineáris"

Copied!
61
0
0

Teljes szövegt

(1)

ÁLLATGENETIKA

A projekt az Európai Unió támogatásával, az Európai Szociális Alap

társfinanszírozásával valósul meg.

Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP-4.1.2-08/1/A-2009-0010 projekt

Debreceni Egyetem

Nyugat-magyarországi Egyetem Pannon Egyetem

(2)

Tenyészértékbecslés, BLUP

(3)

Best Linear Unbiased Prediction - Variancia

Szerkezet

(4)

Lineáris, vagy nem lineáris

Lineáris

Másodrendű polinom

i i

i i

i i

i

i

b b X b X b X b X b X X

Y

0

1 1

2 22

3 3

4 42

5

(

1 2

)    

Nem lineáris

i X b i

e

i

b

Y

0 1

  Y

i

ln   b b X

i

ln  

i

ln 

0

1

Log lineáris

(5)

Miért lineáris?

) ( X f

Y

A Taylor-sor:

!

) )(

(

! 2

) )(

(

! 1

) )(

) ( (

2 ''

'

n

a x

a f

a x

a f

a x

a a f

f Y

n

n

 

 

 

e

X

Y

Y

'

  e

X

Y

''

e

X

Ha a=0:

(6)

Az alacsonyabb rendű együtthatók fontosabbak, mint a magasabb rendűek

Más értékekre is hasonlóan működik, pl. a=0,1:

e

X

Y

1 ,

 0 a

904837 ,

1

0

,

0

e

Y

 

 1 2 ! 3 ! 4 !

4 3

2

x x

x x Y

9 , 0 1

, 0 1

1    

x

Y

905 ,

! 0 2

1 , 1 0

, 0

! 1 1 2

2

2

   

x

x Y

904833 ,

! 0 3

1 , 0

! 2

1 , 1 0

, 0

! 1 3

! 1 2

3 2

3

2

     

x x

x

Y

(7)

Általánosítva

Bármely, a háttérben lévő ismeretlen függvény közelíthető egy lineáris polinommal (Lineáris Modell).

• Az alacsonyabb rendű együtthatók fontosabbak, mint a magasabb rendűek

• A modell nem szükséges, hogy biológiai függvényen alapuljon

• Még a magas nem-lineáris rendszerek is közelíthetőek alacsonyabb rendű együtthatójú lineáris modellel

•Tisztán leíró

• Lehetővé teszi a modellben szereplő hatásokra vonatkozó hipotézisvizsgálatot

• Lehetővé tesz korlátozott becslést (a kifejtés egy pont körül történik)

(8)

Lineáris Modell

• Alkalmas a nem additív genetikai rendszerek (pl.

dominancia és episztázis) közelítésére

• A becslés ereje egészen jó, még akkor is, ha a háttérben lévő modell génkölcsönhatásai nem additívak

• A Lineáris Modell alkalmazása széles körben

elterjedt az állattenyésztésben

(9)

Egy véletlen hatás a Lineáris Modellben

j j

j j

j j

j

b X b X b X b X b X

Y

0 0

1 1

2 22

3 3

4 42

 

Függő változó (tulajdonság)

Független változók Véletlen hiba Együtthatók

(10)

Mátrix elrendezésben

1 2

4 4 3

3 2

2 2 1

1 0

0

1 2

42 4

32 3

2 22 2

12 1

02 0

2

1 2

41 4

31 3

2 21 2

11 1

01 0

1

n n

n n

n

n b X b X b X b X b X

Y

X b X

b X

b X

b X

b Y

X b X

b X

b X

b X

b Y

n n n

n n

n n

b b b b b

X X

X X

X

X X

X X

X

X X

X X

X

Y Y Y

 

 

2 1

4 3 2 1 0

2 4 3

2 2 1

0

2 42 32

2 22 12

02

2 41 31

2 21 11

01 2

1

* 





























XB

Y

(11)

Becslés

Legkisebb négyzetek módszere

• Független változók (X) – Állandó (fix)

– Hiba nélkül méri

• Reziduumok (hiba) – Véletlen (random)

– Független, azonos eloszlású, átlaga 0,

varianciája σ

2

(12)

Független, azonos eloszlású, átlaga 0, varianciája σ 2

( )

2

)

(  EE

V  

 

 

 

 

2 2

2

0 0

0

0 0

0

0 0

0 )

(

e e

e

V

    

)

2

( I

e

V   

A hiba eloszlása, amelyből minden minta származik, ugyanaz

Mikor nem lesznek igazak ezek a feltételezések?

Nincs környezeti korreláció

(13)

A legkisebb négyzetek módszere szerinti becslés

(Ordinary Least Squares, OLS)

 

 

 

 

 

 

n n

n

j

i

  

2

1

2 1

' 1

2

j

Y

j

E ( Y

j

)

k

i

ij i

j

j

Y b X

0

 

k

i

ij i

j

b X

Y E

0

) (

  

 

 

 

n

j

n

j

k

i

ij j

j

j

Y b X

1 1

2

0 2

'

 

Olyan megoldást kell találni, ahol a reziduumok négyzetösszege a legkisebb.

(14)

A legkisebb négyzetek becslései

  

 

 

 

n

j

n

j

k

i

ij j

j

j

Y b X

1 1

2

0 2

'

 

i ij

n

j

m

i

ij i

j i

X b X

b

b Y  

 

 

 

  

1 0

'

) 2 (  

Az i-t tegyük nullával egyenlővé, és oldjuk meg az egyenletrendszert

(15)

A normálegyenletek

 

 

 

 

 

 

 

 

 

 

 

 

 

   

j kj

j j

j j

k kj

kj j kj

j

kj j j

j j

kj j j

j j

y x

y x

y x

b b b

x x

x x

x

x x x

x x

x x x

x x

 

1 0 1

0

2 1

0

1 2

1 1

0

0 1

0 2

0

Y X

XB

X ''

    X X X Y

B ˆ  ' 1 '

  B ˆ 2   X ' X 1

Ve

(16)

Becslés

    X X X Y

B ˆ 

' 1 '

B

X Y ˆ  ˆ

ˆ ) (

ˆ )

( Y V X B V

)

'

( ˆ ˆ )

( Y XV B X

V

2 '

1

'

)

( ˆ )

( Y X X X X

e

V

1 '

2

( )

ˆ )

( BX X

V

e

(17)

Általánosított legkisebb négyzetek módszere

(Generalized Least Squares, GLS)

• Legkisebb négyzetek módszere

– Független változók

• Állandó (fix)

• Hiba nélkül mérve

– Reziduumok

• Véletlen (random)

• Független, azonos eloszlású, átlaga 0, varianciája σ2

• Általánosított legkisebb négyzetek módszere

– Független változók

• Állandó (fix)

• Hiba nélkül mérve

– Reziduumok

• Véletlen (random)

V

V (  ) 

(18)

Általánosított legkisebb négyzetek módszere

A variancia inverzével súlyozva

A feladat minimalizálni a

( yXb )

'

V

1

( yXb )

) '

( )

'

ˆ ( X V

1

X

1

X V

1

y

b

Ha VI

e2

) '

( )

'

ˆ ( X X

1

X y

b

(19)

Maximum likelihood (ML) módszer

• Általánosított legkisebb négyzetek módszere

– Független változók

• Állandó (fix)

• Hiba nélkül mérve

– Reziduumok

• Véletlen (random)

• Maximum likelihood

– Független változók

• Állandó (fix)

• Hiba nélkül mérve

– Reziduumok

• Véletlen (random)

V V (  ) 

V V (  ) 

) ,

0 ( V

N

(20)

Maximum likelihood (ML) módszer

y Xb

V

y Xb

N

e

V

L

2 ' 1

1

2 1

2

2

1

A feladat „b” maximalizálása

 

ln 0

 

b L

) (

)' 2 (

) 1 ln(

ln LCyXb V

1

yXb

(21)

   y Xb       V X X V y Xb

b

L       

1 1

2 ' 1

2 1 ln

   y Xb    V X

b

L

1

ln '

 

y Xb' V

1

X 0

y ' ( Xb )'V

1

X 0 '

y ' b ' X 'V

1

X 0

X V

y X

V X

b ' '

1

 '

1

1 1

1

)( ' )

' (

ˆ '  y V

X X V

X

b

) '

( ) '

ˆ ( X V

1

X

1

X V

1

y

b

Ugyanaz, mint az általánosított

legkisebb négyzetek módszerénél

(22)

„b” varianciája

1

1

)

' (

)

( bX V

X

V

Ha VI

e2

1

2 ( ' )

)

( bX X

Ve

(23)

Az egyes ismétlések közötti varianciák a generációkkal növekednek

Példaként legyenek itt az alábbi adatok OLS és GLS lineáris regresszióval becsült együtthatói:

y={ 2,28460, 2,06908, 1,70690, 2,02030, 1,40335, 1,20441, 1,22212, 0,66843, 1,03762, 1,06027};

X={ 1 0,000, 1 0,157, 1 0.281, 1 0,333, 1 0.396, 1 0,459, 1 0.491, 1 0,584, 1 0,624, 1 0,657};

V={ 0,72 0 0 0 0 0 0 0 0 0, 0 6,00 0 0 0 0 0 0 0 0, 0 0 12,39 0 0 0 0 0 0 0, 0 0 0 11,30 0 0 0 0 0 0, 0 0 0 0 16,97 0 0 0 0 0, 0 0 0 0 0 19,45 0 0 0 0, 0 0 0 0 0 0 23,45 0 0 0, 0 0 0 0 0 0 0 33,52 0 0, 0 0 0 0 0 0 0 0 40,45 0, 0 0 0 0 0 0 0 0 0 34,46};

(24)

Hasonlítsuk össze a becsléseket és a standard hibákat (SE)

B VB

2,39 0,023 -0,047

OLS -2,32 -0,047 0,118

B VB

2,30 0,035 -0,083

GLS -2,03 -0,083 0,823

*

46

*

, 118 19

, 0

32 ,

2 

  t

t 2 , 43

NS

832 ,

0

03 ,

2 

 

(25)

Következtetések

• Amennyiben a megfelelő hiba struktúrát nem használjuk

– Téves következtetések fordulhatnak elő – Az ismételt sorok miatt drift előfordulhat

• Megoldás

– Ismételt sorok

– Vegyük figyelembe a drift okozta varianciát a modellben

– A drift arányos „F”-el és az additív genetikai varianciával

– A BLUP részleges megoldást nyújt erre a problémára

(26)

Best Linear Unbiased

Prediction - Becslés

(27)

Az OLS hibái független, azonos

eloszlásúsak, átlaguk 0, varianciájuk σ 2

( )

2

)

(  EE

V  

 

 

 

 

2 2

2

0 0

0

0 0

0

0 0

0 )

(

e e

e

V

    

)

2

( I

e

V   

A hiba eloszlása, amelyből minden minta származik, ugyanaz

A rezidiuumok függetlenek

A beltenyésztettség ezt megváltoztatja

Rokon egyedek esetében az értékek nullától

eltérőek lesznek

(28)

Megoldások

• GLS

– Az adatok varianciáinak és korrelációinak megváltoztatásával oldja meg a problémát

• Mi történik az állandó (fix) hatásokkal?

– Hogyan lehet korrigálni

• A környezeti trendekre ellenőrzés nélkül

• A tenyészet hatására

• Az év hatására

• Az alom hatására

(29)

Az adatok torzítása

• Tenyészet hatás

– Kiegyensúlyozott elrendezés esetében nincs probléma

– A mintában minden családból kell szerepelnie minden tenyészetben

– A régi megoldás a tenyészeten belüli különbségek értékelése

– Mi történik akkor, ha a jobb tenyészetek genetikai háttere jobb

• Az állandó (fix) hatásokat korrigálni kell a genetikai különbségekre

• A véletlen (random) hatásokat korrigálni kell az

állandó (fix) hatásokra

(30)

Az állandó és véletlen hatások szimultán kiegyenlítése

• A független változók elkülönítése

– Állandó – Véletlen

Xb Zu

e Zu

Xb

Y   

(31)

Állandó és véletlen hatások

• Állandó hatás

– A paramétertérben csak a megadott szinteken fejti ki hatását

– Tenyészet, Év, Évszak, Ellések száma, és Ivar hatása

• Véletlen hatás

– A hatás a hatások egy eloszlásából vett mintának felel meg

– A paramétertérben abban a populációban fejti ki hatását, amelyből a véletlen hatást mintázták

(32)
(33)

A vegyes (mixed) modell varianciái

e Zu

Xb

Y   

R ee

E e

V

G uu

E u

V

b V

) ' (

) (

) ' (

) (

0 )

(

R ZGZ

e Zu

Xb V

Y

V ( )  (   )  ' 

(34)

Példa

 

 

 

 

 

 

9 6 10

9 7

Y













 1 1 1 1 1

X













1 0

0 0

0

0 1

0 0

0

0 0

1 0

0

0 0

0 1

0

0 0

0 0

1

Z













5 4 3 2 1

a a a a a

U













5 4 3 2 1

e e e e e

e

 

b

(7) 1 (9) 2 (10) 3

(9) 5 (6) 4

(35)

Példa

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5 4 3 2 1

5 4 3 2 1

1 0

0 0

0

0 1

0 0

0

0 0

1 0

0

0 0

0 1

0

0 0

0 0

1

1 1 1 1 1

9 6 10

9 7

e e e e e

a a a a a

(7) 1 (9) 2 (10) 3

(9) 5 (6) 4

(36)

A BLUP ML deriváltja

y és u együttes sűrűségfüggvénye:

f ( y , u )  g ( y / u ) h ( u ) )

( )

/

( y u g e

g

   

e e V e N

e e

V e

g

) 1

( 2 ' 1

2 1 2

1

2 ) 1

(

     

u u V u N

e u

V u

h

) 1

( 2 ' 1

2 1 2

1

2 ) 1

(

 

   

u G u N

e R e N

e G

e R

u y f

1

1 '

2 1

2 1 2

1 2 '

1

2 1 2

1

2

1 2

) 1 , (

u G u e

R

e

c e

e c u

y f

1

1 '

2 1 2

2 ' 1

)

1

, (

u G u e

R

e

e

ce u

y f

1

1 '

2 ' 1

2 1

) , (

(37)

u G u e

R

e

e

ce L

u y f

1

1 '

2 ' 1

2 1

) , (

A feladat b és u maximalizálása

u G u e

R e c

L

1

'

1

2 ' 1

2 ) 1

ln(

)

ln(  

Zu Xb

Y

e   

u G

u Zu

Xb Y

R Zu Xb

Y c

L

1

'

1

2 ) 1

( )

2 ( ) 1

ln(

)

ln(    

  

(38)

Vegyük a b deriváltját

 

u G u Zu

R Zu

Xb R

Zu Y

R Zu

Zu R

Xb Xb

R Xb Y

R Xb

Zu R

Y Xb

R Y Y

R Y

u G u Zu

Xb Y

R Zu

Xb Y

u G u Zu

Xb Y

R Zu

Xb Y

1 1

1 1

1 1

1

1 1

1

1 1

1 1

' )'

( )'

( )'

(

)' (

)' (

)' (

' '

'

' )

( )'

( )' (

'

' )

( )'

(

) 0

(ln 

b L

0 )'

( '

'

)' (

' '

1 1

1

1 1

1

X R

Zu Zu

R X Xb

R X

X R

Xb Y

R X X

R Y

Y R X Zu

R X Xb

R X

Zu XR

Xb R

X Y

R X

1 1

1

1 1

1

' '

'

0 2

' 2 '

2

(39)

Vegyük az u deriváltját

 

u G u Zu

R Zu

Xb R

Zu Y

R Zu

Zu R

Xb Xb

R Xb Y

R Xb

Zu R

Y Xb

R Y Y

R Y

u G u Zu

Xb Y

R Zu

Xb Y

u G u Zu

Xb Y

R Zu

Xb Y

1 1

1 1

1 1

1

1 1

1

1 1

1 1

' )'

( )'

( )'

(

)' (

)' (

)' (

' '

'

' )

( )'

( )' (

'

' )

( )'

(

) 0

(ln 

b L

0 )'

( '

'

)' (

' '

1 1

1

1 1

1

X R

Zu Zu

R X Xb

R X

X R

Xb Y

R X X

R Y

Y R X Zu

R X Xb

R X

Zu XR

Xb R

X Y

R X

1 1

1

1 1

1

' '

'

0 2

' 2 '

2

(40)

Vegyük az u deriváltját

u G u Zu

R Zu

Xb R

Zu Y

R Zu

Zu R

Xb Xb

R Xb Y

R Xb

Zu R

Y Xb

R Y Y

R Y

u G u Zu

Xb Y

R Zu

Xb Y

1 1

1 1

1 1

1

1 1

1

1 1

' )'

( )'

( )'

(

)' (

)' (

)' (

' '

'

' )

( )'

(

) 0

(ln 

u L

0 2

)' (

)' (

)' (

)' (

)' (

'

1 1

1

1 1

1 1

u G Z

R Zu

Zu R

Z

Xb R

Z Y

R Z

Z R

Xb Z

R Y

Z R

Y u

G Zu

R Z Xb

R Z

u G Zu

R Z Xb

R Z Z

R Y

1 1

1 1

1 1

1 1

' '

'

0 2

' 2 '

2 '

2

(41)

A vegyes modell egyenletei

Z R

Y u

G Zu

R Z

Xb R

Z

Y R

X Zu

R X

Xb R

X

1 1

1 1

1 1

1

' '

'

' '

'

 

 

 

 

 

 

 

Z R

Y

Y R

X u

b G

Z R

Z X

R Z

Z R

X X

R X

1 1 1

1 1

1 1

' ' '

'

' '

Egyszerűsíthető, ha 2

I

e

R

 

 

 

 

 

 

 

Y Z

Y X u

b G

Z Z X

Z

Z X X

X

e

'

' '

'

' '

1

2

(42)

Az „Y” (a függő változó/tulajdonság) normál eloszlása nem szükséges

Alternatív BLUE becslési technikákkal bizonyítható, hogy ugyanezeket az

eredményeket kapjuk a normalitás

feltételezése nélkül is

(43)

Egyszerűsítések

 

 

 

 

 

 

 

Y Z

Y X u

b G

Z Z X

Z

Z X X

X

e

'

' '

'

' '

1

2

Az additivitást feltételezve: 2

A

a

G  

 

 

 

 

 

 

 

Y Z

Y X u

b A

Z Z X

Z

Z X

X X

a

e

'

' '

'

' '

1 2

2

Csak a hányados becslése szükséges

Csak az inverze szükséges

(44)

Példa

 

 

 

 

 

 

9 6 10

9 7

Y













 1 1 1 1 1

X













1 0

0 0

0

0 1

0 0

0

0 0

1 0

0

0 0

0 1

0

0 0

0 0

1

Z













5 4 3 2 1

a a a a a

U













5 4 3 2 1

e e e e e

e

 

b

(7) 1 (9) 2 (10) 3

(9) 5 (6) 4

(45)

 

 

 

 

 

 

 

Y Z

Y X u

b A

Z Z X

Z

Z X

X X

a

e

'

' '

'

' '

1 2

2

 

 

 

 

 

 

 

1 1 1 1 1

1 1 1 1 1 '

X

X

1 1 1 1 1

'

Z

5

X

' XX

 

 

 

 

 

 

 

1 0

0 0

0

0 1

0 0

0

0 0

1 0

0

0 0

0 1

0

0 0

0 0

1

1 1 1 1 1 '

Z

X

(46)

 

 

 

 

 

 

 

Y Z

Y X u

b A

Z Z X

Z

Z X

X X

a

e

'

' '

'

' '

1 2

2

 

 

 

 

 

 

 

 

 

 

 

 

1 1 1 1 1

1 0

0 0

0

0 1

0 0

0

0 0

1 0

0

0 0

0 1

0

0 0

0 0

1

'

X Z

 

 

 

 

 

 

 1 1 1 1 1

' X Z

 

 

 

 

 

 

1 0

0 0

0

0 1

0 0

0

0 0

1 0

0

0 0

0 1

0

0 0

0 0

1

'

Z Z

(47)

 

 

 

 

 

 

4 1 2 1

2 1 0 1

1 4 1

2 0 2 1

1 0 0 1 0 1 2 1 2 1 2

0 1

0

2 0 0 1

0 1

A

(7) 1 (9) 2 (10) 3

(9) 5 (6) 4

Tegyük fel, hogy az örökölhetőség 0,5

2

1

2

a

e

 

 

 

 

 

 

3 0

1 1

0

0 3

0 1

1

1 2 0

2 5 0 1

1 2 1

3 1 1 2

0 1

2 0 1 1

'

2 1

2

A Z

Z

a e

(48)

 

 

 

 

 

 

 

Y Z

Y X u

b A

Z Z X

Z

Z X

X X

a

e

'

' '

'

' '

1 2

2

 

 

 

 

 

 

 

9 6 10

9 7

1 1 1 1 1 '

Y

X

 

 

 

 

 

 

9 6 10

9 7

'

Z Y

  41

' Y

X

(49)

A vegyes modell egyenlete

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9 6 10

9 7 41

3 0

1 1

0 1

0 3

0 1

1 1

1 2 0

2 5 0 1

1

1 2 1

3 1 1 2

1

0 1

2 0 2 1

1 5

1 1

1 1

1 5

5 4 3 2 1

a a a a a

(50)

A hibavariancia becslése, ha az arány ismert

2 2

a

e

  

 

 

 

 ( )

ˆ ˆ ˆ

2

'

X R

N

Z u X

b Y

MSE Y

e

ˆ

a2

  ˆ

e2

(51)

A becslések

BU

8,3018868 -0,960813 0,0754717

0,8853411 -1,062409 0,5529753

  ˆ

b

 

 

 

 

 

 

5 4 3 2 1

ˆ ˆ ˆ ˆ ˆ

a a a a a

U

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

[r]

H. Sterling [2]-ben a következő kérdést vetette fel. Utalnak rá, hogy tetszőleges n > 2 esetén analóg módon lehet bizonyítani. A [3]-ban olyan egészoldalú

1.) Lineáris programozási modelleket gyakran használnak a termeléstervezés támogatásához. Lineáris termeléstervezési modelleknél, degenerált optimális megoldás esetén

A tárgyalt többváltozós statisztikai módszerek a következők: lineáris regresszió, általánosított lineáris regresszió, főkomponens-analízis, kanonikus

A második kicsi kecske is nagyon jószívű volt, ő is szétosztotta a bögrécskéjében lévő tejecskét hat testvérkéje között.. Így tett sorban a többi kicsi

Határozza meg az R n vektortér összes olyan lineáris transzformációját, amelynek minden bázisban ugyanaz a

Az vektorokat egyesével próbáljuk kicserélni a generáló rendszerben található egységvektorokkal. A későbbiekben be látjuk, hogy ha sikerül minden vektort

Megfordítva ez azt jelenti, hogy ha egy rendszerben olyan mozgásformát figyelünk meg, amely lineáris modell mellett nem lehetséges, akkor bizonyosan csak olyan modellel