Lineáris, vagy nem lineáris

(1)

ÁLLATGENETIKA

A projekt az Európai Unió támogatásával, az Európai Szociális Alap

társfinanszírozásával valósul meg.

Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP-4.1.2-08/1/A-2009-0010 projekt

Debreceni Egyetem

Nyugat-magyarországi Egyetem Pannon Egyetem

(2)

Tenyészértékbecslés, BLUP

(3)

Best Linear Unbiased Prediction - Variancia

Szerkezet

(4)

Lineáris, vagy nem lineáris

Lineáris

Másodrendű polinom

i i

i

b b X b X b X b X b X X

Y 

₀



₁ ₁



₂ ₂²



₃ ₃



₄ ₄²



₅

(

₁ ₂

)    

Nem lineáris

i X b i

e

i

b

Y 

₀ ^ ¹



  ^Y

_i

^ln   ^b ^b ^X

_i

^ln   ^

_i

ln 

₀



₁



Log lineáris

(5)

Miért lineáris?

) ( X f

Y 

A Taylor-sor:

!

) )(

(

! 2

) )(

(

! 1

) )(

) ( (

2 ''

'

n

a x

a f

a x

a f

a x

a a f

f Y

n





 



 

e

X

Y 

^

Y

^'

  e

^^X

Y

^''

 e

^^X

Ha a=0:

(6)

Az alacsonyabb rendű együtthatók fontosabbak, mint a magasabb rendűek

Más értékekre is hasonlóan működik, pl. a=0,1:

e

X

Y 

^

1 ,

 0 a

904837 ,

1

0

,

0



 e

^

Y

 





 1 2 ! 3 ! 4 !

4 3

2

x x

x x Y

9 , 0 1

, 0 1

1    

 x

Y

905 ,

! 0 2

1 , 1 0

, 0

! 1 1 2

2

   





 x

x Y

904833 ,

! 0 3

1 , 0

! 2

1 , 1 0

, 0

! 1 3

! 1 2

3 2

3

2

     





 x x

x

Y

(7)

Általánosítva

Bármely, a háttérben lévő ismeretlen függvény közelíthető egy lineáris polinommal (Lineáris Modell).

• Az alacsonyabb rendű együtthatók fontosabbak, mint a magasabb rendűek

• A modell nem szükséges, hogy biológiai függvényen alapuljon

• Még a magas nem-lineáris rendszerek is közelíthetőek alacsonyabb rendű együtthatójú lineáris modellel

•Tisztán leíró

• Lehetővé teszi a modellben szereplő hatásokra vonatkozó hipotézisvizsgálatot

• Lehetővé tesz korlátozott becslést (a kifejtés egy pont körül történik)

(8)

Lineáris Modell

• Alkalmas a nem additív genetikai rendszerek (pl.

dominancia és episztázis) közelítésére

• A becslés ereje egészen jó, még akkor is, ha a háttérben lévő modell génkölcsönhatásai nem additívak

• A Lineáris Modell alkalmazása széles körben

elterjedt az állattenyésztésben

(9)

Egy véletlen hatás a Lineáris Modellben

j j

j

b X b X b X b X b X

Y 

₀ ₀



₁ ₁



₂ ₂²



₃ ₃



₄ ₄²

 

Függő változó (tulajdonság)

Független változók Véletlen hiba Együtthatók

(10)

Mátrix elrendezésben

1 2

4 4 3

3 2

2 2 1

1 0

0

1 2

42 4

32 3

2 22 2

12 1

02 0

2

1 2

41 4

31 3

2 21 2

11 1

01 0

1















n n

n

n b X b X b X b X b X

Y

X b X

b X

b Y

X b X

b X

b Y



n n n

n n

b b b b b

X X

X

X X

X

X X

X

Y Y Y



 



 

2 1

4 3 2 1 0

2 4 3

2 2 1

0

2 42 32

2 22 12

02

2 41 31

2 21 11

01 2

1

* 















































 XB

Y

(11)

Becslés

Legkisebb négyzetek módszere

• Független változók (X) – Állandó (fix)

– Hiba nélkül méri

• Reziduumok (hiba) – Véletlen (random)

– Független, azonos eloszlású, átlaga 0,

varianciája σ

²

(12)

Független, azonos eloszlású, átlaga 0, varianciája σ ²

 ⁽ ⁾ 

²

)

(  E  E 

V  

 







 









2 2

2

0 0

0 0 0

0 )

(

e e

e

V



    

)

2

( I

_e

V   

A hiba eloszlása, amelyből minden minta származik, ugyanaz

Mikor nem lesznek igazak ezek a feltételezések?

Nincs környezeti korreláció

(13)

A legkisebb négyzetek módszere szerinti becslés

(Ordinary Least Squares, OLS)

 

 





 







 



n n

n

j

i



  

²

1

2 1

' 1

2



_j

 Y

_j

 E ( Y

_j

)









^k

i

ij i

j

Y b X

0

 



^k

i

ij i

j

b X

Y E

0

) (

  

  

 

 



 



ⁿ

j

n

j

k

i

ij j

j

Y b X

1 1

2

0 2

'

 



Olyan megoldást kell találni, ahol a reziduumok négyzetösszege a legkisebb.

(14)

A legkisebb négyzetek becslései

  

  

 

 



 



ⁿ

j

n

j

k

i

ij j

j

Y b X

1 1

2

0 2

'

 





_i _ij



n

j

m

i

ij i

j i

X b X

b

b Y  



 



 

 

  

1 0

'

) 2 (  

Az i-t tegyük nullával egyenlővé, és oldjuk meg az egyenletrendszert

(15)

A normálegyenletek

 







 









 





 





 







 









 



   

j kj

j j

k kj

kj j kj

j

kj j j

j j

kj j j

j j

y x

b b b

x x

x

x x x

x x

x x x

x x

 











1 0 1

0

2 1

0

1 2

1 1

0

0 1

0 2

0

Y X

XB

X ^'  ^'

    ^X ^X ^X ^Y

B ˆ  ^' ^ ¹ ^'

  ^B ^ˆ ^ ² ^{ } ^X ^' ^X ^ ¹

V  _e

(16)

Becslés

    ^X ^X ^X ^Y

B ˆ 

^' ^¹ ^'

B

X Y ˆ  ˆ

ˆ ) (

ˆ )

( Y V X B V 

)

'

( ˆ ˆ )

( Y XV B X

V 

2 '

1

'

)

( ˆ )

( Y X X X X

_e

V 

^



1 '

2

( )

ˆ )

( B  X X

^

V 

_e

(17)

Általánosított legkisebb négyzetek módszere

(Generalized Least Squares, GLS)

• Legkisebb négyzetek módszere

– Független változók

• Állandó (fix)

• Hiba nélkül mérve

– Reziduumok

• Véletlen (random)

• Független, azonos eloszlású, átlaga 0, varianciája σ²

• Általánosított legkisebb négyzetek módszere

• Állandó (fix)

– Reziduumok

V

V (  ) 

(18)

Általánosított legkisebb négyzetek módszere

A variancia inverzével súlyozva

A feladat minimalizálni a

( y  Xb )

^'

V

^¹

( y  Xb )

) '

( )

'

ˆ ( X V

¹

X

¹

X V

¹

y

b 

^ ^ ^

Ha V  I 

_e²

) '

( )

'

ˆ ( X X

¹

X y

b 

^

(19)

Maximum likelihood (ML) módszer

• Általánosított legkisebb négyzetek módszere

• Állandó (fix)

– Reziduumok

• Maximum likelihood

• Állandó (fix)

– Reziduumok

V V (  ) 

) ,

0 ( V

 N



(20)

Maximum likelihood (ML) módszer



^y ^Xb



^V



^y ^Xb



N

e

V

L

^ ^ ^



² ^' ¹

1

2 1

2

1 

A feladat „b” maximalizálása

 

ln 0

 



b L

) (

)' 2 (

) 1 ln(

ln L  C  y  Xb V

^¹

y  Xb

(21)

   ^y ^Xb       ^V ^X ^X ^V ^y ^Xb 

b

L       



_₁ _₁

2 ' 1

2 1 ln

   ^y ^Xb    ^V ^X

b

L

₁

ln '

_



 



 ^y ^ ^Xb  ^' ^V

^¹

^X ^ ⁰

 ^y ^' ^ ⁽ ^Xb ^)'  ^V

^¹

^X ^ ⁰ ^'

 ^y ^' ^ ^b ^' ^X ^'  ^V

^¹

^X ^ ⁰

X V

y X

V X

b ' '

^¹

 '

^¹

1 1

1

)( ' )

' (

ˆ '  y V

^

X X V

^

X

^

b

) '

( ) '

ˆ ( X V

¹

X

¹

X V

¹

y

b 

^ ^ ^ Ugyanaz, mint az általánosított

legkisebb négyzetek módszerénél

(22)

„b” varianciája

1

)

' (

)

( b  X V

^

X

^

V

Ha V  I 

_e²

1 2 ( ' )

)

( b  X X ^

V  _e

(23)

Az egyes ismétlések közötti varianciák a generációkkal növekednek

Példaként legyenek itt az alábbi adatok OLS és GLS lineáris regresszióval becsült együtthatói:

y={ 2,28460, 2,06908, 1,70690, 2,02030, 1,40335, 1,20441, 1,22212, 0,66843, 1,03762, 1,06027};

X={ 1 0,000, 1 0,157, 1 0.281, 1 0,333, 1 0.396, 1 0,459, 1 0.491, 1 0,584, 1 0,624, 1 0,657};

V={ 0,72 0 0 0 0 0 0 0 0 0, 0 6,00 0 0 0 0 0 0 0 0, 0 0 12,39 0 0 0 0 0 0 0, 0 0 0 11,30 0 0 0 0 0 0, 0 0 0 0 16,97 0 0 0 0 0, 0 0 0 0 0 19,45 0 0 0 0, 0 0 0 0 0 0 23,45 0 0 0, 0 0 0 0 0 0 0 33,52 0 0, 0 0 0 0 0 0 0 0 40,45 0, 0 0 0 0 0 0 0 0 0 34,46};

(24)

Hasonlítsuk össze a becsléseket és a standard hibákat (SE)

B VB

2,39 0,023 -0,047

OLS -2,32 -0,047 0,118

B VB

2,30 0,035 -0,083

GLS -2,03 -0,083 0,823

*

46

*

, 118 19

, 0

32 ,

2 

  t

t 2 , 43

NS

832 ,

0 03 ,

2 

 

(25)

Következtetések

• Amennyiben a megfelelő hiba struktúrát nem használjuk

– Téves következtetések fordulhatnak elő – Az ismételt sorok miatt drift előfordulhat

• Megoldás

– Ismételt sorok

– Vegyük figyelembe a drift okozta varianciát a modellben

– A drift arányos „F”-el és az additív genetikai varianciával

– A BLUP részleges megoldást nyújt erre a problémára

(26)

Best Linear Unbiased

Prediction - Becslés

(27)

Az OLS hibái független, azonos

eloszlásúsak, átlaguk 0, varianciájuk σ ²

 ⁽ ⁾ 

²

)

(  E  E 

V  

 







 









2 2

2

0 0

0 0 0

0 )

(

e e

e

V



    

)

2

( I

_e

V   

A hiba eloszlása, amelyből minden minta származik, ugyanaz

A rezidiuumok függetlenek

A beltenyésztettség ezt megváltoztatja

Rokon egyedek esetében az értékek nullától

eltérőek lesznek

(28)

Megoldások

• GLS

– Az adatok varianciáinak és korrelációinak megváltoztatásával oldja meg a problémát

• Mi történik az állandó (fix) hatásokkal?

– Hogyan lehet korrigálni

• A környezeti trendekre ellenőrzés nélkül

• A tenyészet hatására

• Az év hatására

• Az alom hatására

(29)

Az adatok torzítása

• Tenyészet hatás

– Kiegyensúlyozott elrendezés esetében nincs probléma

– A mintában minden családból kell szerepelnie minden tenyészetben

– A régi megoldás a tenyészeten belüli különbségek értékelése

– Mi történik akkor, ha a jobb tenyészetek genetikai háttere jobb

• Az állandó (fix) hatásokat korrigálni kell a genetikai különbségekre

• A véletlen (random) hatásokat korrigálni kell az

állandó (fix) hatásokra

(30)

Az állandó és véletlen hatások szimultán kiegyenlítése

• A független változók elkülönítése

– Állandó – Véletlen

Xb Zu

e Zu

Xb

Y   

(31)

Állandó és véletlen hatások

• Állandó hatás

– A paramétertérben csak a megadott szinteken fejti ki hatását

– Tenyészet, Év, Évszak, Ellések száma, és Ivar hatása

• Véletlen hatás

– A hatás a hatások egy eloszlásából vett mintának felel meg

– A paramétertérben abban a populációban fejti ki hatását, amelyből a véletlen hatást mintázták

(32)

(33)

A vegyes (mixed) modell varianciái

e Zu

Xb

Y   

R ee

E e

V

G uu

E u

V

b V



) ' (

) (

) ' (

) (

0 )

(

R ZGZ

e Zu

Xb V

Y

V ( )  (   )  ' 

(34)

Példa

 





 







9 6 10

9 7

Y













 1 1 1 1 1

X















1 0

0 0

0

0 1

0 0

0

0 0

1 0

0

0 0

0 1

0

0 0

1

Z















5 4 3 2 1

a a a a a

U















5 4 3 2 1

e e e e e

e

  ^

 b

(7) 1 (9) 2 (10) 3

(9) 5 (6) 4

(35)

Példa

 

 





 







 





 





 





 







 





 







 





 





5 4 3 2 1

1 0

0 0

0 0 1

0 0

0 0 0

1 0

0 0 0

0 1

0 0 0

0 0

1 1 1 1 1 1

9 6 10

9 7

e e e e e

a a a a a



(7) 1 (9) 2 (10) 3

(9) 5 (6) 4

(36)

A BLUP ML deriváltja

y és u együttes sűrűségfüggvénye:

f ( y , u )  g ( y / u ) h ( u ) )

( )

/

( y u g e

g 

   

e e V e N

e e

V e

g

) 1

( 2 ' 1

2 1 2

1

2 ) 1

(

 

     

u u V u N

e u

V u

h

) 1

( 2 ' 1

2 1 2

1

2 ) 1

(

 

 

   

u G u N

e R e N

e G

e R

u y f

1

1 '

2 1

2 1 2

1 2 '

1

2 1 2

1

2 1 2

) 1 , (



 







u G u e

R

e

c e

e c u

y f

1

1 '

2 1 2

2 ' 1

)

1

, (



 





u G u e

R

e

ce u

y f

1

1 '

2 ' 1

2 1

) , (



 





(37)

u G u e

R

e

ce L

u y f

1

1 '

2 ' 1

2 1

) , (



 







A feladat b és u maximalizálása

u G u e

R e c

L

¹

'

¹

2 ' 1

2 ) 1

ln(

)

ln(  

^



^

Zu Xb

Y

e   

u G

u Zu

Xb Y

R Zu Xb

Y c

L

¹

'

¹

2 ) 1

( )

2 ( ) 1

ln(

)

ln(    

^

  

^

(38)

Vegyük a b deriváltját

 

u G u Zu

R Zu

Xb R

Zu Y

R Zu

Zu R

Xb Xb

R Xb Y

R Xb

Zu R

Y Xb

R Y Y

R Y

u G u Zu

Xb Y

R Zu

Xb Y

u G u Zu

Xb Y

R Zu

Xb Y

1 1

1

1 1

1

1 1

' )'

( )'

(

)' (

' '

'

' )

( )'

( )' (

'

' )

( )'

(























) 0

(ln 



b L

0 )'

( '

'

)' (

' '

1 1

1

1 1

1







X R

Zu Zu

R X Xb

R X

X R

Xb Y

R X X

R Y

Y R X Zu

R X Xb

R X

Zu XR

Xb R

X Y

R X

1 1

1

1 1

1

' '

'

0 2

' 2 '

2













(39)

Vegyük az u deriváltját

 

u G u Zu

R Zu

Xb R

Zu Y

R Zu

Zu R

Xb Xb

R Xb Y

R Xb

Zu R

Y Xb

R Y Y

R Y

u G u Zu

Xb Y

R Zu

Xb Y

u G u Zu

Xb Y

R Zu

Xb Y

1 1

1

1 1

1

1 1

' )'

( )'

(

)' (

' '

'

' )

( )'

( )' (

'

' )

( )'

(























) 0

(ln 



b L

0 )'

( '

'

)' (

' '

1 1

1

1 1

1







X R

Zu Zu

R X Xb

R X

X R

Xb Y

R X X

R Y

Y R X Zu

R X Xb

R X

Zu XR

Xb R

X Y

R X

1 1

1

1 1

1

' '

'

0 2

' 2 '

2













(40)

Vegyük az u deriváltját

u G u Zu

R Zu

Xb R

Zu Y

R Zu

Zu R

Xb Xb

R Xb Y

R Xb

Zu R

Y Xb

R Y Y

R Y

u G u Zu

Xb Y

R Zu

Xb Y

1 1

1

1 1

1

1 1

' )'

( )'

(

)' (

' '

'

' )

( )'

(

















) 0

(ln 



u L

0 2

)' (

'

1 1

1

1 1











u G Z

R Zu

Zu R

Z

Xb R

Z Y

R Z

Z R

Xb Z

R Y

Z R

Y u

G Zu

R Z Xb

R Z

u G Zu

R Z Xb

R Z Z

R Y

1 1

' '

'

0 2

' 2 '

2 '

2













(41)

A vegyes modell egyenletei

Z R

Y u

G Zu

R Z

Xb R

Z

Y R

X Zu

R X

Xb R

X

1 1

1

' '

'

' '

'











 

 



 

 

 



 



 







^



Z R

Y

Y R

X u

b G

Z R

Z X

R Z

Z R

X X

R X

1 1 1

1 1

' ' '

'

' '

Egyszerűsíthető, ha ²

I

e

R ^ 

 

 



 

 

 



 



 







^

Y Z

Y X u

b G

Z Z X

Z

Z X X

X

e

'

' '

'

' '

1



2

(42)

Az „Y” (a függő változó/tulajdonság) normál eloszlása nem szükséges

Alternatív BLUE becslési technikákkal bizonyítható, hogy ugyanezeket az

eredményeket kapjuk a normalitás

feltételezése nélkül is

(43)

Egyszerűsítések

 

 



 

 

 



 



 







^

Y Z

Y X u

b G

Z Z X

Z

Z X X

X

e

'

' '

'

' '

1



2

Az additivitást feltételezve: ²

A

a

G  

 

 



 

 

 





 





 







^

Y Z

Y X u

b A

Z Z X

Z

Z X

X X

a

e

'

' '

'

' '

1 2

2



Csak a hányados becslése szükséges

Csak az inverze szükséges

(44)

Példa

 





 







9 6 10

9 7

Y













 1 1 1 1 1

X















1 0

0 0

0

0 1

0 0

0

0 0

1 0

0

0 0

0 1

0

0 0

1

Z















5 4 3 2 1

a a a a a

U















5 4 3 2 1

e e e e e

e

  ^

 b

(7) 1 (9) 2 (10) 3

(9) 5 (6) 4

(45)

 

 



 

 

 





 





 







^

Y Z

Y X u

b A

Z Z X

Z

Z X

X X

a

e

'

' '

'

' '

1 2

2



 

 





 







1 1 1 1 1

1 1 1 1 1 '

X

 ¹ ¹ ¹ ¹ ¹ 

'

Z



5

X

' X  X

 

 





 







1 0

0 0

0 0 1

0 0

0 0 0

1 0

0 0 0

0 1

0 0 0

0 0

1 1 1 1 1 1 '

Z

X

(46)

 

 



 

 

 





 





 







^

Y Z

Y X u

b A

Z Z X

Z

Z X

X X

a

e

'

' '

'

' '

1 2

2



 





 





 





 







1 1 1 1 1

1 0

0 0

0 0 1

0 0

0 0 0

1 0

0 0 0

0 1

0 0 0

0 0

1 '

X Z

 





 





 1 1 1 1 1

' X Z

 





 







1 0

0 0

0 0 1

0 0

0 0 0

1 0

0 0 0

0 1

0 0 0

0 0

1 '

Z Z

(47)

 







 









4 1 2 1

2 1 0 1

1 4 1

2 0 2 1

1 0 0 1 0 1 2 1 2 1 2

0 1

0 2 0 0 1

0 1

A

(7) 1 (9) 2 (10) 3

(9) 5 (6) 4

Tegyük fel, hogy az örökölhetőség 0,5

2

1

2



a



e



 







 













^

3 0

1 1

0 0 3

0 1

1 1 2 0

2 5 0 1

1 2 1

3 1 1 2

0 1

2 0 1 1

'

₂ ¹

2

A Z

Z

a e



(48)

 

 



 

 

 





 





 







^

Y Z

Y X u

b A

Z Z X

Z

Z X

X X

a

e

'

' '

'

' '

1 2

2



 

 





 







9 6 10

9 7

1 1 1 1 1 '

Y

X

 





 







9 6 10

9 7

'

Z Y

  ⁴¹

' Y 

X

(49)

A vegyes modell egyenlete

 





 







 





 





 





 







9 6 10

9 7 41

3 0

1 1

0 1

0 3

0 1

1 1

1 2 0

2 5 0 1

1 1 2 1

3 1 1 2

1 0 1

2 0 2 1

1 5

1 1

1 5

5 4 3 2 1

a a a a a



(50)

A hibavariancia becslése, ha az arány ismert

2 2

a



e

  

 





 







 

 ( )

ˆ ˆ ˆ

²

'

X R

N

Z u X

b Y

MSE Y



e



 ^ˆ

_a²

  ^ˆ

^e²

(51)

A becslések

BU

8,3018868 -0,960813 0,0754717

0,8853411 -1,062409 0,5529753

  ^ ^ˆ

 b

 





 







5 4 3 2 1

ˆ ˆ ˆ ˆ ˆ

a a a a a

U

Lineáris, vagy nem lineáris

Tenyészértékbecslés, BLUP

Best Linear Unbiased Prediction - Variancia

Szerkezet