ÁLLATGENETIKA
A projekt az Európai Unió támogatásával, az Európai Szociális Alap
társfinanszírozásával valósul meg.
Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP-4.1.2-08/1/A-2009-0010 projekt
Debreceni Egyetem
Nyugat-magyarországi Egyetem Pannon Egyetem
Tenyészértékbecslés, BLUP
Best Linear Unbiased Prediction - Variancia
Szerkezet
Lineáris, vagy nem lineáris
Lineáris
Másodrendű polinom
i i
i i
i i
i
i
b b X b X b X b X b X X
Y
0
1 1
2 22
3 3
4 42
5(
1 2)
Nem lineáris
i X b i
e
ib
Y
0 1
Y
iln b b X
iln
iln
0
1
Log lineáris
Miért lineáris?
) ( X f
Y
A Taylor-sor:
!
) )(
(
! 2
) )(
(
! 1
) )(
) ( (
2 ''
'
n
a x
a f
a x
a f
a x
a a f
f Y
n
n
e
XY
Y
' e
XY
'' e
XHa a=0:
Az alacsonyabb rendű együtthatók fontosabbak, mint a magasabb rendűek
Más értékekre is hasonlóan működik, pl. a=0,1:
e
XY
1 ,
0 a
904837 ,
1
0
,
0
e
Y
1 2 ! 3 ! 4 !
4 3
2
x x
x x Y
9 , 0 1
, 0 1
1
x
Y
905 ,
! 0 2
1 , 1 0
, 0
! 1 1 2
2
2
x
x Y
904833 ,
! 0 3
1 , 0
! 2
1 , 1 0
, 0
! 1 3
! 1 2
3 2
3
2
x x
x
Y
Általánosítva
Bármely, a háttérben lévő ismeretlen függvény közelíthető egy lineáris polinommal (Lineáris Modell).
• Az alacsonyabb rendű együtthatók fontosabbak, mint a magasabb rendűek
• A modell nem szükséges, hogy biológiai függvényen alapuljon
• Még a magas nem-lineáris rendszerek is közelíthetőek alacsonyabb rendű együtthatójú lineáris modellel
•Tisztán leíró
• Lehetővé teszi a modellben szereplő hatásokra vonatkozó hipotézisvizsgálatot
• Lehetővé tesz korlátozott becslést (a kifejtés egy pont körül történik)
Lineáris Modell
• Alkalmas a nem additív genetikai rendszerek (pl.
dominancia és episztázis) közelítésére
• A becslés ereje egészen jó, még akkor is, ha a háttérben lévő modell génkölcsönhatásai nem additívak
• A Lineáris Modell alkalmazása széles körben
elterjedt az állattenyésztésben
Egy véletlen hatás a Lineáris Modellben
j j
j j
j j
j
b X b X b X b X b X
Y
0 0
1 1
2 22
3 3
4 42
Függő változó (tulajdonság)
Független változók Véletlen hiba Együtthatók
Mátrix elrendezésben
1 2
4 4 3
3 2
2 2 1
1 0
0
1 2
42 4
32 3
2 22 2
12 1
02 0
2
1 2
41 4
31 3
2 21 2
11 1
01 0
1
n n
n n
n
n b X b X b X b X b X
Y
X b X
b X
b X
b X
b Y
X b X
b X
b X
b X
b Y
n n n
n n
n n
b b b b b
X X
X X
X
X X
X X
X
X X
X X
X
Y Y Y
2 1
4 3 2 1 0
2 4 3
2 2 1
0
2 42 32
2 22 12
02
2 41 31
2 21 11
01 2
1
*
XB
Y
Becslés
Legkisebb négyzetek módszere
• Független változók (X) – Állandó (fix)
– Hiba nélkül méri
• Reziduumok (hiba) – Véletlen (random)
– Független, azonos eloszlású, átlaga 0,
varianciája σ
2Független, azonos eloszlású, átlaga 0, varianciája σ 2
( )
2)
( E E
V
2 2
2
0 0
0
0 0
0
0 0
0 )
(
e e
e
V
)
2( I
eV
A hiba eloszlása, amelyből minden minta származik, ugyanaz
Mikor nem lesznek igazak ezek a feltételezések?
Nincs környezeti korreláció
A legkisebb négyzetek módszere szerinti becslés
(Ordinary Least Squares, OLS)
n n
n
j
i
21
2 1
' 1
2
j Y
j E ( Y
j)
ki
ij i
j
j
Y b X
0
ki
ij i
j
b X
Y E
0
) (
nj
n
j
k
i
ij j
j
j
Y b X
1 1
2
0 2
'
Olyan megoldást kell találni, ahol a reziduumok négyzetösszege a legkisebb.
A legkisebb négyzetek becslései
nj
n
j
k
i
ij j
j
j
Y b X
1 1
2
0 2
'
i ij
n
j
m
i
ij i
j i
X b X
b
b Y
1 0
'
) 2 (
Az i-t tegyük nullával egyenlővé, és oldjuk meg az egyenletrendszert
A normálegyenletek
j kj
j j
j j
k kj
kj j kj
j
kj j j
j j
kj j j
j j
y x
y x
y x
b b b
x x
x x
x
x x x
x x
x x x
x x
1 0 1
0
2 1
0
1 2
1 1
0
0 1
0 2
0
Y X
XB
X ' '
X X X Y
B ˆ ' 1 '
B ˆ 2 X ' X 1
V e
Becslés
X X X Y
B ˆ
' 1 'B
X Y ˆ ˆ
ˆ ) (
ˆ )
( Y V X B V
)
'( ˆ ˆ )
( Y XV B X
V
2 '
1
'
)
( ˆ )
( Y X X X X
eV
1 '
2
( )
ˆ )
( B X X
V
eÁltalánosított legkisebb négyzetek módszere
(Generalized Least Squares, GLS)
• Legkisebb négyzetek módszere
– Független változók
• Állandó (fix)
• Hiba nélkül mérve
– Reziduumok
• Véletlen (random)
• Független, azonos eloszlású, átlaga 0, varianciája σ2
• Általánosított legkisebb négyzetek módszere
– Független változók
• Állandó (fix)
• Hiba nélkül mérve
– Reziduumok
• Véletlen (random)
V
V ( )
Általánosított legkisebb négyzetek módszere
A variancia inverzével súlyozva
A feladat minimalizálni a
( y Xb )
'V
1( y Xb )
) '
( )
'
ˆ ( X V
1X
1X V
1y
b
Ha V I
e2) '
( )
'
ˆ ( X X
1X y
b
Maximum likelihood (ML) módszer
• Általánosított legkisebb négyzetek módszere
– Független változók
• Állandó (fix)
• Hiba nélkül mérve
– Reziduumok
• Véletlen (random)
• Maximum likelihood
– Független változók
• Állandó (fix)
• Hiba nélkül mérve
– Reziduumok
• Véletlen (random)
V V ( )
V V ( )
) ,
0 ( V
N
Maximum likelihood (ML) módszer
y Xb
V
y Xb
N
e
V
L
2 ' 11
2 1
2
21
A feladat „b” maximalizálása
ln 0
b L
) (
)' 2 (
) 1 ln(
ln L C y Xb V
1y Xb
y Xb V X X V y Xb
b
L
1 12 ' 1
2 1 ln
y Xb V X
b
L
1ln '
y Xb ' V
1X 0
y ' ( Xb )' V
1X 0 '
y ' b ' X ' V
1X 0
X V
y X
V X
b ' '
1 '
11 1
1
)( ' )
' (
ˆ ' y V
X X V
X
b
) '
( ) '
ˆ ( X V
1X
1X V
1y
b
Ugyanaz, mint az általánosítottlegkisebb négyzetek módszerénél
„b” varianciája
1
1
)
' (
)
( b X V
X
V
Ha V I
e21
2 ( ' )
)
( b X X
V e
Az egyes ismétlések közötti varianciák a generációkkal növekednek
Példaként legyenek itt az alábbi adatok OLS és GLS lineáris regresszióval becsült együtthatói:
y={ 2,28460, 2,06908, 1,70690, 2,02030, 1,40335, 1,20441, 1,22212, 0,66843, 1,03762, 1,06027};
X={ 1 0,000, 1 0,157, 1 0.281, 1 0,333, 1 0.396, 1 0,459, 1 0.491, 1 0,584, 1 0,624, 1 0,657};
V={ 0,72 0 0 0 0 0 0 0 0 0, 0 6,00 0 0 0 0 0 0 0 0, 0 0 12,39 0 0 0 0 0 0 0, 0 0 0 11,30 0 0 0 0 0 0, 0 0 0 0 16,97 0 0 0 0 0, 0 0 0 0 0 19,45 0 0 0 0, 0 0 0 0 0 0 23,45 0 0 0, 0 0 0 0 0 0 0 33,52 0 0, 0 0 0 0 0 0 0 0 40,45 0, 0 0 0 0 0 0 0 0 0 34,46};
Hasonlítsuk össze a becsléseket és a standard hibákat (SE)
B VB
2,39 0,023 -0,047
OLS -2,32 -0,047 0,118
B VB
2,30 0,035 -0,083
GLS -2,03 -0,083 0,823
*
46
*, 118 19
, 0
32 ,
2
t
t 2 , 43
NS832 ,
0
03 ,
2
Következtetések
• Amennyiben a megfelelő hiba struktúrát nem használjuk
– Téves következtetések fordulhatnak elő – Az ismételt sorok miatt drift előfordulhat
• Megoldás
– Ismételt sorok
– Vegyük figyelembe a drift okozta varianciát a modellben
– A drift arányos „F”-el és az additív genetikai varianciával
– A BLUP részleges megoldást nyújt erre a problémára
Best Linear Unbiased
Prediction - Becslés
Az OLS hibái független, azonos
eloszlásúsak, átlaguk 0, varianciájuk σ 2
( )
2)
( E E
V
2 2
2
0 0
0
0 0
0
0 0
0 )
(
e e
e
V
)
2( I
eV
A hiba eloszlása, amelyből minden minta származik, ugyanaz
A rezidiuumok függetlenek
A beltenyésztettség ezt megváltoztatja
Rokon egyedek esetében az értékek nullától
eltérőek lesznek
Megoldások
• GLS
– Az adatok varianciáinak és korrelációinak megváltoztatásával oldja meg a problémát
• Mi történik az állandó (fix) hatásokkal?
– Hogyan lehet korrigálni
• A környezeti trendekre ellenőrzés nélkül
• A tenyészet hatására
• Az év hatására
• Az alom hatására
Az adatok torzítása
• Tenyészet hatás
– Kiegyensúlyozott elrendezés esetében nincs probléma
– A mintában minden családból kell szerepelnie minden tenyészetben
– A régi megoldás a tenyészeten belüli különbségek értékelése
– Mi történik akkor, ha a jobb tenyészetek genetikai háttere jobb
• Az állandó (fix) hatásokat korrigálni kell a genetikai különbségekre
• A véletlen (random) hatásokat korrigálni kell az
állandó (fix) hatásokra
Az állandó és véletlen hatások szimultán kiegyenlítése
• A független változók elkülönítése
– Állandó – Véletlen
Xb Zu
e Zu
Xb
Y
Állandó és véletlen hatások
• Állandó hatás
– A paramétertérben csak a megadott szinteken fejti ki hatását
– Tenyészet, Év, Évszak, Ellések száma, és Ivar hatása
• Véletlen hatás
– A hatás a hatások egy eloszlásából vett mintának felel meg
– A paramétertérben abban a populációban fejti ki hatását, amelyből a véletlen hatást mintázták
A vegyes (mixed) modell varianciái
e Zu
Xb
Y
R ee
E e
V
G uu
E u
V
b V
) ' (
) (
) ' (
) (
0 )
(
R ZGZ
e Zu
Xb V
Y
V ( ) ( ) '
Példa
9 6 10
9 7
Y
1 1 1 1 1
X
1 0
0 0
0
0 1
0 0
0
0 0
1 0
0
0 0
0 1
0
0 0
0 0
1
Z
5 4 3 2 1
a a a a a
U
5 4 3 2 1
e e e e e
e
b
(7) 1 (9) 2 (10) 3
(9) 5 (6) 4
Példa
5 4 3 2 1
5 4 3 2 1
1 0
0 0
0
0 1
0 0
0
0 0
1 0
0
0 0
0 1
0
0 0
0 0
1
1 1 1 1 1
9 6 10
9 7
e e e e e
a a a a a
(7) 1 (9) 2 (10) 3
(9) 5 (6) 4
A BLUP ML deriváltja
y és u együttes sűrűségfüggvénye:
f ( y , u ) g ( y / u ) h ( u ) )
( )
/
( y u g e
g
e e V e N
e e
V e
g
) 1
( 2 ' 1
2 1 2
1
2 ) 1
(
u u V u N
e u
V u
h
) 1
( 2 ' 1
2 1 2
1
2 ) 1
(
u G u N
e R e N
e G
e R
u y f
1
1 '
2 1
2 1 2
1 2 '
1
2 1 2
1
2
1 2
) 1 , (
u G u e
R
e
c e
e c u
y f
1
1 '
2 1 2
2 ' 1
)
1, (
u G u e
R
e
e
ce u
y f
1
1 '
2 ' 1
2 1
) , (
u G u e
R
e
e
ce L
u y f
1
1 '
2 ' 1
2 1
) , (
A feladat b és u maximalizálása
u G u e
R e c
L
1'
12 ' 1
2 ) 1
ln(
)
ln(
Zu Xb
Y
e
u G
u Zu
Xb Y
R Zu Xb
Y c
L
1'
12 ) 1
( )
2 ( ) 1
ln(
)
ln(
Vegyük a b deriváltját
u G u Zu
R Zu
Xb R
Zu Y
R Zu
Zu R
Xb Xb
R Xb Y
R Xb
Zu R
Y Xb
R Y Y
R Y
u G u Zu
Xb Y
R Zu
Xb Y
u G u Zu
Xb Y
R Zu
Xb Y
1 1
1 1
1 1
1
1 1
1
1 1
1 1
' )'
( )'
( )'
(
)' (
)' (
)' (
' '
'
' )
( )'
( )' (
'
' )
( )'
(
) 0
(ln
b L
0 )'
( '
'
)' (
' '
1 1
1
1 1
1
X R
Zu Zu
R X Xb
R X
X R
Xb Y
R X X
R Y
Y R X Zu
R X Xb
R X
Zu XR
Xb R
X Y
R X
1 1
1
1 1
1
' '
'
0 2
' 2 '
2
Vegyük az u deriváltját
u G u Zu
R Zu
Xb R
Zu Y
R Zu
Zu R
Xb Xb
R Xb Y
R Xb
Zu R
Y Xb
R Y Y
R Y
u G u Zu
Xb Y
R Zu
Xb Y
u G u Zu
Xb Y
R Zu
Xb Y
1 1
1 1
1 1
1
1 1
1
1 1
1 1
' )'
( )'
( )'
(
)' (
)' (
)' (
' '
'
' )
( )'
( )' (
'
' )
( )'
(
) 0
(ln
b L
0 )'
( '
'
)' (
' '
1 1
1
1 1
1
X R
Zu Zu
R X Xb
R X
X R
Xb Y
R X X
R Y
Y R X Zu
R X Xb
R X
Zu XR
Xb R
X Y
R X
1 1
1
1 1
1
' '
'
0 2
' 2 '
2
Vegyük az u deriváltját
u G u Zu
R Zu
Xb R
Zu Y
R Zu
Zu R
Xb Xb
R Xb Y
R Xb
Zu R
Y Xb
R Y Y
R Y
u G u Zu
Xb Y
R Zu
Xb Y
1 1
1 1
1 1
1
1 1
1
1 1
' )'
( )'
( )'
(
)' (
)' (
)' (
' '
'
' )
( )'
(
) 0
(ln
u L
0 2
)' (
)' (
)' (
)' (
)' (
'
1 1
1
1 1
1 1
u G Z
R Zu
Zu R
Z
Xb R
Z Y
R Z
Z R
Xb Z
R Y
Z R
Y u
G Zu
R Z Xb
R Z
u G Zu
R Z Xb
R Z Z
R Y
1 1
1 1
1 1
1 1
' '
'
0 2
' 2 '
2 '
2
A vegyes modell egyenletei
Z R
Y u
G Zu
R Z
Xb R
Z
Y R
X Zu
R X
Xb R
X
1 1
1 1
1 1
1
' '
'
' '
'
Z R
Y
Y R
X u
b G
Z R
Z X
R Z
Z R
X X
R X
1 1 1
1 1
1 1
' ' '
'
' '
Egyszerűsíthető, ha 2
I
eR
Y Z
Y X u
b G
Z Z X
Z
Z X X
X
e
'
' '
'
' '
1
2Az „Y” (a függő változó/tulajdonság) normál eloszlása nem szükséges
Alternatív BLUE becslési technikákkal bizonyítható, hogy ugyanezeket az
eredményeket kapjuk a normalitás
feltételezése nélkül is
Egyszerűsítések
Y Z
Y X u
b G
Z Z X
Z
Z X X
X
e
'
' '
'
' '
1
2Az additivitást feltételezve: 2
A
aG
Y Z
Y X u
b A
Z Z X
Z
Z X
X X
a
e
'
' '
'
' '
1 2
2
Csak a hányados becslése szükséges
Csak az inverze szükséges
Példa
9 6 10
9 7
Y
1 1 1 1 1
X
1 0
0 0
0
0 1
0 0
0
0 0
1 0
0
0 0
0 1
0
0 0
0 0
1
Z
5 4 3 2 1
a a a a a
U
5 4 3 2 1
e e e e e
e
b
(7) 1 (9) 2 (10) 3
(9) 5 (6) 4
Y Z
Y X u
b A
Z Z X
Z
Z X
X X
a
e
'
' '
'
' '
1 2
2
1 1 1 1 1
1 1 1 1 1 '
XX
1 1 1 1 1
'
Z
5
X' X X
1 0
0 0
0
0 1
0 0
0
0 0
1 0
0
0 0
0 1
0
0 0
0 0
1
1 1 1 1 1 '
ZX
Y Z
Y X u
b A
Z Z X
Z
Z X
X X
a
e
'
' '
'
' '
1 2
2
1 1 1 1 1
1 0
0 0
0
0 1
0 0
0
0 0
1 0
0
0 0
0 1
0
0 0
0 0
1
'
X Z
1 1 1 1 1
' X Z
1 0
0 0
0
0 1
0 0
0
0 0
1 0
0
0 0
0 1
0
0 0
0 0
1
'
Z Z
4 1 2 1
2 1 0 1
1 4 1
2 0 2 1
1 0 0 1 0 1 2 1 2 1 2
0 1
0
2 0 0 1
0 1
A
(7) 1 (9) 2 (10) 3
(9) 5 (6) 4
Tegyük fel, hogy az örökölhetőség 0,5
2
1
2
a
e
3 0
1 1
0
0 3
0 1
1
1 2 0
2 5 0 1
1 2 1
3 1 1 2
0 1
2 0 1 1
'
2 12
A Z
Z
a e
Y Z
Y X u
b A
Z Z X
Z
Z X
X X
a
e
'
' '
'
' '
1 2
2
9 6 10
9 7
1 1 1 1 1 '
YX
9 6 10
9 7
'
Z Y 41
' Y
X
A vegyes modell egyenlete
9 6 10
9 7 41
3 0
1 1
0 1
0 3
0 1
1 1
1 2 0
2 5 0 1
1
1 2 1
3 1 1 2
1
0 1
2 0 2 1
1 5
1 1
1 1
1 5
5 4 3 2 1
a a a a a
A hibavariancia becslése, ha az arány ismert
2 2
a
e
( )
ˆ ˆ ˆ
2'
X R
N
Z u X
b Y
MSE Y
e
ˆ
a2 ˆ
e2A becslések
BU
8,3018868 -0,960813 0,0754717
0,8853411 -1,062409 0,5529753
ˆ
b
5 4 3 2 1
ˆ ˆ ˆ ˆ ˆ
a a a a a
U