• Nem Talált Eredményt

2021. december 8. Valószínűségszámítás

N/A
N/A
Protected

Academic year: 2022

Ossza meg "2021. december 8. Valószínűségszámítás"

Copied!
20
0
0

Teljes szövegt

(1)

Valószínűségszámítás

2021. december 8.

Mészáros Szabolcs

Tárgyhonlap:

cs.bme.hu/valszam

(2)

A prezentáció anyagát és az abból készült videofelvételt a tárgy hallgatói jogosultak használni, kizárólag saját célra. A felvétel másolása, videómegosztókra való feltöltése részben vagy egészben tilos, illetve csak a tantárgyfelelős előzetes engedélyével történhet.

Copyright © 2021, BME VIK

(3)

Irodalomjegyzék

● Bolla M., Krámli A., Nagy-György J. - Többváltozós statisztikai módszerek

● J. L. Devore, K. N. Berk - Modern Mathematical Statistics with Application

● G. James, D. Witten, T. Hastie, R. Tibshirani - Intro to Statistical Learning

● R. W. Keener - Theoretical Statistics

(4)

Statisztika, problémafelvetés

Főhősünk, a 19. századi Kincskereső Kiss Ödön hallott az aranylázról, és fontolgatja, hogy ő is útnak indul. Néhány ismerőséről már tudja, milyen mennyiségű aranyat gyűjtöttek össze egy-egy út alatt. Hogyan tudná ezek alapján

a) megbecsülni az összeszedhető vagyon várható értékét, illetve b) eldönteni, megéri-e költeni erre az utazásra?

becsléselmélet

hipotézisvizsgálat

(5)

Várható érték becslése

Ötlet 2:

Ötlet 3: sorba rendezzük a mintát, és

nézzük a (tapasztalati) mediánt ( ≈ középsőt) Ötlet 1:

Adott: független, azonos eloszlású v. v.

Egyenletes elo.-ra jó, másra nem.

(6)

Szórásnégyzet becslése

Tapasztalati szórásnégyzet:

Szimulálva látható, pl:

pedig

Állítás: Korrigált tap. szórás:

(7)

Korrigált szórásnégyzet

Bizonyítás:

(8)

Paraméter becslése, általánosan

Definíció:

statisztikai mező, ha minden esetén val. mező.

Minta: független, azonos eloszlású val. változók.

Statisztika: val. változó, ahol Torzítatlan a paraméterre nézve, ha

Függ -tól Példa:

(9)

Torzítatlanság, megjegyzések

● A szórásnak nem torzítatlan becslése a korrigált szórásnégyzet gyöke.

● Adott paraméterhez nem feltétlenül létezik torzítatlan becslése pl. eloszlás mediánjának becslése

● Van amikor létezik torzítatlan becslés, csak rossz:

● “Bias-Variance trade-off”:

A becslés átlagos négyzetes hibája

becslés szórásnégyzete

torzítás négyzete

(10)

Becslés, példa

Legyen ahol a becsülendő paraméter.

(11)

Becslés, példa

(12)

Maximum likelihood becslés

Intuitív kérdés: melyik paraméter a legvalószínűbb, ha ezt a mintát látom.

Probléma: nem val. változó, nincs “legvalószínűbb” értéke.

Válasz 1: Tegyük fel, hogy mégis val. változó => Bayes-becslések Válasz 2: új kérdés, melyik esetén a legvalószínűbb, hogy ezt a mintát látom?

=> Maximum-likelihood becslés

(13)

Maximum-likelihood becslés

Folytonos esetben:

Ekvivalensen, maximalizáljuk:

Példa:

A paraméter M-L becslése az átlag reciproka.

(14)

Hipotézisvizsgálat, példa

Tesztelni szeretnénk, hogy egy adott szolgáltatás esetében egy változtatás növeli-e a szolgáltatás addigi 25%-os sikerarányát.

fals pozitív, elsőfajú hiba (Type I)

fals negatív, másodfajú hiba (Type II)

(15)

Hipotézisvizsgálat, fogalmak

● Tesztstatisztika:

● Null hipotézis, : status quo

● Ellenhipotézis, : találtunk valamit

● Kritikus tartomány: amilyen értékek esetén elvetjük -t.

● Elsőfajú hiba: elvetjük -t, pedig igaz.

● Másodfajú hiba: nem vetjük el -t pedig hamis.

● Terjedelem: elsőfajú hiba valószínűsége,

● Erőfüggvény: 1 - (másodfajú hiba valószínűsége), a paraméter függvényében

● p-érték: tegyük fel, hogy igaz, és a tesztstatisztika értéke . Ekkor a p-érték

(“mennyire mond ellent a nullhipotézisnek”)

(16)

p-érték, vizualizálva

(17)

Hipotézisvizsgálat, példa

Terjedelemet rögzítjük:

Ebből a kritikus érték meghatározható:

=> erő függvény:

Ha ehelyett -at használnánk, akkor de az erőfüggvény gyengébb lesz.

(18)

u-próba (z-test)

Minta:

ahol ismert, ismeretlen paraméter

: : attól függ, legyen most

Próbastatisztika: Állítás: esetén

Tehát

amiből meghatározható.

(19)

t-próba

Kérdés: mit csináljunk, ha nem ismert?

Próbastatisztika:

Állítás: esetén

(20)

Köszönöm a figyelmet!

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

8 Így logit modellek esetén endogén minta esetében is használhatjuk az egyszerű maximum likelihood becslést, csupán a konstansra – kettőnél több elemű döntési

● a koordináták függetlenek (hiszen a sűrűségfüggvény szorzattá bomlik) Kérdés: Hogyan kapjuk a nem standard -dim normális eloszlásokat. Itt is várható érték

Már itt megjegyezzük azonban, hogy adott küszöbérték esetén a becslés maximum likelihood módszerrel (2. pont) könnyen elvégezhető.. A pontbecslés mellett GEV-

• Plan de Joffre > entrée en Alsace >> succès rapide.. • Armée allemande > Belgique >

• Assemblée nationale > Versailles <> Paris >

Az SZTE KK honlapja => Katalógus => (Gyors)keresés... Az SZTE KK honlapja =>

● a koordináták függetlenek (hiszen a sűrűségfüggvény szorzattá bomlik) Kérdés: Hogyan kapjuk a nem standard -dim normális eloszlásokat. Itt is várható érték

Melyiknek nagyobb az esélye: hogy a gráf fagráf, vagy hogy legfeljebb két éle van. Megoldás: 6 lehetséges él, 2^6 = 64 lehetséges gráf (ez