Title: Statistik Lektion 2
1StatistikLektion 2
- Betinget sandsynlighed
- Bayes regel
- Diskrete stokastiske variable
2Repetition
Stikprøve
Population
- Stikprøve
- Stikprøvestørrelse n
- Stikprøvemiddelværdi
- Stikprøvevarians s2
- Population
- Populationsstørrelse N
- Populationsmiddelværdi µ
- Populationsvarians s2
3Repetition
- Udfaldsrum S
- Hændelse A ? S
- Simpel hændelse Oi
- Regler
- 0 P(A) 1
- P(A) S P(Oi)
- P(S) 1
- Regler
- P(Ø) 0
- P(A?B) P(A) P(B) - P(A?B)
- P(A) 1 - P(A)
4Lov om Total Sandsynlighed
- Lov om total sandsynlighed
- Vha. B kan vi opdele A i to disjunkte dele.
_ B
B
A
5Eksempel Lov om Totalsandsynlighed
- Kortspil find sandsynligheden for at trække et
billedkort, A - Det må være sandsynligheden for at trække en
billedkort i Hjerter (H), Spar (S), Ruder (R)
eller Klør (K) - P(A)P(AnH) P(AnS) P(AnR) P(AnK)
- 3/52 3/52 3/52 3/52 12/52
Spar
Hjerter
Ruder
Klør
AnS
AnR
AnH
AnK
A
6Betinget sandsynlighed
- Den betingede sandsynlighed P(AB) er
sandsynligheden for hændelsen A, givet at vi ved
at hændelsen B allerede er indtruffet -
- Ligeledes
-
7(No Transcript)
8Betinget sandsynlighed - intuition
- Antag alle udfald er lige sandsynlige, dvs.
- N antal udfald i udfalds rum
- NA antal udfald i hændelse A
- Hvad er sandsynligheden for A givet at B er
indtruffet?
S
A
B
9Eksempel Sennep og Ketchup
- A Bruger sennep
- B Bruger ketchup
- A?B Bruger både sennep og ketchup
- P(A) 75 P(B) 80 P(A?B) 65
- Hvad er sandsynligheden for at en ketchupbruger
bruger sennep?
10Simultan og Marginal Sandsynlighed
- Simultan sandsynlighed er sandsynligheden for at
en eller flere hændelser indtræffer simultant, fx
P(AnB) - Marginale sandsynligheder beregnes ved at summere
over rækker og søjler
A A Marginaler
B P(AnB) P(AnB) P(B) P(A nB) P(A nB)
B P(AnB) P(AnB) P(B)
Marginaler P(A) P(A nB) P(A nB) P(A) 1.0
11Simultan og Marginal Sandsynlighed
- A Bruger sennep
- B Bruger ketchup
- P(A) 75 P(B) 80 P(A?B) 65
A A Marginaler
B P(AnB) 0.65 P(AnB) P(B) 0.80
B P(AnB) P(AnB) P(B)
Marginaler P(A) 0.75 P(A) 1.0
12Multiplikationsregel
- Betinget sandsynlighed
- Omskrives til multiplikationsreglen
- Eksempel Konsulent på jagt efter job A og job B.
Sandsynligheden for at få job A er P(A) 0.45.
Givet at han får job A er sandsynligheden for at
få job B P(BA) 0.9. - Spørgsmål Hvad er sandsynligheden for at
konsulent får både job A og job B? - Svar
13Uafhængighed
- To hændelser A og B er statistisk uafhængige,
hvis og kun hvis - Konsekvenser Hvis A og B er statistisk
uafhængige hændelser -
-
- Fortolkning af P(BA) P(B) Selvom vi ved at A
er indtruffet, ændrer det ikke på sandsynligheden
for B.
14Eksempel Check for uafhængighed
- A Kandidat er kvinde
- B Kandidat i økonomi
- Vides
- P(A) 48 P(B) 17.5 P(A?B) 6
- Spørgsmål Er hændelserne A og B statistisk
uafhængige? - Svar Hvis stat. uafh, så skal der gælde
- Check P(A)P(B) 0.480.175 0.084 ? 0.06
P(A?B) - Dvs. A og B er ikke statistisk uafhængige.
15Bayes Sætning
- Betinget sandsynlighed
- Multiplikationsregel
- Kombineres til Bayes Sætning
- Bemærk De betingede sandsynligheder er vendt.
16Bayes Udvidede Sætning
- Hvis E1, E2, , EK er disjunkte og udtømmende
hændelser i S, så gælder - Bayes Sætning
(Lov om total sandsynlighed multiplikationsregle
n)
17Bayes sætning Test for sjælden sygdom
- En test for en sjælden sygdom, der rammer 0,1 af
befolkningen (P(I)0,001), er upræcis. Lad i det
følgende -
- Sandsynligheden for at testen er positiv når man
er syg - Sandsynligheden for at testen er positiv, når man
er rask - Hvad er så sandsynligheden for at man er syg,
givet at testen var positiv?
18Stokastisk Variabel Et eksempel
Betragt de forskellig mulige ordninger af drenge
(B) og piger (G) i fire fødsler. Der er
222224 16 muligheder og udfaldsrummet er
BBBB BGBB GBBB GGBB BBBG BGBG
GBBG GGBG BBGB BGGB GBGB
GGGB BBGG BGGG GBGG GGGG Hvis pige og
dreng er lige sandsynlige, P(G) P(B) 1/2,
og kønnet af hvert barn er uafhængig af kønnet på
det foregående barn, så er sandsynligheden for
hver af disse 16 muligheder (1/2)(1/2)(1/2)(1/2)
1/16.
19Eksempel - fortsat
- Tæl antallet af piger i hver af de fire fødsler
- BBBB (0) BGBB (1) GBBB (1) GGBB (2)
- BBBG (1) BGBG (2) GBBG (2) GGBG (3)
- BBGB (1) BGGB (2) GBGB (2) GGGB (3)
- BBGG (2) BGGG (3) GBGG (3) GGGG (4)
- Bemærk at
- hvert mulig udfald tildeles en enkelt værdi
- værdierne, der tildeles varierer over de
forskellige udfald - Antallet af piger er en stokastisk variabel
- En stokastisk variabel , X, er en funktion, der
tildeler en enkelt, men variabel værdi til hvert
element i udfaldsrummet.
20Eksempel - fortsat
Punkter på den reelle linie
21Stokastisk variabel - formel definition
- En stokastisk variabel X er en funktion defineret
på S (udfaldsrummet), der antager værdier på R
(reelle tal) - I eksperimenter knyttes en talværdi til hvert
udfald - Stokastiske variable kan enten være diskrete
eller kontinuerte. - Diskrete Antager et endeligt antal værdier
- Kontinuerte Antager værdier i en mængde af
reelle tal
X
S
oi
R
X(oi)
0
22Eksempler på diskrete og kontinuerte variable
Eksperiment Stokastisk variabel Type
Kast med terning Antal øjne Diskret
Kast med 2 terninger Sum af antal øjne Diskret
Familie i Danmark Antal børn Diskret
Familie i Danmark Indkomst Kontinuert
Kvinder i Danmark Højde Kontinuert
Baby Fødselsvægt Kontinuert
Resten af denne forelæsning ser vi på diskrete
stokastiske variable
23Eksempel - fortsat
Eksempel Den stokastisk variabel X 3 når de
følgende fire hændelser BGGG, GBGG, GGBG, eller
GGGB forekommer, P(X 3) P(BGGG)
P(GBGG) P(GGBG) P(GGGB) 4/16 Sandsynligheds
fordelingen af en stokastisk variabel er en
tabel, der opskriver alle de mulige værdier af en
stokastisk variabel og deres tilknyttede
sandsynligheder. x P(Xx) For
eksemplet 0 1/16 1 4/16 2 6/16 3
4/16 4 1/16 16/161
24Eksempel - fortsat
Sandsynlighedsfordeling for antal piger i fire
fødsler
Sandsynlighed, P(x)
Antal piger, X
25Sandsynligheds fordeling
Definition Lad XS?R være en diskret stokastisk
variabel. P(Xx) P(x) er en sandsynligheds-ford
eling (-funktion) for X, hvis
-
-
Notation Store bogstaver (fx X) betegner
stokastisk variable. Små bogstaver (fx x)
betegner konkrete værdier af X.
26Kumulativ fordelingsfunktion
Den kumulative fordelingsfunktion, F(x), for en
diskret stokastisk variabel X er
Kumulative fordelingsfunktions for antallet af
piger ved 4 fødsler
x P(x) F(x) 0 1/16 1/16 1 4/16
5/16 2 6/16 11/16 3 4/16 15/16 4 1/16
16/16 1.00
1
.
0
0
.
9
0
.
8
0
.
7
0
.
6
)
x
(
0
.
5
F
0
.
4
0
.
3
0
.
2
0
.
1
0
.
0
4
3
2
1
0
x
27Eksempel - fortsat
- x P(x) F(x)
- 0 1/16 1/16
- 1 4/16 5/16
- 2 6/16 11/16
- 3 4/16 15/16
- 4 1/16 16/16
- 1.00
28Middelværdi
- Middelværdien af en diskret stokastisk variabel X
er givet ved - Dvs. summen af værdien gange sandsynligheden for
værdien et vægtet gennemsnit. - Bemærk! Middelværdien for en stokastisk variabel
kaldes også den forventede værdi.
29Middelværdi - Eksempel
x P(x) xP(x) 0 1/16 1 4/16 2 6/16 3
4/16 4 1/16 16/161
Eksempel X er antal øjne ved terningkast. Dvs.
P(X1) P(X2) P(X6) 1/6. Den forventede
værdi er
30Varians
- Variansen for en diskret stokastisk variabel er
givet ved - Standard afvigelsen er kvadratroden af variansen
31Varians Eksempel
x x2 P(x) x2P(x) xP(x) 0 0 1/16 0 0 1 1
4/16 4/16 4/16 2 4 6/16 24/16 12/16 3 9
4/16 36/16 12/16 4 16 1/16 16/16
4/16 1 80/16 32/16
32Regneregler for middelværdi og varians
- Hvis X er en diskret stokastisk variabel, da er
middelværdien for en funktion h(X) givet ved - Regneregler for en lineær funktion af X
33Eksempel
- Håndboldspiller er på resultatkontrakt, hvor han
får 1500kr i bonus pr mål. - Lad X være den stokastiske variabel, der svarer
til antal mål scoret i èn kamp. - Det vides at EX 4.6 VX 5.2
- Hvad er den forventede bonus pr kamp? Variansen?
- Bonus pr kamp B 1500 X
- EB VB
34Simultan Sandsynlighedsfordeling
- Hvis X og Y er to stokastiske variable, så er
P(Xx,Yy) P(x,y) en simultan
sandsynlighedsfunktion for X og Y, hvis - Den Marginal sandsynlighedsfordeling er
(joint probability function)
-
-
35Eksempel Alder og Salg
- Sammenhæng mellem aldersgruppe (X) og købsmønster
(Y)
Aldergruppe (X) Aldergruppe (X) Aldergruppe (X) Aldergruppe (X)
Købs-mønster (Y) 1 (16 til 25) 2 (26 til 45) 3 (46 til 65) P(y)
1 (køb) 0.10 0.20 0.10 0.40
2 (ej køb) 0.25 0.25 0.10 0.60
P(x) 0.35 0.45 0.20 1.00
36Betinget Sandsynligheder for SV
- For to diskrete stokastiske variable er den
betingede sandsynligheden for Xx givet Yy givet
ved - Eksempel Betingede sandsynlighed for køb
(Eksempel Betingede sandsynlighed for køb (Y1)
givet kund i aldergruppen 26 til 45 (X 2). - Svar P(X2,Y1) P(2,1) 0.20 og P(X2) 0.45
37Uafhængighed
- To diskrete stokastiske variable X og Y er
uafhængige hvis og kun hvis - for alle x og y, hvor P(x) og P(y) er de
marginale sandsynligheds-funktioner. - Eksempel Er aldersgruppe og købsmønster
uafhængige? - Svar
- Dvs. der er ikke uafhængighed.
38Kovarians
- X stokastisk variabel med forventet værdi µX
- Y stokastisk variabel med forventet værdi µY
- Kovariansen mellem X og Y er givet ved
- Hvis X og Y har diskrete stokastiske variable med
simultan sandsynligheds funktion P(x,y), så er
kovariansen givet ved
39Middelværdi og Varians for Par af Stokastiske
Variable
- Lad X være SV med forventet værdi mx og varians
s2X - Lad Y være SV med forventet værdi mY og varians
s2Y - Da gælder
- Eksempler
- EXY VXY
- EX-Y VX-Y
40Regneregler for middelværdi og varians
Middelværdien af en linearkombination af
stokastiske variable X1,X2,,Xk.
Hvis X1,X2,,Xk er indbyrdes uafhængige, så