Title: statistick
1statistické testy
- z náhodného výberu vyvozuji závery ohledne
základního souboru - casto potrebuji porovnat dva výbery mezi sebou,
porovnat prumer náhodného výberu a teoretickou
strední hodnotu, pocty pozorované a ocekávané
atd.
2liší se hmotnost samic a samcu?
- mám hypotézu H mf ? mm
- predpokládám, že se liší
- hypotézu nemužu potvrdit (verifikovat) ? zkusím
zamítnout (falzifikovat) nulovou hypotézu H0 mf
mm - mají stejnou hmotnost
- pokud ji zamítnu, prijmu opacnou alternativní
hypotézu HA (tu moji puvodní) - prumer mf, mm se témer urcite bude lišit. Bude se
lišit tak, abych mohl zamítnout H0?
3statistické testy
- z dat spocítám testovou statistiku, která má
známé teoretické rozdelení (t, F, ?2, U.) - lze urcit, jakou hodnotu bude testová statistika
mít, pokud platí H0 - na základe stupnu volnosti (d.f., s.v. z poctu
nezávislých pozorování) stanovím, jestli odchylky
jsou jen dílem náhody - p
4statistické testy
- definuji si hladinu významnosti a
pravdepodobnost, že zamítnu H0 ackoli platí
chyba prvního druhu - vetšinou 5 ( 0.05)
- pokud spocítané p je menší než a zamítám H0 a
tím prijímám HA
5statistické testy
- jako výsledek statistického testu uvádím
- hodnotu testové statistiky (t, F, ?2, U..)
- stupne volnosti (degrees of freedom d.f., s.v.)
- dosažená hladina významnosti (p)
- t 3.414, d.f. 28, p 0.0215
- t (28) 3.414, p 0.0215
- t28 3.414, p 0.0215
6Studentuv t-test
7- testuji, zda muj výber má strední hodnotu shodnou
s danou hodnotou jednovýberový t-test (H0 µ
k) - dlouhodobá prumerná denní teplota v cervnu je
rovna 17.5 C. Byla letos stejná? - testuji, zda dva náhodné výbery (nezávislé)
pochází ze stejného základního souboru (mají
stejnou strední hodnotu) dvouvýberový t-test
(H0 µA µB) - hmotnost samic a samcu,.
- testuji, zda rozdíl párových hodnot (závislých)
je roven dané hodnote (vetš. 0) - párový t-test
(H0 µ1- µ2 0) - hmotnost pred a po zásahu, délka pravé a levé
nohy,.
8Studentuv t-test
- predpoklad použití
- normalita dat
- pracuji s prumery, pokud mám dostatek dat, tak se
rozdelení blíží normálnímu (centrální limitní
veta) - pokud mám dat málo, vetšinou nemužu zamítnout že
data nepochází z normálního rozdelení - ne kategoriální ci ordinální stupnice!
- shodnost variancí ale ruzné modifikace
9Príklad
- merím zadní stehno bruslarky a chci porovnat,
jestli se liší samci a samice - chci zjistit, jestli se liší znalosti ( pocet
bodu v testu) žáku 2 gymnázií - merím strevle ve dvou rekách a chci zjistit,
jestli jsou stejne velké - ? dvouvýberový t-test
10Príklad
- merím zadní stehno bruslarky a chci porovnat,
jestli se liší levé a pravé - chci zjistit, jestli se liší znalosti ( pocet
bodu v testu) žáku pred a po prázdninách /
prednášce - vážím lidi (myši) pred a po snezení 0.1 kg cukru
je zmena 0.1 kg? - ? párový t-test
11formální provedení
- chci ukázat strevle z povodí Stropnice jsou
jinak velké než strevle z povodí Cerné (musím
zduvodnit proc!) - formuluji hypotézu H0 Výbery namerených délek
strevlí pochází z jednoho základního souboru
(prumery se neliší) - alternativní hypotéza HA Výbery namerených
délek strevlí z povodí Stropnice i Cerné
nepochází z jednoho základního souboru ( strevle
obou povodí jsou ruzne velké) - provedu testování, jak moc je pravdepodobné že
oba výbery pochází ze stejného souboru - pokud je pravdepodobnost malá (p lt 0.05), zamítnu
H0 a akceptuji HA - pokud je p gt 0.05, nemužu zamítnout H0 (ale ani
HA!)
12dvouvýberový t-test
- rovnají se rozptyly?
- shodnost rozptylu testuji F-testem (H0 s21
s22) - pokud p vetší než 0.05 nemužu zamítnout H0 ?
rozptyly se rovnají (asi) - pokud p menší než 0.05 mužu zamítnout H0 ?
rozptyly se nerovnají (asi)
13Statistica
- data se zadávají jinak než v Excelu
- každý sloupec je jedna promenná
- u t-testu je jedna kategoriální promenná (zde
povodí) a jedna kvantitativní (zde délka)
14(No Transcript)
15dvouvýberový t-test, data ve sloupci pod sebou
dvouvýberový t-test, data ve sloupcích vedle sebe
(jako v Excelu)
párový t-test, data ve sloupcích vedle sebe (jako
v Excelu)
jednovýberový t-test na strední hodnotu
16(No Transcript)
17výsledek testu se ukládá v samostatném souboru
výsledek F-testu
výsledek t-testu
18další výsledky, grafy apod.
19Grafické vyjádrení
- pro znázornení t-testu je vhodný krabicový graf
20výsledek
- Prumerná velikost strevlí z povodí Stropnice a
Cerné se signifikantne liší (t (33) -2.61, p
0.013) - dobré je i uvést výsledek F-testu Po nezamítnutí
homogenity variancí (F(15,18) 1.429, p
0.466).. - formálne zamítám H0 o shodnosti velikostí
strevlí z obou povodí.
21test jednostranný a dvoustranný
- testuji zda A se liší od B (H0 AB)
dvoustranný - testuji zda A je menší / vetší než B (H0 AB) -
jednostranný
22chyby statistických testu testu
pravdepodobnost chyby je a hladina významnosti
rozhodnutí
zamítnu H0 nezamítnu H0
H0 platí (napr. AB) chyba 1. druhu správne
H0 neplatí (napr. A?B) správne chyba 2. druhu
realita
pravdepodobnost chyby je ß neznáme