Title: STATISTICKI TESTOVI I RAZINA ZNACAJNOSTI
1STATISTICKI TESTOVI I RAZINA ZNACAJNOSTI
dr.sc. Vesna Ilakovac, znanstveni
suradnik Katedra za biofiziku, medicinsku
statistiku i medicinsku informatiku Medicinski
fakultet Osijek
2OSNOVNI POJMOVI
- STATISTICKI TEST
- postupak pomocu kojeg se dolazi do odluke o
prihvacanju ili odbacivanju statisticke hipoteze
uz odredenu vjerojatnost
- STATISTICKA HIPOTEZA
- izjava (tvrdnja) o nekoj karakteristici
populacije koju prihvacamo ili odbacujemo na
osnovu informacija dobivenih iz prikupljenih
podataka
NUL-HIPOTEZA (H0) polazna hipoteza koja se
testira H1 alternativna hipoteza, negacija H0
3POSTUPAK STATISTICKOG TESTIRANJA
- postavljanje nul-hipoteze
- npr.
- H0 .....m1 m2
- parametri populacija iz kojih su uzorci uzeti su
jednaki - uzorci pripadaju istoj populaciji
4POSTUPAK STATISTICKOG TESTIRANJA
- testiranje
- izracunavanje odgovarajuce test statistike i
odredivanje vjerojatnosti da su razlike u
ocjenama parametara (x1 i x2) slucajne
(p-vrijednost)
5POSTUPAK STATISTICKOG TESTIRANJA
- donošenje odluke
- o odbacivanju H0 (prihvacanju H1)
- ili
- prihvacanju H0 (odbacivanju H1)
- na odredenoj razini znacajnosti
6POGREŠKE PRI ODLUCIVANJU O STATISTICKOJ HIPOTEZI
STVARNO STANJE
ODLUKA H0 tocna H1 tocna
PRIHVATI H0 ISPRAVNO POGREŠKA TIPA 2 (b)
ODBACI H0 POGREŠKA TIPA 1 (a) ISPRAVNO
7VJEROJATNOSTI POGREŠKE
- najveca vjerojatnost pogreške tipa 1 (a) je
razina znacajnosti testa - najmanja vjerojatnost uz koju još prihvacamo H0
- kada je p lt a , test sugerira odbacivanje H0
(statisticki znacajno) - odreduje ju istraživac na temelju modela pokusa
- uobicajeno se stavlja a 0.05
8VJEROJATNOSTI POGREŠKE
- najveca vjerojatnost pogreške tipa 2 (b)
- djelomicno je pod kontrolom
- ovisi o
- stvarnom stanju u populaciji
- razini znacajnosti a
- modelu pokusa
- a i b su inverzno povezane (ali ne direktno)
9ODABIR NIVOA ZNACAJNOSTI
- pitanje štetnih posljedica pogreške
- Odluka/zakljucak da razlike postoje onda kada ih
u stvarnosti nema može prouzrociti štetne
posljedice gt smanjiti vjerojatnost nastajanja
pogreške tipa 1, tj. odabrati manji a - Odluka/zakljucak da nema razlike onda kada u
stvarnosti razlika postoji može prouzrociti
štetne posljedice gt smanjiti vjerojatnost
pogreške tipa 2, tj. odabrati veci a
10- Ispitivanja lijeka X pokazala su da njegovo
korištenje izaziva vrlo štetne posljedice te je
lijek X povucen iz uporabe. Ispitan je novi
alternativni lijek Y i ustanovljeno je smanjenje
štetnog utjecaja u odnosu na lijek X. Koju razinu
znacajnosti treba upotrijebiti za ocjenu
znacajnosti smanjenja štetnog utjecaja lijeka Y u
odnosu na lijek X?
11STVARNO STANJE Oba lijeka jednako su štetna.
STVARNO STANJE Lijek Y manje je štetan od lijeka
X.
ODLUKA Lijek Y ima manje štetne posljedice od
lijeka X.
ODLUKA Lijek Y ima jednako štetne posljedice kao
i lijek X.
a
b
12STVARNO STANJE Lijek Y manje je štetan od lijeka
X.
STVARNO STANJE Oba lijeka jednako su štetna.
ODLUKA Lijek Y ima jednako štetne posljedice kao
i lijek X.
ODLUKA Lijek Y ima manje štetne posljedice od
lijeka X.
b
a
13- Na slucajnom uzorku vozaca ispitivan je utjecaj
alkohola na vrijeme reagiranja. Mjerenja vremena
reakcije prije i nakon konzumacije odredene
kolicine alkohola pokazala su prosjecno povecanje
vremena reakcije nakon konzumacije alkohola. Koju
razinu znacajnosti treba upotrijebiti za ocjenu
znacajnosti pronadene razlike?
14STVARNO STANJE Alkohol ne utjece na vrijeme
reakcije.
STVARNO STANJE Alkohol produljuje vrijeme
reakcije.
ODLUKA Alkohol produljuje vrijeme reakcije
ODLUKA Alkohol ne utjece na vrijeme reakcije.
a
b
15STVARNO STANJE Alkohol ne utjece na vrijeme
reakcije.
STVARNO STANJE Alkohol produljuje vrijeme
reakcije.
ODLUKA Alkohol produljuje vrijeme reakcije
ODLUKA Alkohol ne utjece na vrijeme reakcije.
a
b
16POSTAVKE DIZAJNA
- opcenito testove treba dizajnirati tako da imaju
- b ? a
- gdje je odabrani b 0.2 ili 0.1
- za b 0.2 , to znaci samo 80 šanse da se
detektira odredena alternativna hipoteza kada je
stvarno tocna - izraz
- 100(1-b)
- naziva se (statisticka) SNAGA TESTA
17JEDNOSMJERNO I DVOSMJERNO TESTIRANJE
- jednosmjerno testiranje
- interes istraživaca usmjeren je na promjene u
jednom smjeru (npr. povecanje ili smanjenje) - H0 ? ? 16 H1 ? gt 16
- dvosmjerno testiranje
- interes istraživaca usmjeren je na promjenu u
bilo kojem smjeru - H0 ? 0 H1 ? ? 0
Testiranje bi trebalo biti dvosmjerno, osim ako
istraživanje posebno ne zahtijeva da se promjene
usmjere u odredenom smjeru UNAPRIJED!
18ŠTO JE P-VRIJEDNOST?
- NIJE vjerojatnost istinitosti nul-hipoteze (iako
je vrlo slicno) - JESTE vjerojatnost dobivanja istih ili
ekstremnijih rezultata kada je nul-hipoteza
istinita
19- statisticka znacajnost NIJE isto što i klinicka
važnost - bolje je navesti tocnu vrijednost p nego NS
20VIŠESTRUKA TESTIRANJA
- valjanost se smanjuje višestrukim testiranjem
- pretpostavimo da usporedujemo težinu triju
nezavisnih skupina ispitanika podvrgnutih
razlicitim tretmanima - H0 m1 m2 m3 nul-hipoteza
- H1 m1 ? m2
- H2 m1 ? m3
- H3 m2 ? m3
- (za k eksperimentalnih grupa moguce je izvršiti
k(k-1)/2 ovakve usporedbe)
alternativne hipoteze
21VIŠESTRUKA TESTIRANJA
- razina znacajnosti a može se izraziti kao
- vjerojatnost (odbacivanje H0 kada je H0
tocna) - odnosno
- 1 vjerojatnost(ne odbacivanje H0 kada je
H0 tocna) - tj. 1-(1-a)
- u slucaju višestrukih (r) testova to postaje
- 1 vjerojatnost(ne odbacivanje svih H0
kada su sve H0 tocne) - odnosno 1-(1-a)r
22VIŠESTRUKA TESTIRANJA
- ako je a 0.05, tada je za r višestrukih testova
r 1 2 3 4 5 6 7 8 9 10
ar 0.050 0.098 0.143 0.185 0.226 0.265 0.302 0.337 0.370 0.401
r 11 12 13 14 15 16 17 18 19 20
ar 0.431 0.460 0.487 0.512 0.537 0.560 0.582 0.603 0.623 0.642
23Koliko slucajnih znacajnih rezultata ocekujemo na
20 ucinjenih višestrukih testova ako su sve
nul-hipoteze istinite uz a 0.05?
U slucaju da su sve nul-hipoteze istinite, uz
a0.05 ocekujemo 5 znacajnih rezultata slucajno
gt za 20 testova to je 1, tj. ocekujemo 1
znacajan rezultat kao posljedicu SLUCAJNOSTI !
24VIŠESTRUKA TESTIRANJA
- rješenje
- prilagodba p vrijednosti u cilju održavanja opceg
nivoa znacajnosti (Bonferroni, Sidak,
Hochberg...) - primjena sofisticiranijih metoda analize (npr.
ANOVA, multivarijatne metode)
25VIŠESTRUKA TESTIRANJA
- Bonferroni metoda
- za r nezavisnih testova
- pcorr pr
- npr. za tri nezavisna testa
- H1 m1 m2 p 0.017 pcorr 0.051
- H2 m1 m3 p 0.025 pcorr 0.075
- H3 m2 m3 p 0.063 pcorr 0.189
26VIŠESTRUKA TESTIRANJA
- AKO MUCITE PODATKE DOVOLJNO DUGO ONI CE
NAPOSLIJETKU PRIZNATI !!!
27IZBOR STATISTICKOG TESTA
- Ne ovisi u velikoj mjeri o velicini uzorka nego
- prirodi (tipu) varijabli
- broju uzoraka (1, 2 ili više)
- jesu li su uzorci zavisni ili ne
28VARIJABLA VARIJABLA VARIJABLA
BROJ UZORAKA BROJ UZORAKA NOMINALNA ORDINALNA ILI KONTINUIRANA KOJA NIJE NORMALNO DISTRIBUIRANA KONTINUIRANA NORMALNO DISTRIBUIRANA
JEDAN JEDAN ?2-test Kolmogorov-Smirnov test t-test
DVA NEZAVISNI ?2-test Fisherov egzaktni test Mann-Whitney U test Medijan test Studentov t-test
DVA ZAVISNI McNemarov test Wilcoxonov test t-test diff.
VIŠE OD 2 NEZAVISNI ?2-test Kruskall-Wallis test ANOVA
VIŠE OD 2 ZAVISNI Cochran Q Stuart-Maxwell Friedmanov test ANOVA za ponavljana mjerenja
POVEZANOST DVIJU VARIJABLI POVEZANOST DVIJU VARIJABLI Koef. kontingencije Kappa koef. Spermanov r Kendalov t Pearsonov r