Igen-nem seg - PowerPoint PPT Presentation

1 / 103
About This Presentation
Title:

Igen-nem seg

Description:

Title: Hipot zisvizsg latok Author: Andras Vargha Last modified by: Dr Vargha Andr s Created Date: 11/14/1997 10:00:26 AM Document presentation format – PowerPoint PPT presentation

Number of Views:122
Avg rating:3.0/5.0
Slides: 104
Provided by: Andra160
Category:
Tags: igen | nem | seg

less

Transcript and Presenter's Notes

Title: Igen-nem seg


1
Igen-nem segítségével megválaszolható kérdések
  • 1. Egyetemi hallgatók IQ-ja nagyobb-e az
    átlagosnál?
  • 2. Van-e különbség a férfiak és a nok verbális
    intelligenciaszintje között?
  • 3. Teljes csöndben jobban lehet-e tanulni, mint
    halk zene mellett?
  • 4. Összefügg-e a nyugalmi vérnyomásszint és a CPI
    teszt Tolerancia skálájának értéke?

2
XMAWI-IQ, populáció egyetemi hallgatók
  • H0 E(X) 100
  • H1 E(X) lt 100
  • H2 E(X) gt 100
  • H0 Med(X) 100
  • H1 Med(X) lt 100
  • H2 Med(X) gt 100
  • H0 E(X) 100
  • HA E(X) ? 100
  • H0 Med(X) 100
  • HA Med(X) ? 100

3
Verbális intelligencia MAWI/VIQ, E(VIQ/férfi)
?f, E(VIQ/no) ?n
  • H0 ?f ?n
  • H1 ?f lt ?n
  • H2 ?f gt ?n
  • H0 ?f ?n
  • HA ?f ? ?n

4
  • A fenti hipotézisek a vizsgált változók
    valamilyen populációbeli jellemzojére (várható
    érték, medián stb.) vonatkoznak.
  • Közülük egyszerre mindig csak egy lehet igaz
    (egymást kizáró alternatívák).
  • H0, a nullhipotézis mindig csak egyféleképpen
    valósulhat meg. Az ellenhipotézisek (alternatív
    hipotézisek) végtelen sokféleképpen.

5
A statisztikai hipotézisvizsgálat
  • Lényege A véletlen mintából valamilyen
    statisztikai eljárással javaslatot kell tenni
    arra, hogy a nullhipotézis az igaz, vagy pedig az
    (egyik) ellenhipotézis.
  • A statisztikai hipotézisvizsgáló eljárásokat
    statisztikai próbáknak nevezzük.
  • Statisztikai próba döntési szabály

6
X-minta
Statisztikai próba
H0
Melyik az igaz?
H1
H2
7
Egy példa melyik hipotézis az igaz?
  • H0 E(X) 100
  • H1 E(X) lt 100
  • H2 E(X) gt 100

Lehetséges minták
  • X (108, 99, 105, 135, 124)
  • X (65, 91, 58, 73, 69)
  • X (97, 107, 93, 104, 101)

8
Néhány példa intervallumbecslésre (? nem ismert,
?? ?? 0,95)
Változó
n
átlag
s
??
n
c1
c2
szórás
Pulzus
116
91,4
22,43
2,08
87,27
95,52
SZISZ
117
134,37
12,85
1,19
132,01
136,72
DIASZ
117
78,18
10,83
1,00
76,20
80,16
C0,95 x t????s??
t???? ? 1,98
9
Egy eljárás a H0 E(X)100 hipotézis vizsgálatára
  • 1. Intervallumbecslés E(X)-re C0,95 (c1 c2)

X
100?
100?
100?
c2
c1
2. E(X) valószínuleg c1 és c2 között van. 3. Ha a
100 is c1 és c2 között van, tartsuk meg H0-t! 4.
Ha c2 lt 100, fogadjuk el a H1 E(X) lt 100
hipotézist! 5. Ha c1 gt 100, fogadjuk el a H2
E(X) gt 100 hipotézist!
10
Egy másik eljárás a H0 E(X) A
alakúhipotézisek vizsgálatára (? ismert)
Ha H0 E(X) A igaz, akkor az
???
u
??
mennyiség standardizáltja, ami X normalitása,
illetve nagy n-ek esetén N(0,1) eloszlású. Mivel
u lt 1,96 95-os valószínuséggel teljesül,
nem számítunk arra, hogy u ? -1,96 vagy u ? 1,96
következik be. Ha mégis ezek lépnek fel, arra
gondolunk, hogy H0 nem igaz.
11
Példák
  • Fej vagy írást játszunk és partnerünk 10-szer
    egymás után nyer a saját érméjével. Mire
    következtetünk ebbol?
  • 21-ezünk és partnerünk 3-szor egymás után 2 ászt
    oszt magának. Mire gondolunk?
  • 8 fos csoport egymás után két nyelvi tesztet tölt
    ki. 8 személy közül 7-nél az elso teszt-eredmény
    a jobb. Hogyan értelmezzük ezt?

12
u-próba
Feltételek X normális eloszlású, ? ismert
H0 E(X) ?0
X-minta
N(0,1)
???0
u
??
1.96
-1.96
?
u ? -1,96
u ? 1,96
u lt 1,96
H1 E(X) lt ?0
H0
H2 E(X) gt ?0
13
Mi lehet az igazság?
??????
???????
???????
u
u
u
H0
H2
H1
?
?
?
??
??
H0 ? 100
??100
u
s 15, n 25
??
14
A H0 E(X) A hipotézis vizsgálata, ha ?-t nem
ismerjük
Ha H0 E(X) A igaz, akkor a
???
t
s/
mennyiség X normalitása (illetve nagy n)
esetén t-eloszlású, f n -1 szabadságfokkal.
Mivel t lt t0,05 95-os valószínuséggel
teljesül, nem számítunk arra, hogy t ? -t0,05
vagy t ? t0,05 következik be. Ha mégis ezek
lépnek fel, arra gondolunk, hogy H0 nem igaz.
15
Egymintás t-próba
Feltétel X normális eloszlású
X-minta
H0 E(X) A
t
???
t
s?
?
t lt t0,05
t ? -t0,05
t ? t0,05
H1 E(X) lt A
H0
H2 E(X) gt A
16
A H0 E(X) A hipotézis vizsgálataaz egymintás
t-próbával
Változó
átlag
A
t
t0,10
t0,05
t0,01
f n-1
Pulzus
91,4
80
5,473
115
1,66
1,98
2,62
SZISZ
134,4
130
3,677
116
1,66
1,98
2,62
DIASZ
78,2
90
-11,803
116
1,66
1,98
2,62
P/K-E
6,2
0
3,987
114
1,66
1,98
2,62
SZ/K-E
0,65
0
0,477
115
1,66
1,98
2,62
D/K-E
-1,1
0
-0,806
115
1,66
1,98
2,62
Hogyan döntsünk az egyes esetekben?
17
A kétoldalú statisztikai próba alapfogalmai a
t-próbán bemutatva (szignifikanciaszint ?)
t
??????????
???????????
???????????
Elfogadási tartomány
t0,05
-t0,05
Kritikus tartomány
Kritikus tartomány
Kritikus értékek
18
A felso egyoldalú statisztikai próba
alapfogalmai a t-próbán bemutatva
(szignifikanciaszint ?)
t
Feltétel H1 E(X) lt A érdektelen
H0 E(X) A H2 E(X) gt A
??????????
????????
Elfogadási tartomány
t0,10
Kritikus tartomány
Kritikus érték
19
Az alsó egyoldalú statisztikai próba
alapfogalmai a t-próbán bemutatva
(szignifikanciaszint ?)
t
Feltétel H2 E(X) gt A érdektelen
H0 E(X) A H1 E(X) lt A
??????????
????????
Elfogadási tartomány
t0,10
Kritikus tartomány
Kritikus érték
20
A statisztikai próba hibái
  • H0 elutasítása esetén
  • Hiba jogtalan elutasítás
  • Hiba neve I. fajta hiba vagy elsofajú hiba
  • Hiba valószínusége ? szignifikanciaszint
  • Mi függ tole a próba érvényessége
  • H0 megtartása esetén
  • Hiba jogtalan elfogadás
  • Hiba neve II. fajta hiba vagy másodfajú hiba
  • Hiba valószínusége általában ismeretlen
  • Mi függ tole a próba érzékenysége

21
Szokásos statisztikai szóhasználat
  • Ha a statisztikai próbában 0,95 megbízhatósággal
    (azaz ? 0,05 elsofajú hibaszintet választva)
    elutasíthatjuk a H0 nullhipotézist, akkor ezt
    mondjuk a próba szignifikáns (5-os szinten).
  • Speciálisan a H0 E(X) A hipotézis elutasítása
    esetén ezt mondjuk szignifikánsan különbözik
    az A hipotetikus értéktol, éspedig
  • t lt -t0,05 esetén szignifikánsan kisebb,
  • t gt t0,05 esetén pedig szignifikánsan nagyobb,
  • mint A.

22
Szokásos statisztikai szóhasználat
  • Ha a statisztikai próbában a H0 nullhipotézist ?
    0,05 szignifikanciaszinten megtartjuk, akkor
    ezt mondjuk a próba 5-os szinten nem
    szignifikáns.
  • Speciálisan a H0 E(X) A hipotézis megtartása
    esetén ezt mondjuk az átlag nem különbözik
    szignifikánsan az A hipotetikus értéktol.
  • FONTOS a H0 nullhipotézis megtartása nem
    jelenti azt, hogy a H0 nullhipotézis igaz. Csupán
    nincs elég indokunk arra, hogy elutasítsuk.
    (Ártatlanság vélelme.)

23
Milyen szignifikanciaszinten döntsünk?
  • Ha 10-os szintet használunk, akkor a H0
    nullhipotézis elutasítása esetén 90 az esélye
    annak, hogy helyesen döntünk. A 10-os
    hibalehetoség túl nagy, ezért ezt az eredményt
    csak tendenciaszeru jelzésként értelmezzük.
  • 1-os szinten a 99-os megbízhatóság kiváló.
    Ekkor azonban ritkábban utasítjuk el H0-t, mint
    kellene, ami csökkenti a próba érzékenységét.
  • Tapasztalat az 5-os szint használata az
    ajánlott.

24
Két változó vagy populáció összehasonlítása
  • 1. Szkizofréneknél különbözik-e egymástól a
    verbális és a performációs IQ szintje?
  • 2. Teljes csöndben jobban lehet-e tanulni, mint
    halk zene mellett?
  • 3. A neurotikusok toleranciája kisebb-e, mint a
    pszichopatáké?
  • 4. Jobbak-e azok a házasságok, amelyekben a férj
    és a feleség iskolai végzettsége megegyezik, mint
    amelyekben különbözik?

25
Két középérték összehasonlítása
  • Példák
  • H0 E(VIQ/Sch) E(PIQ/Sch)
  • H0 E(Telj/csönd) E(Telj/halk zene)
  • H0 E(CPI-Tol/Neurot) E(CPI-Tol/Ppata)
  • H0 E(Ház.jó/azon.isk) E(Ház.jó/kül.isk)
  • Általában (ha X és Y kvantitatív)
  • H0 ?1 ?2

26
Egy populáció, két változó esete
  • Példa Szkizofréneknél VIQ és PIQ összevetése.
  • Megoldás Z VIQ-PIQ, vagy esetleg (kizárólag
    arányskálájú változóknál) Z Y/X.
  • Az új nullhipotézis
  • H0 E(Z) 0 vagy H0 E(Z) 1.
  • Statisztikai próba egymintás t-próba.
  • Végrehajtás véletlen mintavétel, z-adatok
    kiszámítása, végül a Z-mintán egymintás t-próba.

27
Két populáció, egy változó esete
  • Példa Férfiak és nok verbális IQ-jának
    összevetése.
  • Nullhipotézis H0 ?1 ?2
  • Mintavétel A két populációból egymástól
    függetlenül kiválasztunk egy-egy véletlen mintát.
  • Számítás A két mintában kiszámítjuk az átlagot
    és a varianciát
  • Elemszám Átlag Variancia
  • 1. Minta n1 x1 var1 (s1)2
  • 2. Minta n2 x2 var2 (s2)2

28
A kétmintás t-próba
  • Ha igaz a H0 ?1 ?2 nullhipotézis és X
    normális
  • eloszlású, akkor ?1 ?2 teljesülése esetén a

statisztikai mennyiség f f1 f2
szabadságfokú t-eloszlást követ, ahol f1 n1-1,
f2 n2-1 és
29
Kétmintás t-próba
Feltételek független minták, normális eloszlás,
?1 ?2
X-minta
H0 ?1 ?2
t
?
t ? t0,05
t lt t0,05
t ? -t0,05
H1 ?1 lt ?2
H2 ?1 gt ?2
H0
30
A Welch-féle d-próba
  • Ha igaz a H0 ?1 ?2 nullhipotézis és X
    normális
  • eloszlású, akkor a

statisztikai mennyiség közelítoleg f
szabadságfokú t- eloszlást követ, ahol
aVar1/n1, bVar2/n2 jelöléssel
31
Welch-féle d-próba
Feltételek független minták, normális eloszlás
X-minta
H0 ?1 ?2
t
?
d ? -t0,05
d lt t0,05
d ? t0,05
H1 ?1 lt ?2
H2 ?1 gt ?2
H0
32
A Fisher-féle F-próba
Kérdés Két populáció szórása megegyezik-e?
Ez fontos a kétmintás t-próba végrehajthatósága
szem- pontjából, de önmagában is izgalmas
probléma. F-próba Ha igaz a H0 ?1 ?2
nullhipotézis és X normális eloszlású, akkor az
statisztikai mennyiség (f1, f2)
szabadságfokú F-eloszlást követ, ahol f1 a
nagyobbik, f2 pedig a kisebbik mintavariancia
szabadságfoka.
33
Fisher-féle F-próba
Feltételek független minták, normális eloszlás
X-minta
H0 ?1 ?2
F
??????
?????
?
?
F0,025
F lt F0,025
F ? F0,025
H0 ?1 ?2
HA ?1 ? ?2
34
Robusztus statisztikai próbák
  • A Welch-féle d-próba a kétmintás t-próba
    robusztus (a feltételekre kevésbé érzékeny)
    változatának tekintheto, mert ugyanazon a
    nullhipotézis vizsgálatára alkalmas, csak enyhébb
    feltételek mellett.
  • Az F-próba robusztus változatai a
    szóráshomogenitás ellenorzésére, amelyek a
    normalitás megsértésére kevésbé érzékenyek
  • Levene-próba
  • OBrien-próba

35
Két kvantitatív változó kapcsolata
36
Mi az, hogy kapcsolat?
  • Együttjárás, együttmozgás, együttváltozás
  • Hatás, függés
  • Úgy táncolsz, ahogy én fütyülök
  • Függetlenség
  • Járja a maga útját

37
Determinisztikus függvénykapcsolat
  • Ha egy autó 80 km/óra sebességgel halad az
    autó-pályán, akkor t óra alatt hány km-t tesz
    meg?
  • Válasz s 80t

400
320
240
160
S Megtett út (km)
80
0
0
1
2
3
4
5
t Eltelt ido (óra)
38
Nem determinisztikus összefüggések
  • Tanulj fiam,
  • hogy szép legyen a bizonyítványod,
  • hogy meg ne bukj matekból,
  • hogy felvegyenek az egyetemre,
  • hogy vidd valamire az életben.

39
A kétváltozós pontdiagram
5
4
Tanulmányi átlag
3
2
0
1
2
3
4
5
Hány órát tanul naponta
40
Egy KSH-vizsgálat adatai (I)
55
50
45
Születési testhossz (cm)
40
35
1
2
3
4
5
Születési súly (kg)
41
Egy KSH-vizsgálat adatai (II)
145
140
135
130
Testmag. 10 évesen (cm)
125
120
115
20
25
30
35
40
45
Testsúly 10 éves korban (kg)
42
Egy KSH-vizsgálat adatai (III)
145
140
135
Gyerek testmag. 10 év (cm)
130
125
120
155
160
165
170
175
180
185
190
Apa testmagassága (cm)
43
Egy KSH-vizsgálat adatai (IV)
45
40
35
Gyerek tests. 10 év (kg)
30
25
20
40
50
60
70
80
Anya testsúlya (kg)
44
Az elorejelzés problémája
  • Ha az anya 50 kg súlyú, hány kiló lehet 10 éves
    gyermeke?

45
Elorejelzés egy egyenes segítségével
45
40
35
30
Gyerek tests. 10 év (kg)
25
20
40
50
60
70
80
Anya testsúlya (kg)
46
Melyik a legjobb elorejelzo egyenes?
45
40
35
30
Gyerek tests. 10 év (kg)
25
20
40
50
60
70
80
Anya testsúlya (kg)
47
Az az egyenes a legjobb, amelyik a legközelebb
fekszik a pontdiagram pontjaihoz
  • Az egyenesek az X változó különféle lineáris
    függvényeinek grafikonjai. Közös képletük
  • f(x) a bx
  • Pl. f(x) 20 3x f(x) 31 - 7x
  • f(1) 20 31 23 f(1) 31 - 71 24
  • f(2) 20 32 26 f(2) 31 - 72 17
  • f(3) 20 33 29 f(3) 31 - 73 10

48
Az egyenes paraméterei (együtthatói)
400
320
y a bx
240
?
160
Y változó
a
80
X változó
0
0
1
2
3
4
5
a paraméter Y tengelymetszet
b paraméter egyenes hajlásszögének tangense
b tg(??
49
Az elorejelzés alapfogalmai
  • Jósolt (függo) változó Y
  • Jósló (elorejelzo, független) változó X
  • Lineáris elorejelzés (jóslás) Y a bX
  • Az x értékhez tartozó igazi Y-érték y
  • Az x értékhez tartozó elorejelzés y a bx
  • Az elorejelzés hibája egy személynél (y - y)2
  • A legjobb elorejelzésnél E((Y - Y)2) minimális

50
Szokásos szóhasználat
  • Legjobb elorejelzo egyenes regressziós egyenes
  • Regressziós egyenes képlete, y ? ?x,
  • a lineáris regressziós függvény/egyenlet
  • Regressziós egyenlet meghatározása
  • regressziós feladat
  • Regresszió hibája hibavariancia
  • Res E((Y - Y)2)
  • ? és ? paraméter regressziós együtthatók

51
Példák lineáris regresszióra
  • Változó Átlag Variancia
    Regressziós egyenlet
  • X SúlySzül 3,21 0,25 Y
    26,05 2,24X
  • Y Súly10 33,2 46,4
    Res 45,20
  • X ThosszSzül 50,2 6,4 Y
    96,88 0,83X
  • Y Thossz10 138,7 41,5
    Res 37,09
  • X Anyatesth 161,1 38,3 Y
    77,66 0,38X
  • Y Thossz10 138,7 41,5
    Res 36,02
  • X Apatesth 173,4 46,0 Y
    78,42 0,35X
  • Y Thossz10 138,7 41,5
    Res 35,96

52
Az Y kvantitatív változó elorejelzése X ismerete
nélkül, illetve X ismeretében
  • Y legjobb elorejelzése abban az esetben, ha nem
    tudunk semmit X-rol vagy más változókról ?Y
  • Ezen elorejelzés hibája E((Y - ?Y)2)
    Var(Y)
  • X-et is felhasználva a lekisebb hibájú
    elorejelzés
  • Y ? ?X,
  • az X változó Y-ra vonatkozó lineáris
    regressziós függvénye.
  • Ezen elorejelzés hibája, az ún.
    hibavariancia
  • E((Y - Y)2) Res

53
Milyen szoros az együttjárása Y-nakaz X
kvantitatív változóval?
  • Minél informatívabb X az Y változóra nézve, annál
    kisebb lesz Res a Var(Y)-hoz viszonyítva, vagyis
    annál kisebb lesz a Res/Var(Y) hányados.
  • Viszont annál nagyobb lesz a

mutató, az X változónak az Y változóra vonatkozó
lineáris determinációs együtthatója.
54
Alapösszefüggéseka determinációs együtthatóra
  • 0 ? Det(X,Y) ? 1
  • Det(X,Y) 0 csakkor, ha Res Var(Y). Ekkor X
    nem tartalmaz lineáris jellegu információt Y-ra
    nézve.
  • Det(X,Y) 1 csakkor, ha Res 0.
  • Ekkor Y hibamentesen elorejelezheto X által.
  • X determinisztikusan meghatározza Y-t, éspedig
    lineáris függvény formájában.

55
A determinációs együttható
  • Jól mutatja, hogy Y milyen mértékben függ
    lineárisan X-tol, hogy X milyen mértékben
    határozza meg, determinálja Y-t.
  • FONTOS Det(X,Y) Det(Y,X).
  • Jelzi, hogy az X és az Y változó milyen mértékben
    határozza meg egymást, vagy másképpen X és Y
    milyen szoros lineáris típusú kapcsolatban van
    egymással.

56
Két véletlen változó függetlensége
  • DEFINÍCIÓ
  • Y független X-tol, ha Y eloszlása ugyanaz bármely
    Xx mellett
  • KÉRDÉS
  • Függ-e a személy magassága
  • a nemétol?

57
Függ-e a születési testhossz a születési súlytól?
És fordítva?
55
50
45
Születési testhossz (cm)
40
35
1
2
3
4
5
Születési súly (kg)
58
Függ-e az Y változó X-tol?
1
80
Y
Y
50
0,5
20
0
X
X
20
50
80
0
0,5
1
59
Függ-e az Y változó X-tol?
Y
2
X
-3
0
3
60
A függetlenség kölcsönös
  • FONTOS
  • Ha Y független X-tol,
  • akkor X is független Y-tól

61
Függetlenség és elméleti átlag
  • Bármely X és Y kvantitatív változóra
  • E(XY) E(X) E(Y)
  • Ha X és Y független egymástól, akkor
  • E(XY) E(X)E(Y),
  • vagyis ekkor
  • E(XY) - E(X)E(Y) 0,
  • de a megfordítás nem mindig igaz.

62
Két kvantitatív változó kovarianciája
  • DEFINÍCIÓ
  • Cov(X,Y) E(XY) - E(X)E(Y)
  • Ha X és Y független változók, akkor
  • Cov(X,Y) 0
  • A megfordítás nem mindig igaz, vagyis nulla
    kovariancia esetén X és Y nem biztos, hogy
    független egymástól.

63
Két kvantitatív változó korrelációs együtthatója
  • Ha X vagy Y szórását megkétszerezzük,
    kétszeresére no a kovarianciájuk is.
  • Szórásokkal leosztott, ún. standardizált
    kovariancia korrelációs együttható

64
Összefüggés a korrelációs és a determinációs
együttható között
  • A korrelációs együttható négyzete mindig
    megegyezik a determinációs együtthatóval
  • ?(X,Y)2 Det(X,Y)
  • ?(X,Y) tehát az X és Y közti összefüggés mértékét
    jelzi, vagyis a lineáris típusú kapcsolat
    szorosságának méroszáma.

65
A korrelációs együttható jellemzoi
  • -1 ? ?(X,Y) ? 1
  • Ha X és Y független, akkor ?(X,Y) 0.
  • Ha ?(X,Y) 0, vagyis ha X és Y korrelálatlan,
    akkor nem feltétlenül függetlenek, de biztos,
    hogy nincs köztük lineáris típusú összefüggés (U
    vagy fordított U alakú kapcsolatban persze
    lehetnek).
  • Ha X és Y együttes eloszlása normális, azaz
    bármely rögzített X x mellett Y normális, akkor
    a függetlenség és a korrelálatlanság ekvivalens.

66
A lineáris transzformáció hatása r-ra
  • r abszolút értéke nem változik, legfeljebb az
    elojele
  • Ha U 10X 5 és V 4Y ? 10, akkor r(U, V)
    r(X, Y)
  • Ha U 10X 5 és V 10 ? 4Y, akkor r(U, V)
    ?r(X, Y)

67
A korreláció nem feltétlenül oki kapcsolat, csak
egy együttjárás
  • Ha r(X, Y) gt 0, akkor három eset
    lehetséges
  • X pozitív hatással van Y-ra
  • Y pozitív hatással van X-re
  • Egy Z háttérváltozó hat egyidejuleg X-re és Y-ra

68
Regresszió és korreláció kapcsolata
  • Az elméleti korrelációs együttható szokásos
    jelölései ?(X,Y), ?XY vagy ?
  • A lineáris regresszió képlete
  • Y ? ?X vagy Y ?YX ?YXX
  • Ekkor
  • és
  • zY rzX

s
Y
r

b
s
YX
X
69
Kérdés
  • Férj és feleség IQ-ja között r 0,50 a
  • korreláció. Várhatóan milyen IQ-jú a férj,
  • ha a feleség IQ-ja
  • 100?
  • 140?
  • 70?

70
Válasz
  • A férj várható IQ-ja (r 0,50)
  • 100 ?100
  • 140 ? 120
  • 70 ? 85

71
Két következmény
  • Ha X értékét 1 egységgel növeljük, akkor Y értéke
    várhatóan ?YX egységgel no. Ha viszont ?X
    egységgel növeljük, akkor Y értéke várhatóan ??Y
    egységgel no.? Speciálisan, ha sX sY, akkor b
    r.
  • ?XY elojele összhangban van a regressziós egyenes
    irányával. Ha a regressziós egyenes emelkedo,
    akkor X és Y között pozitív a korreláció. Ha
    ereszkedo, akkor ?XY negatív.

72
A korrelációs együttható két fontos jelentése
  • ? milyen mértékben öröklodik a szélsoségesség
    X-rol Y-ra, illetve Y-ról X-re
  • - Szélsoségesség standard érték
  • ?2 determinációs együttható, megmagyarázott
    variancia hányad, relatív hibacsökkenés

73
???????0
74
Ha az X vagy az Y változó értékskáláját
szukítjük, akkor a korreláció általában csökken
???????0
??????30
75
????????0
76
????????0
77
?????????
78
?????
79
A mintabeli korrelációs együttható (Pearson-féle
r)
  • Jelölése rXY vagy r
  • Egyik képlete

?
?
  • Mintabeli kovariancia sXY ?(xi x)(yi y)/(n
    1)
  • rXY a rXY elméleti korrelációs együttható egyik
    pontbecslése

80
Korrel. eh. vizsgálata
Feltétel X és Y együttes eloszlása legyen
normális
X-minta
H0 ?XY 0
t
(f n ? 2)
?
t ? -t0,05
t ? t0,05
t lt t0,05
H1 ?XY lt 0
H2 ?XY gt 0
H0
81
Korrel. eh. vizsgálata
Feltétel X és Y együttes eloszlása legyen
normális
X-minta
H0 ?XY 0
A t-táblázat helyett használható az rXY kritikus
értékeinek táblázata is.
rxy kiszámítása (f n ? 2)
r ? -r0,05
r ? r0,05
r lt r0,05
H1 ?XY lt 0
H2 ?XY gt 0
H0
82
Dichotóm változók vizsgálata
  • Dichotóm (kétértéku) változók
  • Személy neme (x1 férfi, x2 no)
  • Egyetért-e ... (x1 igen, x2 nem)
  • Elofordul-e ... (x1 igen, x2 nem)
  • Megoldotta-e ... (x1 igen, x2 nem)
  • Beteg-e (x1 igen, x2 nem)
  • Bináris változó az a speciális eset, amikor x1
    0 és x2 1

83
Dichotóm változók eloszlása
  • Eloszlás Az x1 és x2 érték elofordulási
    valószínusége, azaz P(x1) és P(x2).
  • Pl. a Személy neme egy lehetséges eloszlása
    P(ffi) 0,45, P(no) 0,55.
  • A Személy neme változó szintén lehetséges
    eloszlása P(ffi) 0,60, P(no) 0,40.
  • Mindig igaz P(x1) P(x2) 1

84
Egy dichotóm változó vizsgálata egy populációban
  • Példa pszichológia szakra felvételizok között a
    fiú-lány arány ugyanakkora-e?
  • Nullhipotézis H0 P(ffi) 0,5, P(no) 0,5
  • Egy valódi vizsgálat adatai
  • 1981-ben 94 felvételizo között 16 fiú és 78 lány
    volt (kapott gyakoriságok ni)
  • Ha H0 igaz lenne, 94-bol 47-47 fiúra és lányra
    számítanánk (várt/elméleti gyakoriságok ?i)

85
Eloszlásvizsgálat khi-négyzet-próbával
  • Minél nagyobb az eltérés a kapott (ni) és a várt
    (?i) gyakoriságok között, annál valószínubb, hogy
    a nullhipotézis nem igaz.
  • Az eltérés egy lehetséges mértéke
  • ?2 (n1 - ?1)2/?1 (n2 - ?2)2/?2
  • Ha igaz a H0 hipotézis, akkor ez khi-négyzet
    eloszlású, f 1 szabadságfokkal.

86
A fenti példa számításai
?2 (16 - ??)2/?? (78 - ??)2/??????????? ?2
????????????????????2 (f1) Emiatt a H0
hipotézist elutasítjuk, s azt mondjuk A fiúk
aránya szignifikánsan kisebb a lányokénál.
????
87
Egy másik példa
  • Egy dobókockával 30-szor dobunk szabályosan.
    Összesen 10 hatost kapunk. Hamis a kocka?

?2 (10 - ?)2/? (20 - ??)2/???????????????? ?2
?????????????????2 (f1) Az eredmény tehát
5-os szinten szignifikáns, vagyis a dobókocka
95-os valószínuséggel hamis.
????
88
Khi-négyzet-próba
Feltétel ?i ? 5
H0 P(x1) p1, P(x2) p2
X-minta
0,6
????f1?
0,4
0,2
(f 1)
0
?2
?
?
?
?
0,05
??2 lt ?2
??2 ? ?2
0,05
0,05
H0
HA P(x1) ? p1, P(x2) ? p2
89
Két populáció összehasonlítása egy dichotóm
változó segítségével
  • Példa Matematika és pszichológia szakra
    felvételizok között van-e különbség a nemi
    megoszlás tekintetében?
  • Nullhipotézis A két populációban a nemi
    megoszlás ugyanaz, vagyis
  • P(fiú/matek) P(fiú/pszich)
  • és
  • P(lány/matek) P(lány/pszich)

90
Egy konkrét példa
H0 igaz volta esetén a közös fiú-arány kb.
130/320, így a várt fiú-gyakoriság a matek és a
pszichológus szakon ?11 80?130/320 32,5 és
?21 240?130/320 97,5 Hasonlóan a közös
lány-arány kb. 190/320, így ?12 80?190/320
47,5 és ?22 240?190/320 142,5
91
A 22-es khi-négyzet-próba
H0 igaz volta esetén a
statisztikai mennyiség f 1 szabadságfokú
khi-négyzet-eloszlást követ, így ?2 lt 3,841
esetén H0-t megtartjuk, ?2 ? 3,841 esetén pedig
H0-t 5-os szignifikanciaszinten elutasítjuk (?2
3,841).
0,05
92
Számolás kontingenciatáblázatból
Kapott gyakoriságok
Várt gyakoriságok
58
22
32,5
47,5
72
168
97,5
142,5
  • ?2 ??44,92?? 6,635????2 (f1)
  • Konklúzió a különbség 1-os szinten
    szignifikáns.

????
93
Általános eset
Minták
Xx
Xx
Összesen
1
2
1. Minta
n
n
n
11
12
1
?ij (ni??mj)/N
2. Minta
n
n
n
21
22
2
Összesen
m
m
N
1
2
(f 1)
Alkalmazási feltétel ?ij ? 5
94
Két dichotóm változó eloszlásának
összehasonlítása egy populációban
  • Példa Egy középiskolai osztályban eloadást
    tartottak a dohányzás ártalmairól. Ezután 36
    tanuló közül 8-an leszoktak, 3 tanuló pedig
    rászokott a dohányzásra. Volt-e hatása a
    felvilágosító eloadásnak?
  • Nullhipotézis A dohányzás dichotóm változója
    eloszlása az eloadás elott és után ugyanaz.
  • Különbségváltozó x1 leszokik, x2 rászokik
  • Nullhipotézis H0 P(x1) P(x2)

95
  • Adattáblázat

Dohányzik?
Utána igen
Utána nem
Elotte igen
a
b 8
Elotte nem
c 3
d
  • Képlet és számolás McNemar-próba
  • Alkalmazási feltétel (bc)/2 ? 5, azaz bc gt 10

96
Egy példa
  • 40 fos évfolyamon 12 kérdésbol álló vizsgatesztet
    írattak. Az 1. feladatot 28-an, a 2. feladatot
    pedig 20-an oldották meg helyesen. Szignifikánsan
    nehezebbnek tekintheto-e a 2. feladat?
  • A fenti kérdésre a megadott az adatok alapján nem
    lehet válaszolni.
  • Hiányzik n(1. jó, 2. rossz) és n(1. rossz, 2.
    jó)

97
  • Megfelelo adattáblázat

Megoldás
2. helyes
2. helytelen
1. helyes
b
1. helytelen
c
  • A McNemar-próba képlete

98
Két dichotóm változó kapcsolatának vizsgálata
15 éves lányok
Könnyen teremt baráti kapcsolatokat
Dohányzik
Igen
Nem
Összesen
Igen
105
17
122
Nem
469
340
809
Összesen
574
357
931
Függetlenségvizsgálat ? homogenitásvizsgálat
99
Sorösszegek szerinti százalékok táblázata
15 éves lányok
Könnyen teremt baráti kapcsolatokat
Dohányzik
Igen
Nem
Összesen
Igen
86,1
13,9
100
Nem
58,0
42,0
100
Összesen
61,7
38,3
100
100
Oszlopösszegek szerinti százalékok táblázata
15 éves lányok
Könnyen teremt baráti kapcsolatokat
Dohányzik
Igen
Nem
Összesen
Igen
18,3
5,0
13,1
Nem
81,7
95,0
86,9
Összesen
100,0
100,0
100,0
101
A ?2-próba számolása 22-es kontingenciatáblázatbó
l
  • Formailag ugyanúgy végzendo, mint két csoport
    összehasonlítása esetén.
  • A fenti példa esetében
  • Mivel ?2 gt 6,635 (f1), az eredmény p lt 0,01
    (azaz 1-os) szinten szignifikáns.

102
A kapcsolat szorosságának mérése dichotóm
változók esetén
  • Kontingencia-együttható
  • Yule-féle asszociációs együttható

103
Néhány összefüggés a kapcsolati mutatókra
  • -1 ? ? ? 1
  • -1 ? ? ? 1
  • ?2 ?2/N
  • A fenti gyakorisági táblázathoz kapcsolódóan

j
y


0
195
0
635
,
,
és
Write a Comment
User Comments (0)
About PowerShow.com