Title: Muut menetelm
1Muut menetelmät ja aineiston jatkokäsittely
- Jouko Miettunen, tutkijatohtori, FT
- Psykiatrian klinikka
- Oulun yliopisto
- puhelin 08-3156923
- sähköposti jouko.miettunen_at_oulu.fi
Kvantitatiivinen tutkimus hoitotieteessä, Oulu
20.10.2006
2Luennon sisältö
- Luotettavuuden käsitteitä
- Cronbachin alpha ja muita vastaavia menetelmiä
- Klusterianalyysi
- Moniulotteinen skaalaus
- Aineiston jatkoanalyysi
- Muuttujien käsittely
- Perusmenetelmät
- Monimuuttujamenetelmät
3Taustaa
- Psykologisen mittarin suunnittelu ja testaaminen
- mahdolliset osa-asteikot
- kysymysten lukumäärä
- Menetelmiä
- Faktorianalyysit, pääkomponenttianalyysi
- Cronbachin Alpha
4Reliabiliteetin ja validiteetin käsitteitä
- Reliabiliteetti
- Kuinka hyvin mittarilla tehty mittaus on
toistettavissa (stabiliteetti) - kuinka yhdenmukaisesti kaksi mittaria/mittaajaa
arvioi samaa asiaa tai - kuinka hyvin mittarin kysymykset mittaa samaa
asiaa (konsistenssi) - Validiteetti
- Kuinka hyvin mittari mittaa sitä mitä sen pitäisi
mitata
5- Reliabiliteetti huono
- Validiteetti huono
- Reliabiliteetti hyvä
- Validiteetti huono
- Reliabiliteetti hyvä
- Validiteetti hyvä
- Validiteetti ei voi olla hyvä, jos
reliabiliteetti on huono
6Reliabiliteetin ja validiteetin käsitteitä
- Construct validity (rakennevaliditeetti)
- onko teoriakäsite riittävästi ja onnistuneesti
mitattu? - Convergent validity (yhtenevyys)
- onnistuuko käsitteen mittaaminen muulla
mittarilla - Discriminant validity (erottelu)
- onnistuuko mittari erottamaan käsitteen muista
käsitteistä
Blacker Endicott 2000, Morgan et al. 2001
7Reliabiliteetin ja validiteetin käsitteitä
- Content validity (sisältövaliditeetti)
- Kattaako kysymykset käsitteen riittävästi
- Face validity (näennäisvaliditeetti)
- Vaikuttaako mittari mittaavan sitä mitä on
tarkoitus
Blacker Endicott 2000, Morgan et al. 2001
8Reliabiliteetin ja validiteetin käsitteitä
- Criterion validity (kriteerivaliditeetti)
- Miten mittari liittyy muihin samaa asiaa
mittaaviin kriteereihin, esimerkiksi diagnoosiin - Concurrent validity (samanaikaisvaliditeetti)
- Kuinka hyvin mittari ennustaa henkilön nykyistä
tilaa - Predictive validity (ennustevaliditeetti)
- Kuinka hyvin mittari ennustaa henkilön tulevaa
tilaa
Blacker Endicott 2000, Morgan et al. 2001
9Cronbachin alpha
- Perustuu varianssianalyysiin
- Kertoo kuinka yhdenmukaisesti mittarin eri
kysymykset mittaavat samaa asiaa (internal
consistency) - Voidaan tehdä koko mittarille ja erikseen
jokaiselle osa-asteikolle
10- DATA ESIMERKKI
- VAR1 VAR2 VAR3 VAR4 VAR5...
- CASE1 0 1 1 2 0
- CASE2 4 5 4 3 3
- CASE3 0 0 1 0 0
- CASE4 2 2 2 2 3
- CASE5 3 1 1 2 3
- .
-
11Cronbachin alphan kaava
k muuttujien lkm
muuttujien välinen varianssi
henkilöiden välinen varianssi
12Cronbachin alpha
- On esitetty erilaisia raja-arvoja, sille mikä on
riittävä alpha - 0.60 0.80, esim. 0.70 (Nunnally 1978)
- Alphan suuruuteen vaikuttaa kysymysten lukumäärä,
mitä enemmän sitä suurempi alpha - Muuttujien vinous ongelma, samoin jos sama
vastaaja vastaa kaikkiin kysymyksiin samoin
(varianssi on tärkeä)
Nunnally (1978) Psychometric Theory
13Muita tunnuslukuja
- Cronbachin alphan erikoistapaus
- Kuder-Richardson Formula 20
- Kaksiluokkaisille muuttujille
- Spearmanin rho
- Kysymysparien korrelaatioiden mediaani
- Inter-item korrelaatio
- Kysymyksen korrelaatio mittarin muiden kysymysten
kanssa - Tulisi olla positiivinen!
14Spearman-Brown kerroin eli standardoitu item alpha
- SPSS "Cronbach's alpha based on standardized
items - Tunnusluvulla voi arvioida muuttujien
vähentämisen - vaikutusta reliabiliteettiin
k muuttujien lkm
muuttujien välinen keskikorrelaatio
15Split-half menetelmä
- Mittari jaetaan kahtia ja testataan eroaako
puoliskot toisistaan - Sopii hyvin kun on tarkoitus että kaikki mittarin
kysymykset mittaavat samaa asiaa (eli mittari ei
sisällä osamittareita)
16Cronbachin alphan laskeminen SPSS-ohjelmalla
- Käskyvalikosta
- analyze / scale / reliability analysis
- Valitaan muuttujat
17Cronbachin alphan laskeminen SPSS-ohjelmalla
- Valitaan malleista
- Alpha (Cronbach)
- Split-half
- Guttman
- Parallel
- Strict parallel
18Esimerkkiaineisto
- Pohjois-Suomen vuoden 1966 syntymäkohortin
31-vuotisseuranta - TCI (Temperament and Character Inventory)
- Reward Dependence faktori
- RD1 Sentimentality
- RD3 Attachment
- RD4 Dependence
- Kaksiluokkaisia muuttujia
19RD koko asteikko
RD 1 Sentimentality
RD 4 Dependence
RD 3 Attachment
20RD koko asteikko
21RD koko asteikko
22RD koko asteikko
23RD 4 Dependence
24Klusterianalyysi
- Havaintojen (muuttujat tai henkilöt) väliseen
moniulotteisiin välimatkoihin perustuva
luokittelumenetelmä - Useita erilaisia menetelmiä
- SPSS ohjelmassa muuttujien klusterointi onnistuu
Hierarchical Clustering -menetelmällä
Everitt (1974) Cluster analysis.
25Moniulotteinen skaalausmultidimensional scaling
- Kuten klusterianalyysi, perustuu havaintojen
välisiin etäisyyksiin - Moniulotteinen data tiivistetään 2-3 ulotteiseksi
kuvaksi - Suoritettaviss SPSS ohjelmalla
Borg Groenen (1997) Modern multidimensional
scaling.
26Muuttujien jatkokäsittely
- Kyselylomakkeesta tai sen osasta (esim.
faktorista) saadaan tietoa tiivistettyä useilla
tavoin - Alkuperäisten muuttujien summat jatkuvana tai
luokiteltuna - Faktoripisteet jatkuvana tai luokiteltuna
- EFA vs. CFA
27Jatkuva vai luokiteltu muuttuja?
- Luokittelemalla menetetään tietoa
- Usein kuitenkin selkeyttää tulosten esittämistä
- Analyysimenetelmät erilaisia
28Luokittelutapoja
- Aiemmat tutkimukset
- Kliiniset kriteerit
- Aineistoon perustuvat
- Mediaani, kvarttiilit, senttiilit,
- Keskiarvo
- Keskiarvo 2 keskihajontaa
29Perusmenetelmät
- Luokitellut muuttujat
- Jakaumien vertailu ryhmien välillä
- Tilastollinen testaaminen
- Khiin neliötesti, odds ratio
- Jatkuvat muuttujat
- Keskiarvojen vertailu
- Studentin t-testi
- Mediaanien vertailu ryhmien välillä
- Mann-Whitneyn U-testi
- Kruskal-Wallisin testi
30Esimerkki
- Kohortti 1986, aleksitymiamittarin (TAS)
faktoreiden ennustaminen - Kolme faktoria (faktoripisteet)
- F1 vaikeuksia tunteiden tunnistamisessa
- F2 vaikeuksia tunteiden kuvaamisessa
- F3 ulospäin suuntautunut ajattelu
- Tutkitaan eroja sukupuolittain ja sosiaaliluokissa
31Muuttujien jako kvarttiilien mukaan
X2 -testi
32Keskiarvojen vertailu t-testi
33Mediaanien vertailu Mann-Whitneyn U-testi
34Mediaanien vertailu Kruskal-Wallisin H-testi
35Monimuuttujamenetelmiä
- Logistinen regressioanalyysi
- Lineaarinen regressioanalyysi
- Varianssianalyysi
- Rakenneyhtälömallitus
- Latent class analysis
- Ynnä paljon muita!
36Logistinen regressioanalyysi
- Yleisin tapa ottaa huomioon sekoittavat
muuttujat, Erityisesti pitkittäistutkimuksissa - Vastemuuttuja (outcome) on kaksiluokkainen (esim.
kyllä/ei) - Altistemuuttujat (exposure) voivat olla sekä
kaksiluokkaisia, useampiluokkaisia että jatkuvia - Multinomiaalisessa logistisessa
regressioanalyysissa vastemuuttujassa voi olla
useita luokkia
37Muuttujien valinta
- Mittarista esim. faktorianalyysin avulla johdetut
muuttujat (esim. faktoripisteet) voivat olla
mallissa altisteena (jatkuvana tai luokiteltuna)
tai vasteena (kaksiluokkaisena) - Muuten altistemuuttujana (kovariaattina) esim.
sukupuoli, sosiaaliluokka, ikä, ym. - Malliin myös aiemmin tunnetut ennustavat
muuttujat - Muuttujia ei saa olla liikaa
- Riippuu otoskoosta ja muuttujien variaatiosta
- Mallissa ei kannata olla mukana muuttujia joiden
keskinäinen korrelaatio on liian iso
38Esimerkki
- Pohjois-Suomen vuoden 1966 syntymäkohortti
- N 10 934
- Runsaasti haastattelu- ja rekisteridataa
39Esimerkki
- Mikä psykoottisilla potilailla ennustaa uudestaan
joutumista sairaalaan? - N 158
- Altistemuuttujat
- sukupuoli
- Isän sosiaaliluokka (1980)
- Sukurasitus
- Sairastumisikä
- Ensimmäisen sairaalahoidon kesto
- diagnoosi (skitsofrenia / muu psykoosi)
40SPSS Output (1)
41SPSS Output (2)
42Lineaarinen regressioanalyysi
- Selitetään jatkuvaa (tai ainakin
välimatka-asteikollista) muuttujaa - Selittäviä muuttujia voi olla useita
- Muuttujien välinen riippuvuus oletetaan
lineaariseksi - Selittävät muuttujat ei saa liikaa korreloida
keskenään (multikollineaarisuus) - Selitettävän muuttujan hajonta ei riipu
selittävien muuttujien hajonnasta
(homoskedastisuus)
43Esimerkki
- Kohortti 1986, aleksitymiamittarin (TAS)
faktoreiden ennustaminen - Kolme faktoria (faktoripisteet)
- F1 vaikeuksia tunteiden tunnistamisessa
- F2 vaikeuksia tunteiden kuvaamisessa
- F3 ulospäin suuntautunut ajattelu
- Ennustavat muuttujat
- Sukupuoli
- Sosiaaliluokka
- Perhetyyppi
- Käyttäytyminen 8v (Rutter)
44Muuttujien jakaumat
Alkuperäinen muuttuja
Faktoripistemuuttuja
Uusi muuttuja useampi luokkainen (jatkuvampi)
ja vähemmän vino
45Muuttujien jakaumat
Alkuperäinen muuttuja
Faktoripistemuuttuja
46Muuttujien jakaumat
Alkuperäinen muuttuja
Faktoripistemuuttuja
47Esimerkki
- F1 vaikeuksia tunteiden tunnistamisessa
48Esimerkki
- F2 vaikeuksia tunteiden kuvaamisessa
49Esimerkki
- F3 ulospäin suuntautunut ajattelu
50Varianssianalyysi
- ANOVA
- Yksi jatkuva selitettävä eli vastemuuttuja
- MANOVA
- Useita jatkuvia vastemuuttujia
- Toistettujen mittausten ANOVA
- Repeated measurements ANOVA
- Samat mittaukset on tehty useaan kertaan samoilta
henkilöiltä - ANOVA, MANOVA and rANOVA
- Vain luokiteltuja altisteita
- ANCOVA, MANCOVA, rANCOVA
- Myös jatkuvia altisteita
51Esimerkki
- Erot hippokampuksen koossa
- Pohjois-Suomen 1966 syntymäkohortti
- Seurantatutkimus 1999-2001
- Skitsofreniapotilaat (N56) vs.
- terveet verrokit (N104)
- Toistettujen mittausten ANCOVA
- Oikean ja vasemman puolen hippokampusmittauksia
käsitellään toistettuina mittauksia
52Schizophrenia and Comparison subjects Hippocampus
volumes F Sig. Model 1 Within effect
side 20.3 lt 0.001 Diagnosis 1.2 0.28 Gender
6.5 0.01 Model 2 Within effect side 0.81
0.37 Covariate brain vol. 35.0 lt
0.001 Diagnosis lt 0.01 0.89 Gender 0.7
0.41 Familial psychosis 1.9 0.17 Perinatal
risk 0.8 0.38 Handedness 0.3 0.61
Tanskanen ym. Schizophrenia Research (2005)
53Rakenneyhtälömallitus Structural Equation
Modeling
- Faktorianalyysin ja regressioanalyysin yhdistelmä
- Jatkuvia ja luokiteltuja altisteita ja vasteita
- Esitetään mitattujen muuttujien ja piilevien
muuttujien suhteet (esim. korrelaatioina)
Byrne (2001) Structural Equation Modeling with
AMOS Basic Concepts, Applications, and
Programming.
54Esimerkki Nursing orientation
Vanhanen-Nuutinen ym. (käsikirjoitus)
55Latent class analysis
- Kehitetty ryhmittelemään henkilöt valittujen
piirteiden mukaan - Luokittelee ihmiset ryhmiin
- Kertoo piirteet (säännöt) joilla luokitus tehtiin
- Verrattavissa klusterianalyysiin
- Klusterianalyysi ei anna sääntöjä luokitukseen
(mallia)
Muthén Muthén (Alcohol Clin Exp Res, 24,
882-91, 2000)
56Esimerkki Antisosiaalinen käyttäytyminen
- National Longitudinal Survey of Youth (NLSY)
- Respondent ages between 16 and 23
- Background information age, gender and ethnicity
- N7,326
- 17 antisocial dichotomously scored behavior
items
- Damaged property
- Fighting
- Shoplifting
- Stole lt50
- Stole gt50
- Use of force
- Seriously threaten
- Intent to injure
- Use Marijuana
- Use other drug
- Sold Marijuana
- Sold hard drugs
- Con somebody
- Stole an Automobile
- Broken into a building
- Held stolen goods
- Gambling Operation
Lähde http//www.ats.ucla.edu/stat/mplus/seminars
/lca/default.htm
57Example Anti-Social Behavior
Damage Property
Fighting
Shoplifting
Stole lt50
Gambling
. . .
Male
C
Race
Age
58Example Anti-Social Behavior probabilities
59Relationship between class probabilities and age
by gender
Females
Males
16 17 18 19 20 21 22 23 (age)
16 17 18 19 20 21 22 23
60Yleisiä lähteitä tilastomenetelmiin
- Metsämuuronen. Tutkimuksen tekemisen perusteet
ihmistieteissä (2003) - Nummenmaa et al. Tutkimusaineiston analyysi
(1997) - Uhari Nieminen. Epidemiologia Biostatistiikka
(2001) - SPSS, SAS, jne. oppaat