Title: Inleiding in de statistiek voor de gedragswetenschappen Met ondersteuning van PASW
1Inleiding in de statistiekvoor de
gedragswetenschappenMet ondersteuning van PASW
2Hoofdstuk I De statistiek in het onderzoek
intro PASW
guido.valkeneers_at_lessius.eu
3Doelstellingen
- De student kent de diverse fasen van het
onderzoek en begrijpt de rol van de statistiek in
dat kader - De student verstaat de besproken begrippen zoals
variabele, afhankelijke en onafhankelijke
variabele, operationalisering, populatie versus
steekproef, beschrijvende versus inductieve
statistiek, - De student kent de diverse vormen van
steekproeftrekking en tevens de mogelijkheden en
beperkingen hiervan - De student kent het onderscheid tussen het
experiment en het veldonderzoek - De student kan een datafile aanmaken in PASW
4Twee typen van statistiek?
- Beschrijvende statistiek (jaar I)verzamelen van
gegevens bij een steekproefsamenvatten van deze
gegevens welk zijn de kengetallen? middels een
grafische voorstelling?analyseren van de
resultaten bestaat er een samenhang?Kortom een
overzicht van de resultaten - Inductieve statistiek (jaar II)Wat betekenen
deze resultaten in relatie tot de populatie? - schattingsprobleem hoe kunnen we µ schatten op
grond van het steekproefgemiddelde? - Beiden bieden methodologische ondersteuning van
onderzoek
5Onderzoek
- Gaat over onderzoek dat op basis van waarnemingen
probeert ware en algemene uitspraken te doen over
de werkelijkheid.(Brinkman, 1998)Een uitspraak
is een bewering waarin een of meerdere objecten
een eigenschap wordt toegeschreven.
6Onderzoek
- Voorbeelden van uitspraken- Jan is ziek-
Assepoester is lang ongelukkig geweest-
Kabouters zijn kleiner dan mensen- Bomen hebben
een stam- Mannen zijn gemiddeld intelligenter
dan vrouwen
7Onderzoek
- Wetenschappelijk verantwoord onderzoek?-
objectiviteit- controleerbaarheid-
herhaalbaarheid- systematiek
8Onderzoek
- Deterministische uitspraken versus
probabilistische uitspraken- Wet van de
zwaartekracht versus- Frustratie bevordert
agressie -
9Twee typen van onderzoek
- Het experimentDoelbewust worden één of enkele
variabelen gemanipuleerd en we onderzoeken de
effecten hiervan op de afhankelijke variabele. - bv. welk is de relatie tussen de attitude en
het gedrag? Het experiment van de verloren brief
(Nuttin en Beckers) - Het veldonderzoek/ surveyonderzoek/
enquêteonderzoekHier worden geen variabelen
gemanipuleerd bv. hebben babyboomers en busters
een andere levensstijl en koopgedrag?
10Wat is een variabele?
- Is een eigenschap/kenmerk van een
onderzoekseenheid (persoon/huishouden)bv.
geslacht - Kan diverse waarden (uitkomsten) aannemen. Mensen
verschillen op het vlak van deze
eigenschappenbv. man/vrouw - Tegengestelde van een constante
11Wat is een variabele?
- Onafhankelijke variabeleverschillen in deze
variabelen worden gezien als oorzaak (?) van
verschillen in de afhankelijke variabele - Afhankelijke variabele variabele ter
studieverschillen in deze variabelen worden
gezien als gevolg (?) van verschillen in de
onafhankelijke variabele - Er zijn diverse niveaus van meting (zie verder)
12Fasen in het onderzoek
- De vraagstelling
- De operationalisering
- Steekproefopzet
- Verzamelen van de gegevens
- Beschrijven van de resultaten
- Formulering van conclusies/rapportage
13De vraagstelling
- De vraagstelling vloeit voort uit de theorie
ofwel uit een concreet probleemVraag naar
secundaire gegevens wat hebben andere
onderzoekers reeds vastgesteld? Vraag naar
primaire gegevens via experiment of veldonderzoek
14Voorbeeld van een experiment
- Relatie tussen milieubesef (als attitude) en het
milieuvriendelijk consumentengedrag (effectief
toepassen van)?Bv. besef van de opwarming van de
aarde en het gebruik van een terreinwagen. - Nuttin stelt zich de vraag wat het verband is
tussen de attitude en het gedrag door het
experiment van de verloren brief.
15Voorbeeld van een veldonderzoek
- Vraagstelling Bestaat er een verschil in
levensstijl en koopgedrag bij de busters
versus de babyboomers? - Onderzoekshypothese Busters en babyboomers
vertonen een verschillende
levensstijl en koopgedrag - Het verzamelen van de gegevens behoort tot de
beschrijvende statistiek. De analyse van de
resultaten tot de inductieve statistiek.Wat
betekenen deze resultaten voor de populatie?
Hierbij werken we met twee tegengestelde
veronderstellingen.
16Fase 1. De vraagstelling
- Onderzoekshypothese wordt gesteld in termen van
meetbare kenmerken, d.i. variabelen.Afhankelijke
variabele de verschillen in deze variabele
dienen we te verklaren (bv. vatbaarheid voor
dyslexie)Onafhankelijke variabele deze
verschillen kunnen een verklaring bieden. (bv.
geslacht)Hebben verschillen in de
onafhankelijke variabelen effect op de
verschillen in de afhankelijke variabele?
17Fase 1. De vraagstelling
- Gebruik een vraagvormbv. Niet het eetgedrag van
jongeren - Specificatie van de begrippenbv. Niet wat is
het medicijngebruik in de psychiatrie?Beter wat
is het van de in 2009 opgenomen psychiatrische
patiënten in Vlaanderen die gedurende de eerste
maand van de observatieperiode ten minste
dagelijks een antidepressivum voorgeschreven
kregen?
18Fase 1. De vraagstelling
- Geen oordelende vragenbv. Niet zijn er
voldoende psychiaters in Vlaanderen?Bv. Niet
hoeveel van de jongeren eet gezond? - Een rijtje in plaats van een volzinHoofdvraag en
deelvragen Bv. Hebben kinderen van handarbeiders
lagere schoolcijfers in het basisonderwijs dan
deze van hoofdarbeiders?Krijgen deze kinderen
als ze dezelfde cijfers behalen een ander advies?
19Fase 1. De vraagstelling
- Drie typen van vragen
- - voorkomen van iets. Bv. hoeveel van de
Vlamingen is depressief?- verschillen tussen
groepen. Bv. zijn vrouwen meer depressief dan
mannen?- samenhang. Bv. bestaat er een samenhang
tussen de leefsituatie en al dan niet depressief
zijn?
20Fase 2. Operationalisering
- Operationaliseren van een begrip tot meetbare
variabele hoe kunnen we dit begrip concreet
meten? Voorbeelden van operationaliseringgemakke
lijk moeilijkergeslacht Intelligentieleeftijd
aanleg voor wiskunde - diploma arbeidstevredenheid
21Fase 3. Steekproefopzet
- Populatie (N) alle individuen waar we een
uitspraak over willen doen en die bijgevolg in
aanmerking komen voor het onderzoek.Alle
individuen testen? - Steekproef (n) selectie van individuen uit de
populatie. Hoe selecteren?
22Fase 3. Steekproefopzet
- Kunnen we alle personen ondervragen?Wellicht
niet haalbaar, tenzij zeer kleine populaties,
ofwel uit noodzaak. Wie rijdt in Vlaanderen met
een Ferrari? Dit is wellicht een kleine groep
van mensen die we kunnen opsporen. Uit noodzaak,
bv. Bij medewerkerstevredenheidsonderzoekWe
spreken van een census. - In andere gevallen gebruiken we een steekproef.
We selecteren een aantal proefpersonen en
trachten op grond van de gegevens iets te zeggen
over de populatie.
23Fase 3. Steekproefopzet
- Waarom een steekproef?Is sneller af te
handelenIs goedkoper - Hoe moeten we een steekproef trekken?Twee typen
van steekproeftrekking- aselect (at random)-
niet aselecte steekproef
24Fase 3. Steekproefopzet
- Aselecte steekproef (at random) elk individu van
de populatie heeft evenveel kans om in de
steekproef terecht te komen. Vereisten? - Niet aselecte steekproef elk individu heeft niet
evenveel kans om in de steekproef terecht te
komen. Gevolgen?
25Fase 3. Steekproefopzet
- Aselecte opzetvereist een lijst van de
deelnemers in de populatie steekproefkader
(hoe?) elke persoon krijgt een nummer.
Gevolgen op grond van gegevens van dergelijke
steekproef kan ik iets vertellen over de
populatie. Schatting van de parameters van de
populatie, op grond van resultaten van de
steekproef.
26Fase 3. Steekproefopzet
- Aselecte steekproefVoordelen - generalisering
naar de populatie is mogelijk- veel statistische
technieken zijn mogelijk- hoeveel
proefpersonen?Nadelen - levert geografisch
verspreide individuen op met bijkomende kosten
en tijdsinvestering- Kan wel of niet leiden tot
representatieve steekproef. Zeker bij kleine
steekproeven kan representativiteit een probleem
geven
27Fase 3. Steekproefopzet
- At random samplingVolledig aselecte
steekproef computer kiest aantal nummers van
personen. Systematische aselecte steekproef
kies een (willekeurig) eerste persoon, en de
volgende ppn. heeft telkens een nummer dat x
aantal hoger ligt. Gestratificeerde steekproef
de populatie wordt verdeeld in deelpopulaties (
strata) en uit elke deelpopulatie trekken we
aselect een steekproef.(voorbeeld van strata
ASO, TSO, BSO)Proportionele of disproportioneel
getrokken steekproef - Clustersteekproef de populatie wordt ingedeeld
in subgroepen die zo heterogeen mogelijk zijn.
Vervolgens worden een aantal subgroepen
geselecteerd en elk individu van de geselecteerde
groepen wordt bevraagd.Bv. de behoefte aan
schoolmateriaal van middelbare scholieren. We
hebben een lijst van secundaire scholen en kiezen
een aantal hiervan en zullen vervolgens alle
leerlingen van de gekozen scholen bevragen.
28Fase 3. Steekproefopzet
- Niet aselecte steekproef geschikt voor
verkennend onderzoek geschikt om
meetinstrumenten te testen goedkoop en
snel veel gebruikt in de psychologie Maar
resultaten kunnen niet veralgemeend worden
naar de populatie.
29Fase 3. Steekproeftrekking
- Niet aselecte steekproeftrekking
- Convenience sampling kies de individuen die
voor het grijpen liggen - Judgement sampling kies deze individuen die als
bevoorrechte getuigen kunnen fungeren, bv. groep
van zware gebruikersSnowball sampling de
eerste respondent levert volgende proefpersoon
op, enz Te gebruiken bij moeilijk vindbare
doelgroepenQuota sampling verdeel de populatie
in een aantal subgroepen ( strata) en kies uit
elke subgroep willekeurig een aantal
proefpersonen. M.a.w. uit elke subgroep trekken
we een convenience sampling. Belangrijk voor
representativiteit Random Walk de onderzoeker
selecteert proefpersonen volgens een vooraf
vastgesteld wandeltraject. Toeval bij de keuze
van proefpersonen speelt een rol. Deze procedure
benadert het beste de aselecte opzet en wordt
gebruikt wanneer een steekproefkader niet voor
handen is. -
30Fase 4. Verzamelen van de gegevens
- Diverse methoden voor verrichten van metingen-
vragenlijst- test- .Deze gegevens worden
systematisch weergegeven in een datamatrix in PASW
31Fase 4. Verzamelen van gegevens
- De datamatrix
- Gebruik van Excel zeer beperkte mogelijkheden
voor inductieve statistiek - Gebruik van PASW zeer handig.Meest gebruikte
sofware voor statistische analyse. -
32Fase 4. Verzamelen van gegevens
- SPSS Statistical Package for the Social Science
- PASW Predictive Analytics SoftWare
- Twee windows- Data Editor- Viewer
- Twee tabs- Variable View- Data View
33PASW. Data View
34PASW. Variable View
35PASW. Variable view
Zeer belangrijk
- Name naam van de variabele dit gegeven komt in
de data file boven de variabele staan, beperkt
aantal karakters, geen spaties, - Type kies standaard voor numeriek en u kunt
voor deze variabele getallen invoeren. U kunt
voor string kiezen, om bv. de namen van de
proefpersonen in te geven, of om bemerkingen te
noteren, bv. persoon geeuwde vaak, vermoeidheid? - Width hoeveel posities heeft u nodig voor deze
variabele? Standaard is 8. - Decimals indien u geen gebruik maakt van
decimale getallen kiest u voor nul - Label de naam van de variabele die u nu ingeeft
zal gebruikt worden als titel boven een tabel,
grafiek minder beperkingen dan bij name - Values hier geeft u aan welke getallen voor
welke groepen staan. (niet te gebruiken bij scale
metingen), bv. 1 is man en 2 staat voor vrouw - Missing value op welke wijze geeft u aan dat een
persoon dit niet ingevuld heeft? U gebruikt
hiervoor een getal dat onmogelijk als waarde
gescoord kan worden. - Measure welk is het niveau van meting nominal,
ordinal, scale. - Begin ALTIJD met het aanmaken van de variable view
36PASW. Variable Type
37PASW. Value Labels
38PASW. Missing Values
39PASW. Meetniveaus
40PASW. Variable View
41PASW. Data View
Gegevens van persoon nr. 3
Gegevens over leeftijd
42PASW. Data View
43PASW. Data View
Zeer belangrijk
- Resultaten van één proefpersoon vinden we in één
en slechts één rij. Alle gegevens van één
persoon staan in één rij. In één rij vinden we de
gegevens van slechts één proefpersoon. - Resultaten van één variabele vinden we in één en
slechts één kolom. Alle gegevens van één
variabele vinden we in één kolom en de gegevens
in één kolom hebben betrekking op slechts één
variabele.
44PASW. Analyze
- Via Analyze kunnen we een opdracht geven aan PASW
45PASW. Frequencies
46PASW. Viewer
47Opslaan van gegevens in PASW
- Gegevens kunnen bewaard worden via File, Save
as - Datafile krijgt automatisch extensie .sav
- Bv. busters.sav
- Output gegevens krijgen een extensie .spv
- Bv. busters.spv
- Gegevens kunnen opgevraagd worden via File,
Open, Data
48Fase 5. Beschrijven van de gegevens
- Datamatrix is onoverzichtelijk.Hoe kunnen we de
gegevens overzichtelijk voorstellen? Middels een
frequentieverdelingMiddels een grafische
voorstelling van de resultatenMiddels bepaling
van centrale tendens en variabiliteit.
49Fase 6. Formuleren van conclusies
- Toetsende/inductieve statistiek.Wat zeggen de
gegevens uit de steekproef over de populatie?
Jaar II inductieve statistiekHoe werkt dit?
50Fase 6. Formuleren van conclusies
- Deductief versus inductief redeneringDeductief
redeneren vanuit een logische redenering, kunnen
we conclusies opbouwen. Alle mensen zijn
sterfelijkJan is een mensDus jan is
sterfelijkStaat model voor de wiskunde
51Fase 6. Formuleren van conclusies
- Inductieve redenering vanuit de empirische
observaties trachten we een wet te
formuleren.Hume ziet een probleem. We kunnen
niet alle mensen onderzoeken om te besluiten dat
mensen sterfelijk zijn.
52Fase 6. Formuleren van conclusies
- Statistische / inductieve redeneringTwee
tegengestelde beweringen worden t.o.v. mekaar
afgewogenmensen zijn onsterfelijk
(nulhypothese)mensen zijn sterfelijk
(alternatieve hypothese)Indien ik uit de
empirie gegevens vind die de eerste stelling
onderuit halen, is de tweede stelling van
toepassing. Inductieve statistiek (Jaar II)
53Twee uitgewerkte voorbeelden
- Experiment van de verloren brief(Nuttin en
Beckers) - Busters versus babyboomers (Apers, et al.)
54Voorbeeld van een experiment
- Nuttin stelt zich de vraag wat het verband is
tussen de pro-sociale attitude en het betreffende
gedrag door het experiment van de verloren brief.
55Voorbeeld van een experiment
- Wat is een attitude?
- is een door ervaring verworven interne
dispositie die belangrijke en duurzame
richtinggevende determinant is van de evaluatieve
aspecten van open gedrag tegenover een object dat
zich leent tot gunstige of ongunstige
waardering- cognitief aspect- affectief
aspect- intentiesHoe kan dit gemeten worden? - Wat is de relatie met concreet gedrag?
56Experiment van Nuttin en Beckers
- Vraag aan de proefpersonen wat zou u doen als u
een brief zou vinden met daarop een adres? - via
interview- via enquêtebijkomende vraag Zou het
iets uitmaken als de postzegel los zit? Het
adres in Wallonië ligt? enz.. - Experiment. Brieven worden effectief
verloren gelegd, volgens een factorieel design.
Wat zullen de proefpersonen doen? Zelfde
reacties als in de interviews?
57Experiment van Nuttin en Beckers
- Factorieel design2X2X2X3 opzet
- Onafhankelijke variabelen regio waar de brief
te vinden werd gelegd (Vlaanderen/Wallonië)adres
van de bestemmeling (Vlaanderen/Wallonië)vindplaa
ts van de brief (cel/auto)zegels (1 vast, 1 los,
4 los)
58Experiment van Nuttin en Beckers
- De proefpersonen (bij de gejukte interviews)
beweren in 90 van de gevallen de brief te zullen
posten. En of het iets uitmaakt of de postzegel
vastgekleefd is of niet, maakt niks uit. En
verder maakt niks uit, aldus de proefpersonen. - Vraagstelling zullen de gemanipuleerde factoren
een impact hebben op het al dan niet posten van
de brief?Hypothesen de overgrote meerderheid
van de proefpersonen zal de brief posten. De
gemanipuleerde factoren zullen geen impact hebben
op dit gedrag.
59Experiment van Nuttin en Beckers
- Wat blijkt uit de resultaten? O.m. 77 van de
brieven met vastgekleefde postzegel werd gepost
terwijl met de losse postzegel(s) werd slechts
34 (35) van de brieven gepost. Onderzoek van de
significantie via de chi-kwadraat (zie hoofdstuk
VIII)? - Besluit van Nuttin en Beckers dat externe
omstandigheden dit prosociaal gedrag bepalen.
Attitudes spelen dus een beperkte rol in de
verklaring van dit gedrag. Nuttin, J. (1999).
Sociale beïnvloeding. Toetsbaar leren denken over
gedrag. Universitaire Pers Leuven - Idem voor de relatie tussen milieubesef en
milieuvriendelijk gedrag.
60Voorbeeld van veldonderzoek
- Onderzoek Busters versus baby boomers. Eenheid
en verscheidenheid. - Zijn er verschillen inzake levensstijl en
koopgedrag tussen beide generaties? Omschrijving
levensstijl hoe kijken consumenten naar het
leven? Waarden, interesses, opvattingenKoopgedra
g verwijst naar de wijze waarop consumenten hun
aankoopgedrag verrichten. Omschrijving busters
(30plussers) en baby boomers (40 en 50plussers)
de operationalisering dus. - Hypothesen op grond van eerder onderzoek.
61Voorbeeld van veldonderzoek
- Hypothesen m.b.t. levenstijl Senioren hechten
meer dan jongeren belang aan hun gezondheid
(Joosten, 2000)Ouderen begeven zich minder dan
jongeren op het internet (Jacobs, 2003)Busters
zijn meer materialistisch ingesteld dan de
babyboomers (De Pelsmacker et al., 2006)Lachance
(2003) stelde vast dat jongeren in sterke mate
modebewust zijn, ouderen dus wellicht minder
62Voorbeeld van veldonderzoek
- Hypothesen m.b.t. koopgedragHenry (2002) heeft
aangetoond dat jongeren bij het consumptiegedrag
eerder belang hechten aan sociaal-expressieve
aspecten van het productOuderen zijn meer
geneigd om prijs en kwaliteit als verwisselbare
begrippen te zien (Janssens en De Pelsmacker,
2002)Valkeneers (2006) toonde aan dat twintigers
dertigers en veertigers meer dan andere
leeftijdsgroepen producten en diensten impulsief
aankopenHenry (2002) toonde eveneens aan dat
ouderen meer dan busters belang hechten aan
functionele aspect in hun consumptiegedrag
Romberts en Manolis (2000) toonden aan dat
babyboomers minder compulsief koopgedrag
vertoonden dan de busters.Inzake attitude t.o.v.
merken verwachten we dat de busters meer
merkgevoelig zullen zijn dan de bayboomers
(Lachance, 2003)
63Voorbeeld van veldonderzoek
- MethodeSteekproeftrekking aangezien er geen
steekproefkader voorradig is, gebruiken we een
gemakkelijkheidssteekproef. Studenten BaTP
zoeken elk drie proefpersonen in hun omgeving
(n402)
64Voorbeeld van veldonderzoek
- Methode beschrijving van de steekproef (I)
65Voorbeeld van veldonderzoek
- Methode beschrijving van de steekproef (II)
66Voorbeeld van veldonderzoek
- MethodeVragenlijst van het likertschaal type
geef aan in hoeverre u akkoord kunt gaan met
volgende uitspraken 1. helemaal niet
akkoord 2. niet akkoord 3. eerder niet
akkoord 4. neutraal 5. eerder akkoord 6.
akkoord 7. helemaal akkoord22 items over
levensstijl en 51 items over koopgedrag
(overgenomen van andere auteurs)5 onafhankelijke
variabelen leeftijd, geslacht, voornaamste
verantwoordelijke voor de dagelijkse aankopen,
woonplaats, hoogste diploma
67Voorbeeld van veldonderzoek
- ResultatenSamenstelling van de schalen-
hercodering (omdraaien) van enkele items, zodanig
dat alle items van één schaal in dezelfde
richting wijzenVia PASW transform, recode, into
a different variable en draai de scores om. -
onderzoek de interne homogeniteit van de schalen.
In PASW via analyse, scale, reliabilty analysis
Kies voor de Cronbach Alfa, en geef de items in
van deze categorieWelke items vormen samen de
meest optimale schaal?
68Voorbeeld van veldonderzoek
- Itemanalyse voor de schaal modebesef
69Voorbeeld van veldonderzoek
- Resultaten van betrouwbaarheidsonderzoekNaam
items Cronbach
AlfaGezondheidsbesef 7 .70 - Internetgebruik 3
.80Materialisme 4 .82 - Modebesef 6 .91
- Prestigegevoeligheid 4 .88
- Prijs als aanduiding 5 .80
- Impulsief koopgedrag 4 .68
- Functioneel koopgedrag 3 .63
- Compulsief koopgedrag 15 .76
- Merkkledij 7
.89
70Voorbeeld van veldonderzoek
- Hercodeer de variable leeftijd in busters
versus baby boomers. In PASW transform,
recode, into a different variable, en wijzig de
leeftijd in groep 1 (busters) en groep 2 (baby
boomers)(Tip PASW gebruik bij recode nooit
into the same variable)
71Voorbeeld van veldonderzoek
- Resultatentel de itemsscores (met optimale
Cronbach Alfa) van dezelfde schaal samen tot een
totaal scoreIn PASW via Transform, Compute,
..maak gebruik van Mean (in plaats van
Sum).Maak vervolgens een gemiddelde van deze
totaal score afzonderlijk voor busters en
babyboomers
72Voorbeeld van veldonderzoek
- ResultatenGemiddelden per subgroep
- Schaal busters
BabyboomersGezondheidsbesef 5,10 5,53 - Internetgebruik 5,27 4,62Materialisme 4,22
3,92Modebesef 4,54 4,15Prestigegevoeligheid
3,16 2,60Prijs als aanduiding 3,84
3,61Impulsief koopgedrag 3,97
3,30Functioneel koopgedrag 3,74
4,26Compulsief koopgedrag 3,50
3,03Merkkledij 2,94 2,45
73Voorbeeld van veldonderzoek
- Verder onderzoek (inductieve) toont aan dat alle
verschillen significant van niveau zijn. Alle
hypothesen werden bevestigd in dit onderzoek. - Met dank aan Katrien Apers, Jessica
Vanderghinste, en Ellen Van de Ven, die een
scriptie maakten met als titel Busters versus
babyboomers. Eenheid en verscheidenheid (2006)
74Opgaven uit het handboek
75Statistiek deel IInleiding in de statistiek Met
ondersteuning van PASW