Title: Il condizionamento operante
1Il condizionamento operante
- La gabbia di Skinner (Skinner box) gabbia con
una leva che consente di accedere al cibo o
allacqua. - La gabbia ha un pavimento elettrificabile (per
eventuale somministrazione di stimoli
avversativi), e un dispositivo per la
registrazione automatica delle risposte.
2Skinner box
3Gli esperimenti di Skinner
- Soggetti ratti o piccioni.
- Allinterno della gabbia venivano create le
condizioni affinché lanimale premesse la leva. - Gli animali premevano accidentalmente una leva e
ottenevano cibo o acqua. - Lanimale affamato o assetato tendeva a ripetere
loperazione (risposta operante) se essa
produceva un effetto positivo (cibo rinforzo).
4Variabili in gioco
- Nel condizionamento operante
- Lacquisizione dellapprendimento avviene se il
nuovo comportamento è seguito da un rinforzo. Una
risposta non rinforzata tende a diminuire. - Lestinzione della risposta dovrebbe avvenire a
seguito di ripetuta assenza di rinforzo.
5Nel condizionamento operante
- Generalizzazione il rinforzo dato ad un certo
comportamento avrà effetto anche per
comportamenti simili. - Discriminazione i soggetti vengono condizionati
e solo la risposta desiderata viene rinforzata.
6Il concetto di rinforzo
- Rinforzo effetto che segue un certo
comportamento e determina la probabilità che quel
comportamento venga emesso. Nel condizionamento
operante il rinforzo è condizione necessaria e
sufficiente per lapprendimento. - I rinforzi si distinguono in positivi e negativi
(valenza del rinforzo). - I rinforzi agiscono su bisogni di varia natura.
Pertanto si distinguono in primari e secondari. - La modalità di somministrazione dei rinforzi può
variare i rinforzi possono essere continui o
intermittenti (parziali).
7Valenza del rinforzo
- I rinforzi positivi producono un effetto
piacevole e agiscono da ricompensa. Essi
aumentano la probabilità che un comportamento si
manifesti. - I rinforzi negativi aumentano la probabilità di
apprendimento di comportamenti che eliminano
attivamente una fonte di sofferenza (premere una
leva nella gabbia di Skinner per evitare scosse
elettriche), oppure consentono di eliminare uno
stimolo sgradevole e penoso tramite comportamenti
di evitamento e fuga.
8Evitamento e fuga
Luce ? Scossa elettrica. Il ratto impara a
rifugiarsi nella zona non elettrificata appena
viene presentato lo stimolo luminoso.
9Soddisfazione di bisogni
- Rinforzi primari e secondari relativi a bisogni
primari o secondari.
10Modalità di somministrazione
- Rinforzi continui (dati a seguito di ogni
risposta desiderata) e rinforzi parziali
(intermittenti, saltuari) - Efficacia del rinforzo intermittente, basato sul
tempo (intervallo fisso o variabile) o sul numero
delle risposte (a rapporto fisso o variabile)
11Schema di rinforzo a intervallo fisso
- La risposta viene rinforzata dopo un tempo
prefissato che viene mantenuto costante (rinforzo
ogni X secondi, indipendentemente dallattività
del soggetto). - Lanimale calibra le sue azioni sui tempi del
rinforzo.
12Schema a intervallo variabile
- La risposta viene rinforzata lo stesso numero di
volte ma a intervalli irregolari. Il soggetto non
può fare previsioni. - Lapprendimento è più rapido e procede per
progressione costante. - Il soggetto lavorerà di più e apprenderà di più.
13Schema a rapporto fisso
- Il rinforzo viene dato dopo un numero prefissato
di risposte. - Il ratto di Skinner può essere rinforzato dopo 5
o 10 pressioni della leva. - Il soggetto lavora intensamente (come nel lavoro
a cottimo) e può programmare dei periodi di
riposo.
14Schema a rapporto variabile
- Il rinforzo viene dato dopo un numero di risposte
variabile. - Il soggetto non può fare previsioni.
- La risposta viene emessa continuativamente e i
tempi di riposo si riducono (gioco dazzardo). - Per Skinner lo schema a rapporto variabile è il
più efficace.
15La punizione
- Punizione Rinforzo.
- La punizione riduce la probabilità che un
comportamento venga prodotto. La punizione
inibisce temporaneamente il comportamento, ma non
lo estingue. - La punizione è meno efficace del rinforzo. E
preferibile utilizzare il rinforzo positivo
(premiare) piuttosto che punire.
16Quando la punizione serve
- Comportamento 1 (socialmente non desiderato)
- Comportamento 2 (socialmente desiderato)
- Ipotesi 1 Il soggetto conosce il comportamento 2
e non lo assume. La punizione è inevitabile. - Ipotesi 2 Il soggetto non conosce il
comportamento 2. Si insegna il comportamento 2 e
si rinforza il soggetto quando lo assume. Il
rinforzo positivo funziona meglio.
17Limpotenza appresa
- Seligman (1976).
- Lesperimento due gruppi di cani ai quali
venivano somministrate scosse elettriche. Il
primo gruppo (gruppo di scampo) poteva premere
una leva e interrompere il flusso elettrico. Il
secondo gruppo non aveva questa possibilità. - In sessioni successive i cani di questo gruppo
non erano in grado di apprendere comportamenti di
fuga e restavano immobili.
18Variabili nel condizionamento operante
- Forza e salienza dei rinforzi o delle punizioni
- Intervallo di tempo tra comportamento e rinforzo
- Frequenza della conseguenze (tipo di schema di
rinforzo)
19- Il modellamento (shaping)
- Rinforzare ogni risposta che si avvicina alla
risposta desiderata - Studi sulluomo
- Le macchine per insegnare.
- Il principio di Premack, ovvero premiare a
condizione che ... - Unattività piacevole può agire come rinforzo
per unattività spiacevole.
20Il comportamentismo intenzionale di Tolman
- Si possono postulare costrutti mentali per
spiegare taluni comportamenti? - I teorici S-O-R (Stimolo, Organismo, Risposta)
ritengono che ci sia una mediazione mentale tra
stimolo e risposta.
21La teoria di Tolman (1886-1959)
- Comportamento azione o serie di azioni
finalizzate ad uno scopo (comportamento
intenzionale) - Variabili interferenti (Costrutti ipotetici
caratteristiche dei soggetti, natura e intensità
dei bisogni da soddisfare). - Il concetto di mappa cognitiva la
rappresentazione mentale della meta e dello
spazio che porta alla meta. La meta sarà
raggiunta secondo il percorso più semplice e meno
dispendioso (principio del minimo sforzo).
22Esperimento di Tolman e Honzik
- Exp. di Tolman e Honzik (1930a) I ratti agivano
sulla base di una rappresentazione dello spazio
del labirinto, una mappa cognitiva che veniva
consultata e favoriva un comportamento
parsimonioso
23Studi recenti sulle mappe cognitive
- Uso di un labirinto con piattaforma centrale e
otto bracci uguali. - Alla fine di ogni braccio è posto del cibo.
- Dopo 20 prove i ratti non tornano più in bracci
che hanno già visitato (Olton, 1978 1979).
24Lapprendimento latente
- Si apprende anche senza rinforzi per fare fronte
ad una situazione problematica, ma il
comportamento non viene esibito se non si
individua uno scopo da realizzare. - Exp. di Tolman e Honzik (1930b)
- Tre condizioni sperimentali e tre gruppi di
ratti. Tutti i ratti vengono posti una volta al
giorno nel labirinto.
25(No Transcript)
26- Gruppo 1 Nessun rinforzo alluscita - Risultato
debole riduzione degli errori nel tempo. - Gruppo 2 Rinforzo alluscita - Risultato rapida
riduzione degli errori nel tempo. - Gruppo 3 Per 10 giorni nessun rinforzo.
Allundicesimo giorno rinforzo alluscita. I
soggetti commettevano molti errori per 10 giorni,
ma si registrava una drastica riduzione degli
errori dopo lundicesimo giorno. Per i primi 10
giorni il loro comportamento era analogo a quello
dei soggetti del gruppo 1, successivamente
diventava simile a quello dei soggetti del gruppo
2.
27Uno sguardo ai risultati
28Interpretazione dei risultati
- La mappa spaziale costruita vagando per il
labirinto è stata utilizzata quando si è
profilato uno scopo da realizzare. - Il rinforzo è utile perché si manifesti un
comportamento e non perché lo si apprenda. - La conoscenza appresa può rimanere latente in
mancanza di motivazione specifica.
29Lapprendimento osservativo
- Il contributo dei teorici dellapprendimento
sociale Bandura - Si apprende anche osservando un modello e
cercando di imitarlo. - Lapprendimento imitativo perché sia efficace
richiede che siano attivi alcuni processi
cognitivi - a) che si presti attenzione al modello
- b) che ci si rappresenti in memoria la sequenza
di azioni che il modello compie - c) che si sia in grado di riprodurre la sequenza
a livello motorio (riproduzione motoria) - d) che vi sia una certa autoconsapevolezza
30Il ruolo dei rinforzi
- il rinforzo è necessario per lesecuzione della
risposta più che per lapprendimento. Il rinforzo
crea motivazione. - Se il modello riceve rinforzi positivi questi
avranno un effetto sullapprendimento
dellosservatore che vorrà compiere la stessa
azione per essere ricompensato. - I rinforzi diretti possono consolidare la
risposta.
31- La teoria dellapprendimento osservativo
coniuga le istanze del comportamentismo con le
posizioni della psicologia cognitivista.
32Lapprendimento nella teoria della Gestalt
- Lapprendimento come soluzione dei problemi
analisi della situazione presente (secondo le
leggi dellorganizzazione percettiva) e uso
dellesperienza passata per la risoluzione del
problema. - Gli esperimenti di Köhler (1887-1967) sulle
scimmie antropoidi (1913-1917 a Tenerife)
33(No Transcript)
34(No Transcript)
35(No Transcript)
36(No Transcript)
37Lapprendimento per insight
- Per Köhler i tentativi degli animali non erano
casuali ma intelligenti (lanimale valutava la
situazione, formulava una ipotesi di soluzione
del problema e poi verificava la soluzione). - La ristrutturazione cognitiva avveniva
allimprovviso per intuizione. Dopo la prima
intuizione gli scimpanzé erano in grado di
ripetere lazione (apprendimento per insight).
38Una sintesi