LMP – Leertheorieën
ASSOCIATIONISME / BEHAVIOURISME (VS)
Leren is een blijvende verandering in gedrag als gevolg van een reactie van de lerende op
gebeurtenissen in zijn of haar omgeving.
Leren is het aanbrengen van ketens van verbindingen (associaties) tussen prikkels of stimuli
in de omgeving en reacties of responses van de lerende.
De lerende is een systeem waarvan de interne opbouw en de interne mechanismen
principieel buiten beschouwing blijven (black box).
Voorbijgestreefd sinds de jaren ’70 door ondermeer de Gestaltpsychologie.
Onderwijs: Thorndike & Skinner hebben de grootste impact gehad op het onderwijs.
‘Geprogrammeerde instructie’ en ‘behavioural objectives movement’ (1960-1980;
leerkrachten moeten zich laten leiden door doelstellingen die geformuleerd zijn in termen
van concrete, zichtbare gedragingen).
KLASSIEKE CONDITIONERING
PAVLOV 1. UCS (voedsel) > UCR (speeksel) Bel heeft geen effect. | 2. Fase van verwerving: UCS > CS (bel) > UCR | 3.
“hond”
CS (bel) > CR (de link ‘bel=eten’ is gemaakt): Leren van voorwaardelijke reacties of responses, als gevolg van
een neutrale of voorwaardelijke prikkel herhaaldelijk te laten volgen door een onvoorwaardelijke prikkel.
Generalisatie (transfer): CR treedt ook op na stimuli gelijkaardig aan de CS.
Selectief leren (discriminatie): Tegenovergestelde van generalisatie. Niet reageren op gelijksoortige CS.
Uitdoving (extinctie): CS wordt enige tijd niet door UCS opgevolgd. UCR wordt onderdrukt door uitdoving.
Experimentele neurose: Cirkel (eten), ellips (schok) > Vage grens = agitatie, defensie: exp. neurose.
Conditionering is afhankelijk van (1) relatie S-R en (2) genetische aanleg vh organisme (bv voedselaversie).
Appetitive conditionering: Hierbij wordt gebruik gemaakt van een onschuldige UCS.
Aversieve conditionering: Hierbij wordt gebruik gemaakt van een aversieopwekkende UCS. De tijd
tussen CS en UCS moet kort zijn, met uitzondering van voedselaversies. Van deze aversie wordt
verondersteld dat ze eigen is aan ons genetisch basispakket. Het vergiftigen van roofdieren (zonder
dat ze sterven) is een voorbeeld om met aversieconditionering (vermijdings-)gedrag aan te leren.
Zondebok-stimulus: De aversie wordt enkel geconditioneerd ten aanzien van de zondebok (bv ijsje).
KC heeft enkel effect op passieve, onwillekeurige reflexen. OC leert (complex) gedrag aan.
CONNECTIONISME
Vroeg 20e E.
Kennis is een reeks patronen van connecties tussen neuron-achtige elementen.
Leren staat in voor het versterken of verzwakken van deze connecties. Hierbij is er geen sprake van een
“centrale instantie” die het hele proces overziet en reguleert.
Law of learning 1: “Law of effect”: Gedrag wordt (auto & onbewust) versterkt door een positief effect.
Law of learning 2: “Law of exercise”: Oefenen om beter te worden. Onderwijs: “drill-and-practice”.
OPERANTE CONDITIONERING
THORNDIKE Midden 20e E.
“puzzeldoos”
Positieve respons. Het gedrag wordt aangeleerd door het te laten bevestigen met een positieve respons. Er
SKINNER wordt een associatie gelegd tussen een bepaalde situatie en bepaald gedrag.
“box” Skinner maakt, in contrast met Thorndike, een onderscheid tussen gedrag dat door externe stimuli wordt
uitgelokt en operant gedrag dat door het individu wordt geïnitieerd. De lerende zal zichzelf belonen door
succesvol gedrag te herhalen.
“Programmed instruction”: Gedetailleerde analyse leidt tot doelbewuste opsplitsing vh beoogde gedrag.
1
,LMP – Leertheorieën
Operante conditionering bewerkstelligt gedragsverandering door slim gebruik te maken van
consequenties die voor het organisme belangrijk zijn (straffen, belonen).
Twee sterke kanten aan operante conditionering:
1. Het is van toepassing op veel meer gedragstypen dan KC.
2. Het verklaart de manier waarop organismen nieuwe en complexe gedragingen leren.
Trial-and-error: Katten moesten uit de puzzeldoos van Thorndike
(1898, 1998) ontsnappen. Ze gingen aan de muren krabben, per
ongeluk het touwtje aanraken en zo met voedsel beloond
worden. Geleidelijk aan wordt de succesvolle handeling
verankerd tot het plezier waartoe het leidt.
Thorndike geloofde dat zijn wetten ook van toepassing zijn op
mensen. Hij leefde met de overtuiging dat het geleerde op 1 gebied (bv muziek) weinig bijdraagt aan
het leervermogen op een niet verwant gebied (bv grammatica). Dit, in tegenstelling tot het
heersende concept “transfer of training”.
Skinner bracht de term “operante conditionering” aan. De theorie is
gebouwd op de fundamenten die Thorndike heeft gelegd. Een operant is
een observeerbaar, vrijwillig gedrag dat een organisme vertoont met als
doel invloed uit te oefenen op de omgeving. Als radicaal behaviourist (in
traditie van Watson) weigerde Skinner te speculeren over wat er zich in
een organisme afspeelt (eten is observeerbaar, honger is dat niet).
*De “Skinner box”: De “operante ruimte”, een kleine ruimte met hendel dat voedsel produceert.
Primaire bekrachtigers Secondaire (geconditioneerde) bekrachtigers
Stimuli die elementaire biologische behoeften Neutrale stimuli die met primaire bekrachtigers
of verlangens bevredigen. geassocieerd worden. Door sterke
conditionering kunnen deze secondaire
Bv. voedsel (eetgedrag), water (drinkgedrag), seks (opwinding),
enz. bekrachtigers doelen op zich worden.
Bv. geld, macht, schoolcijfers, bewondering, goedkeurende
glimlachjes, medailles, statussymbolen, enz.
Frequentie, timing en het aantal beloningen zijn in functie van het beoogde doel van groot belang.
Hoeveel werk moet effectief worden verricht? Hoe vaak moet bekrachtiging worden toegediend?
Enz. Dit fenomeen wordt de gradiënten van bekrachtiging genoemd.
Voor het aanleren van nieuw gedrag wordt continue bekrachtiging aangewezen. Elke goede respons
wordt hierbij beloond. Intermitterende bekrachtiging is aangewezen als we aangeleerd gedrag in
stand wensen te houden. Deze vorm werkt nóg beter als het een onvoorspelbaar karakter heeft.
Intermitterende bekrachtiging is (1) tijdbesparend, (2) kostenbesparend en (3) biedt succesvol
weerstand tegen uitdoving van het gewenst gedrag. 2 manieren:
2
,LMP – Leertheorieën
Ratioschema Intervalschema
Beloning gebaseerd op aantal responsen. Beloning gebaseerd op tijd.
Vast (FR) (FI)
Aantal responsen meestal Periode tussen beloning is
redelijk hoog. constant.
Korte pauze na elke Weinig responsen na elke
bekrachtiging. bekrachtiging.
Bv. stukloon (€1/10 dozen) Bv. Maandelijks salaris.
Responsen nemen toe
naarmate beloning nadert.
Variabel (VR) (VI)
Geen pauzes na elke Periode tussen de beloningen
bekrachtiging. varieert.
Meer responsen dan eender Responsen treden redelijk
welk ander schema. constant (en veel) op.
Bv. Onaangekondigde
Minder voorspelbaar.
bezoekjes van jouw baas.
Bv. Telefonische verkopers.
Straf is een andere, riskante manier om gedrag te beïnvloeden. In tegenstelling tot bekrachtiging
moet straf consequent worden uitgevoerd. Intermitterend straffen is veel minder efficiënt dan
eender welke vorm van ongewenst gedrag te bestraffen. Als ongewenst gedrag niet bestraft wordt,
kan het aanvoelen als een beloning. De verschillen met bekrachtiging:
De kans dat het gedrag… Stimulus toedienen (+) Stimulus verwijderen (-)
…toeneemt is groter. Positieve bekrachtiging Negatieve bekrachtiging
Elke omstandigheid die op een respons Het weghalen van aversie (bv bij regen
Beloning volgt en dit versterkt (bv een werknemer (aversie) gebruik je een paraplu – je wordt
krijgt een bonus voor goed werk – en blijft niet nat, dus herhaal je dit gedrag).
hard werken, bv seks, aandacht, glimlach,
eten, complimenten, enz).
…afneemt is groter. Positieve straf Negatieve straf
Een aversieve stimulus wordt toegediend Een positieve stimulus wordt verwijderd
Bestraffing (bv een hardrijder krijgt een bekeuring – (bv als je te laat thuis komt krijg je geen
en rijdt in de toekomst langzamer). eten – en het kind komt de volgende keer
wel op tijd).
Waarom is straf zo moeilijk toe te passen?
Het vermogen van straf om ongewenst gedrag te onderdrukken verdwijnt meestal als de
dreiging van de straf verdwenen is.
Straf roept dikwijls agressie op.
Het toedienen van straf maakt het organisme onrustig. Dit blokkeert het leren van nieuwe en
betere responsen.
Straf wordt dikwijls oneerlijk toegepast.
Straf moet aan enkele eisen voldoen om effectief te zijn. De straf moet…
…snel en kort zijn.
…duidelijk zijn en na elke manifestatie van de ongewenste respons worden toegediend.
…beperkt blijven tot de situatie waarin de respons optrad.
3
, LMP – Leertheorieën
…in duur en intensiteit beperkt blijven – net genoeg om ongewenst gedrag te doen stoppen.
…gericht zijn op het gedrag en niet op de persoon.
…geen dubbelzinnige boodschappen bevatten.
…effectief zijn. Negatieve straf (het wegnemen van een positieve ervaring (bv uitstap)) is het
effectiefst. De toediening van een onaangename stimulus zoals pijn werkt minder goed.
ALTERNATIEVEN VOOR STRAF
Uitdoving Enkel mogelijk als alle mogelijke bekrachtigers van ongewenst gedrag worden weggenomen. Dit is
heel moeilijk. Daarom heeft uitdoving meer kans van slagen als het wordt gecombineerd met
positieve bekrachtiging van een gewenste respons.
Met menselijke interventie (aanmoediging bewust stoppen).
Zonder menselijke interventie.
Bekrachtiging ‘Premack principle’: Favoriete (vaak ontplooide) activiteiten kunnen worden gebruikt om minder
populaire activiteiten te bekrachtigen.
Bv. Eerst stilzitten en opletten. Daarna rennen en lawaai maken.
Prompting & Shaping Hoe laat ik iemand voor de eerste keer gewenst gedrag vertonen?
Prompting: De wijze waarop de eerste aanzet wordt gegeven voor het gewenste gedrag
(bv. lichaamsdeel aanraken).
Shaping: Bijwerken tot het gewenste niveau bereikt is. In eerste instantie wordt gedrag
dat bij benadering op de bedoelde respons lijkt bekrachtigen. Vervolgens maak je de
eisen voor bekrachtiging scherper, en scherper, en scherper, enz.
KLASSIEKE CONDITIONERING OPERANTE CONDITIONERING
Beoogt Beoogt
Dezelfde responsen op nieuwe stimuli. Nieuwe gedragingen.
Gebaseerd op Gebaseerd op
Automatische reflexieve handelingen. Eerder “vrijwillig” operant gedrag.
Bv. Speekselafscheiding, enz. Bv. Eten, zitten, draaien, enz.
S-R R-S
Respons op eerdere stimulatie. Gericht op het bereiken van een
toekomstige toestand (bekrachtiging),
of op het vermijden van straf.
Beide vormen van conditionering vullen elkaar aan. Zo kan een fobie voor slangen groter of kleiner
worden door een combinatie van klassieke en operante conditionering: De persoon ziet een slang
(CS). Dit werd gekoppeld aan een beangstigende ‘Kijk uit’ (UCS). Deze schrikreflex (slangenfobie)
werd bekrachtigd door mensen uit de omgeving die hem wensen gerust te stellen (operante
conditionering).
Best: Gelijktijdig bekrachtigen van wenselijk gedrag en uitdoven van ongewenste responsen.
1. Positieve bekrachtiging Goede oplossing, vooral als je een aantrekkelijker soort gedrag kunt bedenken.
2. Straf Gevaarlijk. Beperking of intrekken van voorrechten is meestal veel effectiever dan lichamelijke straffen.
3. Negatieve bekrachtiging Onaangename stimulatie. Nutteloos om gedragsverandering in de hand te werken. Goed bij
natuurlijke, onpersoonlijke omstandigheden (zoals hoofdpijn, die verdwijnt als je aspirine neemt).
4. Uitdoving Heel goede oplossing. Niet geven wat iemand hebben wil. De woedeaanval ebt vanzelf weg. Geen
optie als de persoon gevaarlijk gedrag vertoont.
4