Operante conditionering

Operatieve conditionering is een vorm van leren. Daarin verandert een individu zijn gedrag vanwege de gevolgen (resultaten) van het gedrag.

De persoon of het dier leert dat zijn gedrag een gevolg heeft. Dat gevolg kan zijn

Versterking: een positieve of belonende gebeurtenis. Dit zorgt ervoor dat het gedrag vaker voorkomt
Bestraffing: een negatieve of bestraffende gebeurtenis. Hierdoor komt het gedrag minder vaak voor
Uitsterving: er volgt geen gebeurtenis, dus het gedrag heeft geen gevolgen. Wanneer een gedrag geen gevolgen heeft, zal het minder vaak voorkomen.

Er zijn vier verschillende contexten in operante conditionering. De termen 'positief' en 'negatief' worden hier niet gebruikt in hun basiszin; positief betekent dat er iets wordt toegevoegd, en negatief betekent dat er iets wordt weggenomen:

Positieve versterking (vaak gewoon "versterking") treedt op wanneer er een beloning is voor een vorm van gedrag. Dit verhoogt de frequentie waarmee het gedrag zich voordoet. In het Skinner box experiment is de beloning in de vorm van voedsel wanneer de rat een hendel indrukt.
Negatieve versterking (soms "ontsnapping") treedt op wanneer een aversieve prikkel wordt verwijderd. Dit verhoogt de frequentie waarmee het gedrag zich voordoet. In het Skinner box-experiment was er een hard geluid, dat werd verwijderd toen de rat de hendel indrukte.
Positieve bestraffing vindt plaats als er een stimulans wordt toegevoegd, waardoor het gedrag minder vaak voorkomt. Voorbeeldige prikkels kunnen luidruchtig zijn, een elektrische schok (rat) of een billenkoek (kind).
Negatieve bestraffing vindt plaats wanneer een stimulans wordt weggenomen, waardoor het gedrag minder vaak voorkomt. Een voorbeeld hiervan is het meenemen van speelgoed nadat het kind ongewenst gedrag heeft vertoond.

Het idee van operante conditionering werd voor het eerst ontdekt door Edward Thorndike, en geanalyseerd door B.F. Skinner.

Operant conditioning is anders dan de klassieke conditionering van Pavlov. Operant conditioning gaat over het vrijwillig veranderen van gedrag; klassieke conditionering met training van een reflex.

De wet van Thorndike

Operant conditioning, ook wel instrumentaal leren genoemd, werd voor het eerst bestudeerd door Edward L. Thorndike (1874-1949). Hij observeerde het gedrag van katten die probeerden te ontsnappen aan zelfgemaakte puzzeldozen. Toen de katten voor het eerst in de dozen werden gestopt, duurde het lang voordat ze ontsnapten. Door de ervaring kwamen succesvolle reacties vaker voor, waardoor de katten in minder tijd konden ontsnappen. In zijn wet van effect, Thorndike theoretiseerde dat gedrag gevolgd door bevredigende gevolgen de neiging hebben om te worden herhaald, en degenen die onaangename gevolgen produceren zijn minder waarschijnlijk om te worden herhaald. Kortom, sommige gevolgen versterken het gedrag en sommige gevolgen verzwakken het gedrag. Thorndike produceerde de eerste bekende leercurves door deze procedure.

B.F. Skinner (1904-1990) werkte een meer gedetailleerde analyse uit van de operante conditionering. Skinner vond de operantconditioneringskamer uit, die hem in staat stelde de reactiesnelheid te meten als een sleutelafhankelijke variabele. Hij gebruikte een registratie van hefboom- of toetspieken.

Principes van operante conditionering:

Discriminatie, veralgemening en het belang van de context.

Het leren vindt plaats in contexten.
Het meeste gedrag is onder stimuluscontrole: een bepaalde reactie treedt alleen op als er een geschikte stimulus aanwezig is.
Stimuluscontrole is effectief, zelfs als de stimulans geen betekenis heeft voor de respondent.

Uitsterven: operatief gedrag ondergaat uitsterven wanneer de wapening stopt.

De versterkingen treden alleen op als de juiste reactie is gegeven, en mogen zelfs dan niet plaatsvinden. Gedragingen verzwakken en doven hierdoor niet.
De resultaten zijn mede afhankelijk van hoe vaak de versterking wordt ontvangen.

Versterkingsschema's: de timing van de versterkingen is cruciaal.

Vast intervalschema: de versterkingen worden op vaste tijdstippen gepresenteerd, op voorwaarde dat de juiste reactie wordt gegeven.
Variabel intervalschema: een gedrag wordt versterkt op basis van een gemiddelde tijd die verstreken is sinds de laatste versterking. Ratio schema's: gebaseerd op de verhouding tussen reacties en versterkingen.
Vast intervalschema: de versterking wordt geleverd nadat er een bepaald aantal reacties zijn gegeven. Het speciale geval van het presenteren van versterking na elke reactie wordt continue versterking genoemd.
Variabel intervalschema: de leveringsversterking is gebaseerd op een bepaald gemiddeld aantal reacties.

Operante conditionering

De wet van Thorndike

Zoek op letter