Operantes Konditionieren  


Operantes Konditionieren - Grundbegriffe


Die Verhaltenskette S-O-R-K-C

In Pädagogik und Sozialarbeit wird oft in vorwissenschaftlicher Weise mit Verhaltensbeeinflussung umgegangen. Stereotypes Loben und Belohnen, Verhaltensverträge, die keine sind, negative Konsequenzen für unsoziales Verhalten, die von den Betroffenen gar nicht als negative Konsequenz ankommen, so geht das bis zum heutigen Tag, obwohl die wissenschaftlichen Kriterien und deren sinnvolle Anwendung seit den Siebziger Jahren vorliegen.

Das Standardwerk:

James G. Holland und B.F. Skinner (1971): Analyse des Verhaltens.
Urban & Schwarzenberg, München.

Das Buch ist in Form des programmierten Lernens verfasst. Das heißt, der Lernstoff wird in kleinen Abschnitten dargeboten, die schriftlich beantwortet werden müssen.

Verhaltensmodifikation in der Sozialarbeit:

Roland G. Tharp, Ralph J. Wetzel (1975): Verhaltensänderungen im gegebenen Sozialfeld.
Urban & Schwarzenbert, München.

Hier eine Kurzfassung der Verhaltensgleichung, oder besser: Verhaltenskette S-O-R-K-C:

Quelle: biologie-seite.de

Bestandteile

Sorkc.jpg

  • S (Stimulus) bezeichnet eine äußere oder innere Reizsituation. Der Stimulus erfasst die das Verhalten auslösenden Bedingungen (In welcher Situation tritt das Verhalten auf?).

  • O (Organismus) bezeichnet die individuellen biologischen und lerngeschichtlichen Ausgangsbedingungen bzw. Charakteristika der Person auf den Stimulus.

  • R (Reaktion) bezeichnet die Reaktion auf ‚S‘ nach der Verarbeitung durch den Organismus auf kognitiver, motorischer, vegetativer und affektiver Ebene.

  • K (Kontingenz) bezeichnet die Regelmäßigkeit des Auftretens der Konsequenz nach der Reaktion.[6]

  • C (Konsequenz) bezieht sich auf das Einsetzen einer Verstärkung oder Bestrafung als Folge eines Verhaltens (Was folgt auf das Verhalten?).


Grundsätzlich kann man also sagen:

S

O

R

K

C

Ein Reiz wirkt auf einen Organismus ein, der bei diesem eine emotionale-physiologische Reaktion auslöst. Nachfolgend ergibt sich eine Konsequenz aus der Reaktion (z. B. Erleichterung durch Flucht). Läuft dieser Vorgang häufig ab verstärkt sich die Reaktion; es wird gelernt, bestimmte Verhaltensweisen bilden sich heraus. Auf diese Weise können unter anderem psychische Krankheiten oder Verhaltensstörungen entstehen oder auch bekämpft werden - bspw. durch ein Einüben anderer Verhaltensweisen oder durch eine Veränderung von Stimuli. Dieser Ansatz wird vor allem in der Verhaltenstherapie verfolgt.

Und hier die Erklärung weitere wesentlicher Grundbegriffe der Verhaltensmodifikation nach Holland und Skinner:

zu K (Kontingenz):

Die Konsequenz C kann kontinuierlich oder intermittierend erfolgen.

Die intermittierende Verstärkung erfolgt nach einem Intervall-Plan (z.B. alle 5 Minuten), oder Quoten-Plan (z.B. jedes vierte Mal), regelmäßig, oder unregelmäßig.

Intermittierende Verstärkung ist wirkmächtiger als kontinuierliche Verstärkung. Unregelmäßige wirkmächtiger als regelmäßige.

SD ist ein Stimulus (Reiz), der eine Belohnung verspricht (C+)

SΔ ist ein Stimulus, der eine unangenehme Konsequenz verspricht (C-), eine „Bestrafung“.

Belohnen

SD darbieten

SΔ entfernen

Bestrafen

SΔ darbieten

SD entfernen

Löschen

SD entfernen



Belohnen führt zum Aufbau und Festigen eines Verhaltens.

Bestrafen führt zur Vermeidung eines Verhaltens. Bleibt der aversive Reiz SΔ aus, tritt das Verhalten wieder auf.

Löschen führt zum Verlernen eines Verhaltens. Taucht der verstärkende Reiz SD wieder auf, wird das Verhalten erneut gezeigt, dann dann handelt es sich um intermittierende Verstärkung statt Löschung.

Wirksamer ist daher, das unerwünschte Verhalten durch eine anderes Verhalten zu ersetzen, das man nicht gleichzeitig ausführen kann (unvereinbares Verhalten).

Verstärker SD - es gibt Belohnungen, die bei fast allen wirken und solche, die besonders bei bestimmten Personen wirken. Zur Verhaltensdiagnostik gehört daher, herauszufinden, was eine Person belohnt (verstärkt).

Entsprechendes gilt für die Darbietung aversiver Reize SΔ.

Beispiel: jemanden in der Unterrichtszeit nach Hause zu schicken, ist für die einen Bestrafung, für andere aber unter Umständen eine Belohnung.

Die Verhaltenskette ist keine Gleichung im mathematischen Sinne, denn sie enthält kein Gleichheitszeichen. Sie stellt eine Folge dar, wobei die Kette eigentlich unendlich ist: die Konsequenz C ist gleichzeitig das S für eine nächste Folge.

Nach Tharp und Wetzel (siehe oben) ist es nicht nur wichtig, was bei einer Person als Belohnung (C) wirkt, sondern wer im Umfeld der Person wirksame Belohnungen verabreichen kann. Vater, Mutter, Geschwister, Lehrer, Freunde, Sport-Trainer usw.

Veranschaulichung.

Beispiel 1

Eine Klassenarbeit steht an (S), du bereitest dich vor, weil du in der Vergangenheit damit gute Erfahrungen gemacht hast und weil eine Belohnung winkt.
O: Du erinnerst dich daran, dass eine gute Vorarbeit zu einem guten Ergebnis mit anschließender Freude, faul Sein zu einem schlechten Ergebnis mit den entsprechenden Konsequenzen geführt hat.

Die Ankündigung der Klassenarbeit löst also Bilder und Gefühle in dir aus, diese steuern dich an den Schreibtisch. Du bereitest dich vor (R). Als Ergebnis bekommst du eine gute Note: C.

Allerdings führen deine Bemühungen um eine gute Zensur nicht immer zum erwarteten Ergebnis. Ab und zu bekommst du eine gute, manchmal auch eine mäßige Zensur. Die Belohnung erfolgt also nicht regelmäßig, sondern nach dem Muster einer unregelmäßigen Quote. Das ist die Kontingenz K.

Die Erinnerung an eine gute Note (C), genauer: an den Zusammenhang von Vorbereitung und Ergebnis, verknüpft sich mit dem nächsten S, der Ankündigung einer weiteren Klassenarbeit. So entsteht eine Verhaltenskette. Du gibst dir mehr Mühe, erhöhst deinen Einsatz, um noch häufiger noch bessere Ergebnisse C zu erzielen.

Wenn du jedes Mal in einem Fach sehr gute Noten erhältst, ist dein Lernantrieb wohl geringer als wenn jede zweite oder dritte Arbeit gut ausfällt. Dabei muss natürlich im Hintergrund berücksichtigt werden, wie viel Anstrengung du überhaupt benötigst, eine gute Arbeit zu schreiben.

Schreibst du nie eine wirkliche gute Arbeit, wird dein Vorbereitungs-Antrieb möglicherweise gelöscht.
Schreibst du trotz Vorbereitung immer wieder schlechte Arbeiten, wird dein Antrieb nicht nur erlahmen: Da du jedes Mal bestraft wirst – schlechtes Ergebnis – bekommst du jedes Mal, wenn du daran denkst, schlechte Gefühle und wehrst dich aktiv gegen die Vorbereitung. Du vermeidest.

Wenn wir genauer hinsehen, ist die Konsequenz für eine gute Vorbereitung meistens ein Bündel von Konsequenzen. Die gute Note, das Wohlwollen der Lehrerin, die Freude der Eltern, ein Zuschuss zum Taschengeld und ein Zuwachs an Selbstvertrauen. Vielleicht auch die Bewunderung anderer Schüler und mehr Interesse am Inhalt des Gelernten. Vielleicht auch nur eins davon.

Merkst du, dass keine Zusammenhang zwischen Vorbereitung und Ergebnis besteht, wird die Vorbereitung für dich irrelevant, du tust lieber etwas, was dir mehr einbringt. Mehr gutes C.

Wenn wir noch genauer hinsehen, gibt es zwei Rs, nämlich die Vorbereitung und die Leistung während der eigentlichen Klassenarbeit. Man kann sich falsch vorbereiten, oder man kann in der Prüfungssituation nicht so gut denken wie am eigenen Schreibtisch. Der Gewinn C hängt also von beidem ab.

Zum Verstehen einer Situation im Sinne der Verhaltenskette ist also keine mechanische Angelegenheit im Sinne eines Tauben-Lern-Experiments mit Skinner-Box: Futterspender, Licht- und Ton-Signal und Hebel. Es erfordert genaue Beobachtung und Einfühlung, um das, was geschieht, zu analysieren und diagnostizieren.
Nur dann gelingt die Veränderung der Kontingenzen: der Aufbau eines Verhaltens, das für die Person (und vielleicht auch für die Mitmenschen) mehr gewinnbringend ist.

Beispiel 2

Der Fußballstar Steinschweiger erfährt, dass er für das nächste Spiel aufgestellt und Spielführer ist. Diese Mitteilung ist das S, genauer das SD, sie lässt ihn Gutes erwarten, wenn er sich anstrengt und zeigt was er kann. Die bisherigen guten Erfahrungen kommen ihn in Erinnerung, und die Glücksgefühle, die er hatte, wenn er Tore schoss oder gute Flanken geschlagen hat. Oder dem Gegner davon gelaufen ist (O). Daher ist er im Training hoch motiviert und schreitet auf den Platz mit der Lust am Sieg, der Freude über die johlenden Zuschauer, die ganze Atmosphäre. Die Konsequenzen C sind der Sieg, der Beifall, das Geknutsche seiner Mitspieler, das Entlanglaufen vor den Fans, die Interviews im Fernsehen und die Gehaltssteigerung bei der nächsten Vertragsverhandlung (Ah, sofortige und aufgeschobene positive Konsequenz). Manche Spieler sind immer gut und erfolgreich (regelmäßige Verstärkung), manche manchmal (Quotenverstärkung), manche längere Zeit nicht, die suchen sich einen anderen Verein, um wieder ins Spiel zu kommen und belohnt zu werden, manche hören einfach auf.
Manche werden ausgepfiffen, die werden dann eine Zeitlang trotzig, „jetzt erst recht“, das kann zu noch höherer Anstrengung führen – Reaktion auf Löschung und Bestrafung, das kann durchaus funktionieren, ja sogar reizvoll sein. Kommt dann aber kein Erfolg, gibt es Resignation oder gar Widerstand. Oder ein Wechsel der Sportart, wo mehr S mit C-Aussicht wartet