|
|
6. Kapitel
Das Paradigma des Behaviorismus
Während die Arbeiten von Thorndike und Pawlow, der bedeutenden Vorläufer des Behaviorismus, im ersten Jahrzehnt des 20. Jahrhunderts noch relativ sporadisch und auch voneinander isoliert rezipiert wurden, wird die verbale Selbstidentifizierung der neuen Richtung durch Watson vor allem in den USA zu einer „Initialzündung". Watson proklamiert die Abkehr von der mentalistischen Psychologie der „Psyche" und des Bewußtseins, wie sie sowohl in der „strukturalistischen" Tradition Wundts als auch in der „funktionalistischen" Deweys und natürlich erst recht in Freuds „Tiefenpsychologie" betrieben wird.
Der Kristallisationspunkt dieser Abgrenzung liegt auf der methodologischen Ebene; und zwar in der strikten Ablehnung aller (bis dahin in der gesamten wissenschaftlichen Psychologie obligatorischen) introspektiven Forschungsmethoden. So wird die Psychologie „wie der Behaviorist sie sieht", zu einem Programm gegen den „Rest" der (wissenschaftlich-psychologischen) Welt, eine ideale Voraussetzung für die Entstehung eines neuen wissenschaftlichen Paradigmas. Die suggestive Kraft von Watsons unerschrocken vorgetragenen Etikettierungen und die damit verbundenen Grundsatzerklärungen zu Forschungsgegenstand und -methodik erzeugen im psychologischen Forschungssystem sehr schnell eine starke Eigendynamik. Bald entsteht eine gewaltige behavioristische „Strömung", die bis Ende der 60er Jahre anhält, und deren methodologische Prinzipien bis heute in großen Teilen der Psychologie akzeptiert werden.
Es entsteht ein neues Paradigma der Psychologie, das Paradigma des Behaviorismus.
In der Nachkriegszeit ist sein Einfluß dann so groß, daß der Behaviorismus sogar beinahe zum „herrschenden Paradigma" der (westlichen) akademischen Psychologie wird, gäbe es da nicht in den USA noch gewichtige Ganzheitspsychologen wie Lewin und Bruner, und ergriffe nicht Piaget von Genf aus Partei für eine (wie oben gezeigt, ebenfalls ganzheitspsychologische) strukturalistische Psychologie. Die deutschen ganzheitspsychologischen Zentren jedoch sind entweder durch die Nationalsozialisten zerschlagen oder haben sich selbst diskreditiert. Und so kommt die deutsche akademische Nachkriegspsychologie in den unwiderstehlichen Sog „der" neuen US-amerikanischen Psychologie: Zusammen mit dem „american way of life" kommt der „american way of psychology" über den Atlantik, und von Amerika lernen heißt, den Erfolg lernen.
(Daran scheint sich bis heute wenig geändert zu haben: Auch der nächste „Paradigmenwechsel" hin zum Kognitivismus wird in Deutschland, mit 10 Jahren Verzögerung, transatlantisch importiert. Solange braucht man wohl, um sicher zu sein, daß es auch tatsächlich der „mainstream" ist, der sich geändert hat. - Und neuerdings werden die „heißen" Neuerungen des „situated cognition"-Ansatzes (vgl. das vorige Kapitel) in einer Weise gefeiert, die daran zweifeln läßt, ob den deutschen Rezipienten bewußt ist, daß sie seine Wurzeln in Berlin und Leipzig suchen müssen.)
Die behavioristische Psychologie wird also zu einer äußerst weiträumigen und einflußreichen Strömung, die im folgenden (in zwangsläufig nur sehr groben Zügen) skizziert werden soll.
6.1 Die Gründungssituation des Behaviorismus
6.1.1 Einflüsse von „Zeit-„ und „Kontinentalgeist"
Der Aufstieg des Behaviorismus verläuft zeitgleich mit dem Eintritt der USA in die große Weltpolitik und mit ihrem Aufstieg zur Weltmacht. Obwohl eine seiner wichtigsten Wurzeln (der physiologische Anteil Pawlows) aus dem zaristischen Rußland stammt, ist der Behaviorismus dennoch wohl das amerikanischste von allen psychologischen Paradigmen. Seine programmatische Formulierung durch Watson enthält etwas vom Programm Amerikas, und seine negativen Heuristiken, die sich an der Gegnerschaft zur introspektiven Bewußtseinspsychologie kristallisieren, zeigen in pointierter Weise, wo im Kern die Unterschiede zwischen kontinentaleuropäischen und US-amerikanischen Auffassungen liegen.
Der Behaviorismus ist, so Boring (1950), die Vollendung der Gegenreaktion der amerikanischen Psychologie auf die „deutsche Elternschaft" (der Wundtschen Schule), die mit dem Funktionalismus begonnen hatte. Wie subtil solche kulturellen Differenzen hineinreichen können bis in das Design des psychologischen Tierexperiments, hat Bertrand Russel (wahrscheinlich bezogen auf Skinners Tauben und Köhlers Primaten) wie folgt in humorvoller Weise kolportiert: „Versuchstiere von amerikanischen Behavioristen verhielten sich wie Amerikaner: sie rannten herum in beinahe zufälliger Weise, während die von Deutschen sich wie Deutsche verhielten: sie saßen da und dachten nach." (Zitiert nach: Skinner, 1974a, S. 18; Übers.: G.S.)
In der Programmatik des Behaviorismus realisiert sich in konsequenter Weise etwas von der Utopie, deretwegen soviel Amerikaner oder deren Vorfahren Europa verlassen haben:
• Er verspricht, so Watson, eine Erlösung von allem mentalistischen „erstickenden Seelenqualm" (Watson, 1968, Original 1913; S. 37), durch den die Kirchen und die Mächtigen in Europa ihren Kampf gegen die Aufklärung führten, und den sie für ihre ideologische Machtausübung einsetzten. Anders als in den späteren Auseinandersetzungen um den Behaviorismus häufig eingewandt, ist diese Psychologie in ihren Grundpositionen zunächst ein Kind der Aufklärung, und sie sieht ihre Wurzeln sowohl in Comptes Positivismus als auch in Descartes entmystifizierten Vorstellungen einer menschlichen Maschine.
• Der Behaviorismus enthält außerdem stark millieutheoretische Elemente, indem er die prägende Kraft der Umgebung auf die persönliche Entwicklung des Menschen betont. Damit gibt es zum ersten Mal eine wissenschaftliche Begründung für die Hoffnung auf Chancengleichheit, deretwegen viele Amerikaner aus dem sozial streng hierarchisch strukturierten Europa in die Neue Welt gezogen waren. Der Mythos vom Tellerwäscher, der Präsident werden kann, erhält eine Spur wissenschaftlicher Seriosität, und das pragmatische Programm Deweys, mit seiner Utopie der Demokratisierung der Gesellschaft durch eine wissenschaftsorientierte Erziehung erhält eine neue psychologische Komponente.
• Nicht zuletzt ist es die gesamte Utopie der Machbarkeit durch Wissenschaft, die durch den Behaviorismus neue Nahrung erhält. Sie ist natürlich keineswegs rein „amerikanisch"; die stürmische Entwicklung und der immense Erfolg der Naturwissenschaften und der Technik im Verlauf des 19. Jahrhunderts müssen um die Jahrhundertwende jeder Psychologie, die sich ihren Grundprinzipien verschreibt, eine enorme Schubkraft verleihen. Amerika (die USA) ist aber ein Land des Pragmatismus (natürlich auch das des Philosophischen Pragmatismus eines Dewey, Pierce und William James), das den Wert einer Wissenschaft oder einer Theorie weniger nach metaphysischen Kriterien der „Wahrheit" als nach ihrer praktischen Nützlichkeit für die Realitätsbewältigung bewertet. Anpassung, „fitness" (!), sowohl des einzelnen als auch der gesamten Gesellschaft im internationalen Wettbewerb, wird, in Anlehnung an Darwins Kriterium des „survival of the fittest", zu einem hohen Wert in der amerikanischen Gesellschaft. - Und der Behaviorist verspricht die psychologischen Instrumente, dies zu erreichen.
6.1.2 Die funktionalistischen Einflüsse Thorndikes
Gegen Ende des 19. Jahrhunderts entsteht, vor allem an den amerikanischen Universitäten von Chicago und Columbia, ein wissenschaftlich-psychologisches System, das „Funktionalismus" genannt wird. Seine Theoriebildung basiert auf den Annahmen des amerikanischen Pragmatismus, und einer der Hauptvertreter dieser Philosophenschule, John Dewey (1859-1952), ist gleichzeitig auch in der Psychologie tätig. In Chicago lehren zunächst Dewey und James R. Angell (1869-1949) gemeinsam (bei letzterem wird Watson später promovieren). Der zweite Schwerpunkt des Funktionalismus wird Columbia (New York), wo Thorndike und James McKeen Catell (1860-1944) zusammenarbeiten. Woodworth (Columbia) und Carr (Chicago) werden diese Tradition bis in die Mitte dieses Jahrhunderts fortführen.
Einer der Funktionalisten, der sowohl unter methodologischen als auch theoretischen Gesichtspunkten für den Behaviorismus eine herausragende Bedeutung erhält, ist Edward L. Thorndike (1874-1949). Seine Untersuchungen wie auch sein Begriffssystem wurden zu wichtigen Wegbereitern der späteren S-R-Theoretiker in Amerika.
Thorndikes Ausgangsannahme lautet:
„Die Vielschichtigkeit des Lernens beim Menschen wird am Ende am besten verstanden werden, wenn wir ihr zunächst aus dem Wege gehen und statt dessen lieber das Verhalten der niederen Tiere untersuchen, während sie lernen, bestimmten Situationen auf andere, gewinnbringendere Weise zu begegnen." (Thorndike, 1913; S. 6; zit. nach Amsel & Rashotte, 1984)
![]() |
|---|
In den bekanntesten seiner Experimente werden Versuchstiere hungrig in einfache „Problemkäfige" gesperrt, aus denen sie sich mit einer gezielten Reaktion befreien können. Es werden jeweils die Merkmale des Verhaltens des Versuchstiers beschrieben sowie quantitativ die Zeit und die Zahl der Versuche notiert, die das Tier jeweils bis zu seiner Befreiung braucht.
Ziel ist es, den Aufbau eines Reflexbogens zu untersuchen, dessen Reizbestandteil die Situation ist (hungrig im Versuchskäfig eingesperrt, das Futter vor Augen), und dessen Reaktionsanteil (das Öffnen der Tür durch Hebeldruck mit anschließendem Fressen) eindeutig adaptive Funktion hat (vgl. Abb. 6.1). Die erfaßten Daten geben nun Aufschluß über die Gesetzmäßigkeiten, unter denen die Assoziationen, also die Verbindungen zwischen den Reiz- und Reaktionsanteilen zustande kommen.
Das Versuchstier versucht nun, relativ ziellos, aus dem Käfig herauszukommen. Dabei tritt das erfolgreiche Hebeldrücken zunächst zufällig auf. Bei jeder Wiederholung des Experiments mit demselben Tier beginnt dieses wieder mit seinem unsystematischen Verhalten, allerdings verkürzt sich die Zeit bis zum entscheidenden Hebeldruck zunehmend, bis sich endlich ein zuverlässig reproduzierbares, stabiles Lösungsverhalten herausbildet.
„Versuch und Irrtum": Lernen als Evolutionsprozeß
Da „Lernen" nur im Kontext evolutionärer Anpassung zu verstehen ist, muß nun erklärt werden, wie adaptives Verhalten zustande kommt. Thorndike bedient sich hier evolutionärer Grundprinzipien: Angepaßtes Verhalten wird unter bestimmten Bedingungen aus einer großen Zahl nicht adaptiver Verhaltensweisen selektiert. Problematischen Situationen begegnen Lebewesen nämlich immer in derselben Weise: Sie setzen aus ihrem Verhaltensrepertoire eine möglichst große Zahl von Verhaltensweisen ein und registrieren die Auswirkungen. Thorndike nennt diese immer wieder beobachtete Lösungsstrategie seiner Versuchstiere das Prinzip von „Versuch und Irrtum" (trial and error).
Assoziationen von Situationen und Reaktionen
Mit dem Grundschema des Reflexbogens beschreibt Thorndike die Lernprozesse im Detail: Es zeigt sich, daß stets eine äußere (Stimulus-) „Situation" (S) auf einen Organismus einwirkt, und daß der Organismus als Folge davon eine „Reaktion" (R) ausführt. Wird nun in derselben Situation mit einer gewissen Wahrscheinlichkeit immer dieselbe Reaktion gezeigt, so ist eine „Assoziation" (Verbindung) zwischen Situation und Reaktion zustande gekommen. Es hat ein Lernprozeß stattgefunden.
Das Effektgesetz
Entscheidend für das Zustandekommen einer Assoziation ist die
Wirkung (effect), die das
Ausführen der Reaktion in dieser Situation hat: Eine Verbindung wird begünstigt,
also
„verstärkt" (reinforced), wenn die Reaktion zu einer befriedigenden
(lustbetonten)
Nachwirkung führt. Sie wird abgeschwächt, wenn die Nachwirkung
unbefriedigend
(unlustbetont) ist. (Aufgrund späterer, widersprüchlicher Versuchsergebnisse
ließ Thorndike
den zweiten Teil des Effektgesetzes wieder fallen.) Als „lustbetont" definiert
Thorndike einen
Zustand, in dem ein Lebewesen nichts tut, um ihn zu vermeiden, aber etwas unternimmt, um
ihn herbeizuführen oder aufrechtzuerhalten; „unlustbetont" heißt
ein Zustand, zu dessen
Beibehaltung ein Lebewesen nichts unternimmt, zu dessen Beendigung es aber oft
beiträgt.
(Vgl. Thorndike, 1913; S. 2)
6.1.3 Die „Reflexologie" Pawlows
Neben dem amerikanischen Pragmatismus und Funktionalismus und ihrer Realisierung in Thorndikes Forschungsprogramm wird die russische Reflexologie zur zweiten Säule des Behaviorismus.
Nach seinen Arbeiten zur Verdauungsphysiologie beginnt Iwan Pawlow (1849-1936) nach der Jahrhundertwende, sich intensiv für die Reizung von Speicheldrüsen „auf Distanz" zu interessieren. In seinem Aufsatz „Experimentelle Psychologie und Psychopathologie" von 1903 beschreibt er zum ersten Mal das Zustandekommen „bedingter Reaktionen" (vgl. Pawlow, 1903).
a) Physiologische und psychologische Reflexe: Reizung auf Distanz
Führt man Versuchstieren verschiedene Stoffe ins Maul ein (dies sind weiterhin die bewährten, für physiologische Experimente durch Drüsenfisteln präparierte Hunde), so bildet sich Speichel in Abhängigkeit von den Eigenschaften dieser Stoffe: Bei trockener Nahrung bildet sich viel, bei wasserreicher Nahrung weniger Speichel; bei Säuren, Salz oder Sand ist der Speichel dünnflüssig (die Stoffe werden ausgespült oder verdünnt) und bei sauberen Kieselsteinen bildet sich kaum Speichel (die Steinchen werden durch Maul- und Zungenbewegungen mechanisch entfernt). Pawlow interpretiert diese differenzierten physiologischen Vorgänge als Bestandteil einer zweckmäßigen Anpassung, die das Lebewesen in ein Gleichgewicht mit der Umgebung versetzt. Diese Form der Anpassung besteht in einem einfachen reflektorischen Vorgang, der infolge äußerer Reizungen auf zentripetale Nervenenden beginnt, die auf bestimmten Nervenbahnen zum Zentrum weitergeleitet werden und auf bestimmten Bahnen zur Drüse zurückkehren, wo sie in eine sekretorische Funktion umgesetzt werden. (Vgl. a.a.O.; S. 114)
Äußerst überraschend ist aber, daß beinahe dieselben Drüsenfunktionen bei denselben Objekten auch dann in Gang kommen, wenn diese Objekte nicht mit den Verdauungsorganen in Berührung kommen, sondern nur auf Distanz zu sehen oder zu riechen sind. Da hier die Reizung der Speicheldrüsen durch Objekteigenschaften ausgelöst wird, die „für die Funktion unwesentlich oder ganz zufällig sind", muß es sich um „Erscheinungen ganz anderer Art handeln", nämlich um „psychische Erscheinungen"(a.a.O.; S. 117). Diese sind, wie Pawlow nun zeigt, gezielt manipulierbar: Färbt man eine Säure schwarz und führt diese dem Hund ins Maul ein, so entsteht (wie auch bei ungefärbter Säure) eine starke Speichelreaktion. Zeigt man dann aber dem Hund eine schwarze Flüssigkeit, so tritt (anders als bei schwarzen Flüssigkeiten vor dem Versuch) die gleiche Speichelreaktion ein.
Während die „physiologische", direkte Reizung ohne Vorbedingungen immer zum selben Ergebnis führt, und damit ein „unbedingter Reflex" ist, müssen bestimmte Bedingungen erfüllt sein, damit die Reizung auf Distanz funktioniert, und Pawlow nennt solche Reflexe hier zum ersten Mal „bedingte Reflexe". (a.a.O.; S. 118)
b) Pawlows typische Versuchsanordnung
![]() |
|---|
Da die motorischen Komponenten von Reflexen schwer zu quantifizieren sind, bleibt Pawlow (im Gegensatz zu Bechterew) bei der Beobachtung und Messung von Verdauungssekreten. Um dies möglichst genau durchführen zu können, sind die Versuchstiere (Hunde) in folgender Weise präpariert: Die Speiseröhre wird durchtrennt und beide Enden werden isoliert in die Haut des Halses eingenäht. (Damit fällt das Futter, das ins Maul gelangt, wieder heraus.) Außerdem werden Fisteln eingeführt: in den Magen und zur Ohrspeicheldrüse. (So lassen sich jederzeit die Sekretproduktionen genau quantifizieren.)
c) Aufbau und Entwicklung eines bedingten Reflexes
(Darstellung hier nach Pawlow, 1934)
1. Phase: Erzeugung eines undifferenzierten Reflexes
Zunächst prüft man die Intensität des unbedingten Reflexes (also z.B. die Speichelmenge beim Einführen einer bestimmten Futterportion ins Maul). Dann stellt man fest, ob der „indifferente Reiz", der später zum bedingten werden soll (z.B. ein Summton mit einer festgelegten Frequenz von z.B. 500 Hz), auch wirklich keine Wirkung auf den Speichelfluß hat.
Nun erst bietet man ein- oder mehrmals zunächst den indifferenten und sofort danach den unbedingten Reiz dar. (Weitergehende Untersuchungen Pawlows zeigen, daß der zeitliche Abstand beider Reize (z.B. bei Hunden) 5 Sekunden nicht überschreiten sollte.)
Dann wird die Wirkung des bedingten Reizes allein geprüft; wieder durch Messung der von ihm ausgelösten Speichelmenge.
2. Phase: Generalisierung, Hemmung und Differenzierung
Generalisierung: Es zeigt sich zunächst, daß nach dem Entstehen des bedingten Reflexes nicht nur der bedingte Reiz in der Lage ist, die bedingte Reaktion auszulösen. Der Reflex ist generalisiert worden; d.h. im Falle des obigen Beispiels, daß auch Töne anderer Frequenzen, ja sogar völlig andere Schallereignisse Speichelreaktionen erzeugen können. Es hat, in Pawlows Worten, eine Irradation stattgefunden; die Erregung hat sich, so die hirnphysiologische Annahme, über mehrere benachbarte Zellkomplexe ausgebreitet, die bei der Bildung der bedingten Reaktion mit erregt wurden.
Hemmung: Nun zeigt sich experimentell gleichzeitig ein gegenläufiges Phänomen. Bietet man den bedingten Reiz (500 Hz-Ton) mehrfach ohne „Bekräftigung" durch den unbedingten Reiz („Futter") dar, so wird die bedingte Reaktion stetig schwächer („auslöschende Hemmung"). Tut man dasselbe aber mit einem Reiz, der dem bedingten Reiz sehr ähnlich ist (z.B. ein Summton mit leicht geringerer Frequenz), so wird nicht nur dessen (durch Generalisierung entstandene) Wirkung beeinträchtigt, sondern auch die des bedingten Reizes selber; d.h. auch die Hemmung irradiert.
Differenzierung: Wird aber der ursprüngliche bedingte Reiz (500 Hz-Ton) weiter (durch Darbietung des unbedingten Reizes „Futter") bekräftigt, während die umliegenden „falschen" Töne ohne bedingten Reiz dargeboten (und damit gelöscht) werden, so geht deren Wirkung verloren. Es stellt sich eine Differenzierung ein, die so fein sein kann, daß der bekräftigte 500 Hz-Ton die bedingte Reaktion auslöst, ein 498 Hz-Ton aber nicht mehr (vgl. a.a.O.; S. 189). Hirnphysiologisch deutet Pawlow dies damit, daß durch wechselseitige Irradation und Konzentration nervaler Prozesse nun beim bedingten Reiz eine Abgrenzung der Erregung in der Hirnrinde stattgefunden hat.
Ähnlich wie Thorndike, glaubt Pawlow eine „elementare psychische Erscheinung" gefunden zu haben, die sich einerseits streng objektiv untersuchen läßt, andererseits aber Grundlage ist für die gesamten „höheren Nerventätigkeiten", bis hin zum Bewußtsein.
Er sieht die bedingten Reflexe als einen zentralen Anpassungsmechanismus mit dem jedes Individuum in die Lage versetzt wird, sein Gleichgewicht in einem sich ständig ändernden äußeren Milieu aufrechtzuerhalten: „Die erste Sicherung des Sich-ins-Gleichgewicht-Bringens und folglich auch die Ganzheit des Einzelorganismus sowie seiner Art wird von den unbedingten Reflexen gebildet." (a.a.O.; S. 187)
Wie an den Forschungsprogrammen der beiden vorbehavioristischen Repräsentanten Thorndike und Pawlow zu erkennen, bewegt sich zu Beginn des 20. Jahrhunderts die Psychologie auf eine neue Grundkonzeption zu:
Die methodologische Vorentscheidung scheint Priorität zu erhalten vor der inhaltlichen Festlegung auf einen psychologischen Untersuchungsgegenstand. So fordert denn die strikte Beschränkung auf „objektiv Meßbares" zwangsläufig den Verzicht auf die Erforschung von Phänomenen, die nur durch die Wiedergabe von Erlebnissen erfaßbar sind, und sie erzwingt die Konzentration auf äußeres Verhalten. Schon bald werden Behavioristen soweit gehen, die wissenschaftliche Relevanz subjektiver Phänomene überhaupt zu leugnen.
Thorndike wie Pawlow betonen ihre Ablehnung aller „mentalistischen" Konzeptionen;
d.h.
aller Konstrukte, die bis dahin der „geistigen", „psychischen" oder der
„Bewußstseinsebene"
zugeordnet wurden. Beide gehen damit von „monistichen" Kernannahmen aus, indem sie die
psychischen Prozesse als besondere Eigenschaften der lebenden Materie (Pawlow)
interpretieren. Pawlow wird damit zum Begründer einer „dialektisch-materialistischen
Psychologie" und erhält innerhalb des frisch an die Macht gelangten Sowjetsystems
(z.T. auch
wider Willen) die Rolle eines verehrten „Hofpsychologen" mit großen Privilegien.
Dagegen
gerät Thorndike zwischen die „Kampflinien" von Behavioristen und Gestaltpsychologen;
erstere werfen ihm vor, (z.B. mit dem Effektgesetz) veraltete teleologische Konzepte zu
vertreten, letztere kritisieren (z.B. im „Trial-and-error"-Prinzip), daß er die strukturellen
Gesichtspunkte des Lernprozesses vernachlässige. (Was Thorndike mehr trifft als der
Vorwurf der Behavioristen und ihn veranlaßt, das „Gesetz der
Zusammengehörigkeit"
einzuführen; vgl. Hilgard & Bower, 1973)
6.2 Die Gründung des Behaviorismus
durch Watson
6.2.1 John Watson: Behaviorist
John Broadus Watson wird 1878 als Sohn eines kleinen Farmers in einem Dorf in South Carolina geboren, wo er bis zu seinem Eintritt in die Universität lebt. Wie alle Farmerskinder verbringt er einen großen Teil seiner Freizeit mit körperlicher Arbeit - in der Kinderzeit wohl mehr als Pflicht, für den Erwachsenen wird daraus ein Vergnügen. (Diese praktische Orientierung gehört für Schwarz zu den Persönlichkeitseigenschaften, die viele Behavioristen gemeinsam haben; vgl. Schwartz, 1988; S. 49)
Watson wechselt nach dem Examen nach Chicago, wo er bei Dewey Philosophie studiert, was ihn aber nach eigenem Bekunden kaum „mitreißt":
„Ich nahm etwas von der Britischen Philosophenschule, hauptsächlich von Hume, ein bißchen von Locke, etwas von Hartley, gar nichts von Kant, und, seltsamerweise, das wenigste von John Dewey selber. Ich wußte nie, worüber er überhaupt redet, und zu meinem Unglück, ich weiß es bis heute nicht."
(Watson, 1936; S. 274; Übersetzung: G.S.)
Betrachtet man kurz die Systeme der angesprochenen Philosophen, dann erkennt man Watsons Vorliebe für empiristische Konzeptionen: Hume und Locke lehnen beide die später von Kant bevorzugte platonische Vorstellung von den „angeborenen Ideen" „a priori" ab und propagieren die Entstehung auch der komplexesten Formen allein auf der Basis von Erfahrung.
Überhaupt scheiden sich die „Geister" der Behavioristen von denen der meisten anderen Psychologen vor allem an dem (auch von dem Pragmatiker Dewey postulierten) Zusammenhang von Bewußtsein und äußerem Verhalten: Bewußtseinspsychologen, seien es nun Strukturalisten, Funktionalisten, Gestaltpsychologen oder Psychoanalytiker, glauben nämlich, daß „das Bewußtsein eine wirkliche ´Kraft´ (ist), etwas, das etwas tun kann, etwas, das einen physiologischen Prozeß in Gang setzen, kontrollieren oder abbrechen kann, wenn er bereits in Gang ist." (Watson, 1968, Original 1930; S. 288; Hervorhebungen im Original)
Diese Annahme ist für Behavioristen wie Watson kaum nachvollziehbar: „Niemand kann diese Ansicht aufrecht erhalten, es sei denn, er ignoriert die Physik und die Philosophiegeschichte." (a.a.O.). Und noch fast ein halbes Jahrhundert später fragt Skinner (rhetorisch): „Wie kann ein mentales Ereignis ein physikalisches verursachen oder dadurch verursacht werden?" (Skinner, 1974a; S. 10; Übersetzung: G.S.)
Das Annahmesystem „des Behavioristen" enthält somit zwei zentrale Grundpostulate:
1. Die grundsätzlich monistische Auffassung, auch geistige Prozesse seien aus keinem anderen „Stoff" (Skinner, 1974a) als das biologische Verhalten; also, negativ ausgedrückt, die Abneigung, „geistigen Prozessen" eigene Qualität und vor allem Autonomie zuzuschreiben.
2. Die (darauf beruhende) empiristische Kernannahme, Bewußtseinsinhalte und Gefühle (die keineswegs, wie häufig angenommen, prinzipiell geleugnet werden; vgl. Skinner, 1974a) verdanken ihre Existenz immer den elementareren Reiz-Reaktions-Verbindungen und sind damit abhängig von umgebungsgesteuerten Lernprozessen.
Auf den jungen Watson haben Physiologen wie Loeb und Donaldson, vor allem aber der Psychologe Angell großen Einfluß, der dann auch seine Promotion betreut. Watson untersucht drei Jahre lang die physiologischen Veränderungen im Zentralnervensystem von Albinoratten in Abhängigkeit von der Komplexität ihres Verhaltens und promoviert 1903 im Alter von 24 Jahren.
Seine Vorliebe gilt der Arbeit mit Tieren. Über die (meist introspektiven) Experimente der Psychologen mit Menschen äußert er sich sehr skeptisch:
„Ich wollte niemals menschliche Versuchpersonen verwenden. Ich selber haßte es stets, Versuchperson zu sein. Ich mochte diese dummen, künstlichen Instruktionen nicht. Es war mir unangenehm, und ich verhielt mich unnatürlich. Mit Tieren war ich vertraut. Ich fühlte, daß ich, wenn ich sie untersuchte, nahe an der Biologie war, mit beiden Beinen fest auf dem Boden. Mehr und mehr drängte sich mir der Gedanke auf: Kann ich nicht, wenn ich ihr Verhalten beobachte, dasselbe herausfinden, was die anderen Studenten finden, wenn sie ihre Beobachter einsetzen."
(Watson, 1936; S. 276; Übersetzung: G.S.)
1908 nimmt Watson eine Professur an der John-Hopkins-Universität in Baltimore
an. Er
untersucht Lernprozesse bei Ratten im Labyrinth und die Bedeutung einzelner
Sinnesleistungen. Als Universitätslehrer ist er weiterhin gezwungen, mangels
Alternative, die gängige
introspektive Psychologie zu unterrichten. Dieser Spagat zwischen seinen Forschungsarbeiten,
deren Grundrichtung erst von wenigen zeitgenössischen Psychologen geteilt wird
(Pawlow
und Bechterew sind im Westen noch weitgehend unbekannt), muß sich zu einer nagenden
Unzufriedenheit entwickelt haben, die sich in einer für Watson typischen Weise in einem
„Paukenschlag" entlädt.
6.2.2 „Psychologie, wie sie der Behaviorist sieht"
Bis 1912 in mehreren Anläufen verfaßt, erscheint 1913 in der Psychological Review Watsons erste programmatische Schrift des Behaviorismus: „Psychology as the Behaviorist views it" (Watson, 1913).
Der Behaviorismus ist neben der Psychoanalyse wohl das psychologische Paradigma mit der intensivsten Metareflexion. Noch viele „Programme des Behaviorismus" werden Watsons Präambel folgen: einige werden noch von ihm selbst verfaßt (vgl. z.B. Watson, 1919; 1930); dann folgen z.B. Tolman (1932), Spence (1948) und natürlich Skinner, der während seiner gesamten Forschungszeit immer wieder behavioristische Programmarbeit leistet (vgl. z.B. Skinner, 1938, 1974a, 1978, 1979). Skinner ist es dann möglicherweise auch, der das Ende der Vorherrschaft des Behaviorismus am deutlichsten spürt: In seinen „Reflections on Behaviorism and society" beginnt er die Auseinandersetzung mit dem heraufkommenden „Neuen" in einem langen Kapitel mit der (trotzigen) Überschrift: „Why I Am Not a Cognitive Psychologist". (Skinner, 1978). (Worin sich zeigt, daß auch Skinner „Behaviorist" eher als persönliche Identität versteht denn als eine Möglichkeit, Psychologie zu betreiben.)
Bleiben wir aber zunächst bei Watson im Jahre 1913 und der Präambel
seiner Streitschrift:
„Psychologie, wie sie der Behaviorist sieht, ist ein vollkommen objektiver, experimenteller Zweig der Naturwissenschaft. Ihr theoretisches Ziel ist die Vorhersage und Kontrolle von Verhalten. Introspektion spielt keine wesentliche Rolle in ihren Methoden, und auch der wissenschaftliche Wert ihrer Daten hängt nicht davon ab, inwieweit sie sich zu einer Interpretation in Bewußtseinsbegriffen eignen. Bei seinem Bemühen, ein einheitliches Schema der Reaktionen von Lebewesen zu gewinnen, erkennt der Behaviorist keine Trennungslinie zwischen Mensch und Tier an. Das Verhalten des Menschen in all seiner Feinheit und Komplexität macht nur einen Teil der behavioristischen Forschungen aus."
(Watson, 1968, Original 1913; S. 13)
Zur Konstruktion eines neuen Paradigmas ist neben einer positiven stets auch eine negative Heuristik notwendig:
Die negative Heuristik der frühen Behavioristen
Watson richtet sich zunächst gegen die ihn umgebende Mehrheit der akademischen Psychologie, und diese ist einerseits von James und Dewey beeinflußt, also „funktionalistisch", und andererseits von den Anhängern des „Strukturalisten" und Wundt-Schülers Titchener. Beide Richtungen vertreten, bis auf wenige Abweichler wie Thorndike oder Angell eine konsequente „Bewußtseinspsychologie", die alle Forschungsgegenstände daran mißt, ob sie Aufschluß über Bewußtseinszustände geben können:
„Unter dieser Annahme haben Verhaltensdaten (...) keinen Wert an sich. Sie haben nur insofern eine Bedeutung, als sie ein Licht auf Bewußtseinszustände werfen. Solche Daten müssen zum mindesten einen analogen oder indirekten Bezug zu den Bewußtseinsphänomenen aufweisen, um in den Bereich der Psychologie zu gehören." (a.a.O.)
Watson kritisiert einerseits die damit verbundene Einschränkung und Verkürzung des Untersuchungsgegenstandes, andererseits die vage Begrifflichkeit und schwache intersubjektive Übereinstimmung. Die unklare Begrifflichkeit der Theorien korrespondiert mit der Unzuverlässigkeit und Subjektivität der introspektiven Untersuchungsmethoden. Beobachter (die gleichzeitig die Versuchspersonen sind!) müssen eine lange Schulung durchmachen, bis es ihnen endlich gelingt, bei sich selber jene feinen Empfindungsunterschiede wahrzunehmen, die die Versuchshypothesen Ihnen abverlangen. Diese Versuchstechniken müssen den Argwohn des „exakten" (Natur-)Wissenschaftlers wecken, denn es fällt unter diesen Bedingungen stets leicht, Versuchshypothesen gegen „unpassende" Versuchsergebnisse zu immunisieren:
„Wenn es dir nicht gelingt, meine Ergebnisse zu reproduzieren, liegt das nicht an einem
Fehler
in deiner Apparatur oder der Kontrolle deines Reizes, sondern daran, daß deine
Introspektion
ungeübt ist. Nicht die experimentelle Versuchsanlage wird kritisiert, sondern der
Beobachter."
(a.a.O.; S. 17)
Die positive Heuristik des Watsonschen Behaviorismus:
Nun aber zur entsprechenden positiven Heuristik, die sich sowohl indirekt aus den oben beschriebenen Ablehnungen, wie auch direkt aus den philosophischen Kernannahmen ergibt. Sie läßt sich in folgenden Punkten zusammenfassen (vgl. watson, 1913):
• Ausgangspunkt der Psychologie sollte die „beobachtbare Tatsache" sein, daß Organismen, Menschen wie Tiere, sich mit Hilfe einer ererbten und gewohnheitsmäßigen Ausstattung an ihre Umwelt anpassen.
• Bei allen Organismen sind es stets Reize, die sie zu Reaktionen veranlassen (und nicht z.B. Bewußtseinsakte).
• Ziel eines vollständigen Systems der Psychologie muß es sein, die Reaktion vorauszusagen, wenn die Reize bekannt sind.
• Dies ist nur möglich, wenn die Gesetzmäßigkeiten des Zusammenhangs von Reizen und Reaktionen (Assoziationen) naturwissenschaftlich-experimentell, d.h. auf quantitativen Daten beruhend, objektiv und reproduzierbar erforscht werden.
• Sind solche Gesetzmäßigkeiten bekannt, so wird eine Kontrolle des Organismus möglich.
• Alle sogenannten „höheren Denkprozesse" (higher mental processes) sind auf
elementare
Reaktionen zurückzuführen, denn sie beruhen auf elementaren,
abgeschwächten Nachvollzügen
des ursprünglichen muskulären Akts. Dies gilt auch für die Sprache.
Denkprozesse werden
damit ebenso mechanisch wie Gewohnheiten.
6.2.3 Die Weiterentwicklung der behavioristischen Programmatik
Die Ausführungen Watsons sind bei ihrer Veröffentlichung kaum mehr als ein spekulatives Programm. Die konkreten Forschungen, auf die er sich bezieht, stammen alle aus dem Kreis amerikanischer „Tierpsychologen", was Watson zu der ehrlichen Aussage nötigt:
„Wir müssen offen zugeben, daß die Fakten, die wir in ausgedehnten Untersuchungen über die tierischen Sinne zusammengetragen haben, so wichtig sie auch für uns sein mögen, nur sehr wenig zu einer Theorie der menschlichen Sinnesprozesse beigetragen haben und auch keine neuen Gesichtspunkte für ein experimentelles Vorgehen nahegelegt haben. Auch unsere ungeheuer zahlreichen Experimente über das Lernen haben wenig zu einer Humanpsychologie beigetragen." (Watson, 1968, Original 1913; S. 14)
Eine Rezeption und Integration der russischen Reflexologie, insbesondere Bechterews und Pawlows, steht zu diesem Zeitpunkt noch aus. Noch 1914 scheint Watson die Bedeutung der Pawlowschen Experimente gründlich zu verkennen, denn er ist der Ansicht, daß sich dessen Methodik kaum für die Analyse höherer, insbesondere motorischer Fähigkeiten eigne (vgl. Amsel & Rashotte,1984). Erst mit seiner Rede von 1915, als Präsident der APA, mit dem Titel „The Place of the Conditioned Reflex in Psychology" (vgl. Watson, 1916), ändert sich seine Einschätzung über die bedingten Reflexe, und er würdigt die Erkenntnisse Bechterews, der sich experimentell auf motorische Lernprozesse konzentriert; allerdings wiederum verbunden mit einer negativen Einschätzung Pawlows.
1919 endlich (aus der „Ansicht" [view] des Behavioristen ist inzwischen ein „Standpunkt" geworden: „Psychology from the standpoint of a behaviorist"; Watson, 1919), findet die Arbeit Pawlows seine volle Aufmerksamkeit. Nun scheint er erkannt zu haben, daß die Speichelkonditionierung prototypisch sein kann für das Erlernen einer großen Zahl von elementaren emotionalen Reaktionen.
Der Entwurf seines berühmtesten Experiments im selben Jahr zeigt, daß er
nun versucht, die
bisherigen Mängel der Forschungspraxis zu korrigieren: Watson „verwendet"
menschliche
„Subjekte" und nähert sich so einer behavioristischen „Humanpsychologie", und er
versucht,
Pawlows und Bechterews Ansatz in die amerikanische Tradition der Erforschung von
(motorisch definiertem) „Verhalten" zu überführen.
6.2.4 „Der Kleine Albert" - Ein fragwürdiges „klassisches Musterbeispiel" und sein Mythos
Ende 1919 führt Watson zusammen mit Rosalie Rayner jenes berühmte Experiment durch, in dem der Nachweis geführt werden soll, daß emotionale Reaktionen konditionierbar sind (vgl. Watson & Rayner, 1920). Seitdem gibt es kaum ein Lehrbuch der Allgemeinen Psychologie, der Entwicklungs- und der Klinischen Psychologie, in dem nicht wenigstens eine kurze Darstellung dieses Experiments zu finden wäre.
Dabei ist der „Kleine Albert" als paradigmatisches Musterbeispiel kaum zu gebrauchen: Es werden in diesem Experiment die elementarsten methodologischen Grundforderungen des Behaviorismus verletzt (Quantifizierung und systematische Kontrolle der Variablen). Bei genauerem Hinsehen ist es sogar fraglich, ob es am Ende überhaupt zu einer Konditionierung emotionaler Reaktionen gekommen ist (weshalb die Abschlußuntersuchungen in allen späteren Darstellungen des Experiments, auch durch Watson selber, verschwiegen werden!).
Die besondere Bedeutung des „kleinen Albert" in der Rezeptionsgeschichte des Behaviorismus scheint denn auch eher in seiner programmatischen, ja propagandistischen Wirkung zu liegen: Es unterstreicht die „Alltagsrelevanz" behavioristischer Untersuchungen und Theoriebildung und gibt einen Eindruck von den „intendierten Anwendungen" des Behaviorismus (über die üblichen Tierexperimente hinaus). Außerdem, und vor allem, eignet es sich aber als hervorragendes „antipsychoanlytisches Kampfinstrument".
(1) Der Verlauf des Experiments
Die folgende Zusammenfassung ist, aus Gründen, die weiter unten erörtert werden, in allen Details möglichst eng an der ersten Darstellung des Experiments (vgl. Watson & Rayner, 1920) orientiert:
Die Versuchsperson Albert B., der Sohn einer Amme am Harriet-Lane-Hospital, ist zu Beginn des Experiments 9 Monate alt; er wird als gesund, gleichmütig und unemotional beschrieben.
In einer Vorstudie wird Albert daraufhin untersucht, ob er Furcht zeigt vor lebenden Tieren, wie z.B. einer weißen Ratte, einem Kaninchen, einem Hund, einem Affen, und vor verschiedenen Objekten wie Baumwolle, menschlichen Masken mit und ohne Haaren, brennendem Zeitungspapier. Es zeigt sich, daß dies nicht der Fall ist, daß Albert stets neugierig danach greift, wie bei anderen unbekannten Gegenständen.
Andererseits kann man eine starke Furchtreaktion („fear response") beobachten, wenn man hinter ihm mit einem Hammer auf eine ca. 90 cm lange und 1,9 cm dicke Eisenstange schlägt. Dies geschieht nach folgender Prozedur: Einer der beiden Experimentatoren (Rosalie Rayner) veranlaßt Albert, seinen Kopf zu drehen und ihre Hand zu fixieren, während der andere (Watson) hinter dem Kind steht und fest auf die Eisenstange schlägt.
Zwei Monate später beginnt dann das eigentliche Experiment, dessen zeitlichen Verlauf Watson und Rayner durch Altersangaben von Albert dokumentieren:
Es findet in einem kleinen Raum mit hellem, künstlichem Licht statt. Auf einem
großen,
niedrigen Tisch liegt eine Matratze, auf der jeweils Albert und die Experimentatoren sitzen.
Das gesamte Experiment wird mit einer Filmkamera aufgezeichnet. Auf den Photos, die aus
diesem Film stammen (vgl. z.B. Schwartz, 1988; S. 55), sieht man stets Rayner links
neben
Albert auf der Matratze sitzen, während Watson die verschiedenen Manipulationen von
rechts
vornimmt.
1. Aufbau konditionierter emotionaler Reaktionen („conditioned emotional responses")
11 Monate 3 Tage:
- 1. Kombinierte Reizung („joint stimulation"): Die weiße Ratte wird plötzlich aus dem Korb genommen. Albert streckt die Hand nach ihr aus. Als er das Tier berühren will, wird unmittelbar hinter seinem Kopf auf die Stange geschlagen. Albert schreckt auf, fällt vornüber, vergräbt sein Gesicht, weint aber nicht.
- 2. Kombinierte Reizung: Als er wieder nach der Ratte greifen will, wird die Stange noch einmal geschlagen; er fährt wieder auf, fällt vornüber und beginnt zu wimmern.
11 Monate 10 Tage:
- 1. Reaktionstest mit Ratte: Die Ratte wird „plötzlich dargeboten", ohne Lärm. Albert fixiert sie; zeigt zunächst keine Neigung, nach ihr zu greifen; erst als sie näher herangebracht wird, zaghafte Greifbewegungen mit der rechten Hand; als die Ratte mit der Nase seine Hand berührt, zieht er die Hand zurück; nun beginnt er, den linken Zeigefinger gegen ihren Kopf auszustrecken, zieht ihn aber, bevor es zur Berührung kommt, plötzlich weg.
Watson und Rayners Schlußfolgerung: „Man sieht, daß die beiden kombinierten Reizungen der vergangenen Woche nicht ohne Wirkung geblieben sind." (a.a.O.; S. 4; Übers.: G.S.)
- Reaktionstest mit Bauklötzen: Albert beginnt, damit zu spielen.
- Es folgen nun drei kombinierte Reizungen mit Ratte und Geräusch.
- 2. Reaktionstest mit Ratte: Albert verzieht das Gesicht, wimmert, dreht den Körper abrupt nach links.
- Weitere zwei kombinierte Reizungen mit Ratte und Geräusch.
- 3. Reaktionstest mit Ratte: Albert schreit, dreht sich nach links, fällt vornüber, krabbelt so schnell er kann auf den Rand der Matratze zu.
Hierzu Watson und Rayner: „Das war der überzeugende Fall einer vollständig konditionierten Furchtreaktion ... ." ( a.a.O.; S. 5; Übers.: G.S.)
2. Überprüfung der Generalisierung („transfer")
11 Monate 15 Tage:
- Reaktionstest mit Bauklötzen: Albert spielt wie üblich.
- 4. und 5. Reaktionstest mit Ratte (unterbrochen durch eine Spielepisode mit Bauklötzen): Albert wimmert, zieht die rechte Hand zurück, krabbelt davon.
Zwischen den nächsten Reaktionstests liegen stets wieder Spielepisoden mit Bauklötzen:
- Reaktionstest mit Kaninchen: Albert lehnt sich zurück, wimmert, bricht in Tränen aus, vergräbt sein Gesicht, krabbelt davon.
- Reaktionstest mit Hund: schwächere Reaktion als auf Kaninchen; Albert schreckt zurück; als Hund näherkommt, versucht Albert, auf alle Viere zu kommen, schreit aber nicht; als Albert flach auf dem Boden liegt, wird der Hund näher an sein Gesicht gebracht: Albert richtet sich auf, fällt um, wendet seinen Kopf und beginnt zu schreien.
- Reaktionstest mit Pelzmantel aus Seehundfell: Albert zieht sich auf die linke Seite zurück und wird mürrisch; als man den Mantel ganz nah zu ihm hinlegt, dreht er sich um, beginnt zu schreien und krabbelt davon.
- Reaktionstest mit Watte in Papierpacket (Watte kommt an einem Ende heraus) wird auf seine Füße gelegt: stößt sie fort; wenn man seine Hände auf die Watte legt, zieht er sie zurück; beginnt dann mit dem Papier zu spielen, aber ohne die Watte zu berühren; bis zum Ende der Stunde hat er die Angst vor der Watte weitgehend verloren.
- Reaktionstest mit Watsons Haaren (Watson beugt sich zu Albert herab): Albert reagiert „completely negative".
- Reaktionstest mit Haaren der Assistentinnen: Albert greift sofort danach und beginnt damit zu spielen.
- Reaktionstest mit bärtiger Nikolausmaske durch Watson: heftige „negative Reaktion".
11 Monate 20 Tage:
- Reaktionstest mit Bauklötzen: Albert spielt wie üblich.
- Reaktionstest mit Ratte: Albert zieht sich zurück, schreit nicht.
- 8. kombinierte Reizung: Ratte - Geräusch
- Reaktionstest mit Ratte: stärkere Furchtreaktion als vorher, aber kein Schreien.
- Reaktionstest mit Kaninchen: Albert lehnt sich weit nach links, fällt aber nicht um; wimmert, jedoch nicht so stark wie in früheren Durchgängen.
Raumwechsel in einen größeren Raum mit Tageslicht.
- Kombinierte Reizungen mit Ratte, Kaninchen und Hund; unvorhergesehen beginnt der Hund, Albert laut anzubellen; Albert ist sehr erschrocken.
Schlußfolgerung:
„Nach den obigen Ergebnissen scheint es, daß emotionale Generalisierungen tatsächlich stattfinden. Weiter sieht es so aus, daß die Anzahl der Generalisierungen, die aus einer experimentell hervorgerufenen Reaktion entstehen, wohl sehr groß ist. In unseren Experimenten hatten wir aber keine Möglichkeit, die vollständige Zahl der Generalisierungen zu untersuchen, die möglicherweise vorkommen können." ( a.a.O.; S. 10; Übers.: G.S.)
3. Die Dauerhaftigkeit konditionierter Reaktionen
12 Monate 20 Tage:
Vier Wochen später, Alberts Mutter hat ankündigt, daß sie ihn aus der Klinik nehmen werde, findet die nächste und letzte experimentelle Sitzung statt. Watson und Rayner testen noch einmal die Ratte und alle generalisierten Reize. Albert zeigt bei ihnen allen Furcht, wechselt allerdings bei Seehundmantel und Kaninchen zwischen Annäherung und Rückzug. Die Reaktion auf die Ratte selber wird wie folgt beschrieben:
„Er erlaubte der Ratte, auf ihn zu zu krabbeln, ohne daß er zurückzuckte.
Er saß still und
fixierte die Ratte gespannt. Die Ratte berührte seine Hand. Albert zog sie sofort
zurück, lehnte
sich dann so weit wie möglich zurück, schrie aber nicht. Als die Ratte auf seinen
Arm gesetzt
wurde, wich er zurück, begann ärgerlich zu werden und neigte den Kopf. Er
erlaubte dann der
Ratte, auf seine Brust zu krabbeln. Zunächst wurde er wieder etwas ärgerlich und
bedeckte
dann seine Augen mit beiden Händen."
(a.a.O.; S. 11 Übers.: G.S.)
Daraus schließen Watson und Rayner: „Diese Experimente zeigen, daß direkt konditionierte emotionale Reaktionen, ebenso wie solche, die durch Generalisierung entstanden sind, länger als einen Monat anhalten, wenn auch mit einem gewissen Verlust an Intensität der Reaktion. Unserer Ansicht nach bleiben sie ein ganzes Leben lang bestehen und verändern die Persönlichkeit."
( a.a.O.; S. 12; Übers.: G.S.)
(2) Einige Einwände
Betrachtet man die weitreichenden Schlüsse, die Watson & Rayner aus diesem Experiment ziehen, und dazu die intensive Rezeption in den letzten inzwischen 75 Jahren (natürlich enthält auch „der neue Zimbardo" wieder eine Darstellung; vgl. Zimbardo, 1992), so kann dies auf dem Hintergrund der mehr als bescheidenen methodischen Qualität des Albert-Experiments nur verwundern:
Eine Versuchsperson hat einmal genau einen konditionierten Reflex gelernt. Hat sie wirklich etwas gelernt? Und was genau wurde in diesem Experiment „bewiesen"? Wir werden gleich sehen, daß dies bei diesem Versuchsdesign kaum zu beantworten ist; und zwar vor allem aus vier Gründen:
1. Die fehlende Operationalisierung der Variablen
Die zu konditionierende Reaktion „Furcht" ist kaum operationalisiert
und wird an äußerst
vagen Indizien abgelesen („verzieht das Gesicht", „wimmert", „fällt vorn über");
damit ist die
Feststellung zentraler Variablen von subjektiven Interpretationen abhängig. (Von
Quantifizierung kann natürlich keine Rede sein!)
2. Die mangelnde Kontrolle der Variablen
Das „realitätsnahe" Versuchsdesign hat zweifellos die Popularität des Experiments begünstigt und hat es auch für konsequente „Empiriker" wie Eysenck oder Seligman attraktiv gemacht (vgl. Eysenck, 1985, Seligman, 1971). Beginnt man aber, sich mit seinen (in der Veröffentlichung beschriebenen!) Details zu befassen, so bleibt bald von seiner Überzeugungkraft kaum noch etwas übrig:
Eine Reihe von Indizien (seine Beschreibung der Lärmerzeugung (s.o.) und die Photos) legen nahe, daß es wohl immer Watson selber war, der die Eisenstange geschlagen und die Gegenstände und Tiere dargeboten hat, während Rayner neben Albert gesessen hat. Im Experiment zeigt sich nun, daß Albert mit den Haaren Watsons nicht spielen möchte, wohl aber mit denen zweier anderer Personen (vermutlich ist eine davon Rayner, die andere Alberts Mutter). Dies legt die Vermutung nahe, daß die „Person Watson" zum „bedingten Reiz" wurde („der, der es knallen läßt").
Nun ist aber die Wirkung der „neutralen" Testobjekte, die, wie angenommen wird, eine generalisierte Furcht auslösen soll, kaum noch von der Wirkung der darbietenden Person Watson zu trennen. Die Generalisierungshypothese beginnt zu wanken.
3. Die „Zielgerichtetheit" der „Fakten"-Interpretation
Die tatsächlich gemachten und dargestellten Beobachtungen werden äußerst selektiv im Sinne der Versuchshypothese interpretiert, widersprüchliche „Fakten" werden ignoriert:
• Den hier naheliegenden Interpretationsversuch, daß durch das Eisenstangen-Schlagen die „Person Watson" selber ein konditionierter Reiz geworden sein könnte (und nicht die Haare), hat Watson gar nicht erst gewagt. Dies hätte sowohl das Durcheinander bei der Reizkontrolle offengelegt, als auch die für einen Behavioristen sehr unangenehme Frage aufgeworfen, wie denn Albert dies hätte lernen sollen, wo er doch Watson gar nicht „sehen" konnte. (Hier sei nur ein kurzer Hinweis auf die schon recht gut ausgeprägte „Objektpermanenz" 11-monatiger Kinder eingeschoben!) Und noch schwieriger: Warum lernt Albert eine konditionierte Reaktion auf den im Moment des Lärmmachens unsichtbaren Watson, nicht jedoch auf die sichtbar vor ihm sitzende Rosalie Rayner? - Oder ist vielleicht die „Abneigung" gegenüber dem „Fremden" Watson gar nicht in diesem Experiment konditioniert worden?
• Für die Interpretation als „experimentelle Phobie" (was von Anfang an Watsons Absicht ist) sind die sehr schwachen Reaktionen in der letzten Phase des Experiments äußerst unangenehm. Albert scheint hier, nach mindestens 9 „kombinierten Reizungen", in bezug auf die Ratte immer noch höchstens zwischen Neugier und leichtem Unbehagen hin und her zu schwanken (vgl. das Zitat auf S. ). Ist das der Grund, warum die Beschreibung dieser Phase in allen weiteren Darstellungen durch Watson ausgelassen wird (vgl. z.B. Watson, 1930) ?
Viele dieser Fragen haben sich Watsons Zeitgenossen sicher auch gestellt, und mehrere haben versucht, ihnen durch eine Replikation des Experiments nachzugehen. Aber weder intensive Beobachtungen natürlicher Situationen (vgl. Valentine, 1930) haben einen weiteren Nachweis der Angstkonditionierung durch Lärm erbringen können, noch ist es Bregman (1934) in analogen Experimenten gelungen, auch nur bei einem von 15 untersuchten Kindern durch Lärm eine bedingte Furcht zu induzieren. (Vgl. dazu Harris, 1979)
Warum wird aber ein solches Experiment in der Psychologiegeschichte immer wieder zitiert und dargestellt, das in so gravierender Weise die Grundsätze der „naturwissenschaftlich"-empirischen Psychologie verletzt, für deren Gründung es schließlich stehen soll? Einige Anhaltspunkte dafür ergeben sich, wenn man seine Rezeption durch die Behavioristen selber etwas näher betrachtet.
(3) Der Mythos des Musterbeispiels innerhalb der scientific community
1. Watsons eigene Interpretation und die Kampfansage an die Psychoanalyse
„Unsere Aufzeichnungen liefern also einen überzeugenden Nachweis, für die Ausbreitung und die Übertragung der Reaktion." (Watson, 1968, Original 1930; S. 174)
Darüber hinaus glaubt er, sein Experiment sei auch von grundsätzlicher methodologischer Bedeutung, und von nun an könnten die Pawlowschen Experimente als Prototyp gelten für die experimentelle Untersuchung von menschlichem emotionalen Verhalten:
„Wir haben in diesen Übertragungen einen weiteren Beweis dafür, daß konditionierte Gefühlsreaktionen mit anderen konditionierten Reaktionen Ähnlichkeit haben." (a.a.O.)
In späteren Darstellungen der eigenen Arbeit von 1920 werden die Interpretationen Watsons immer kühner. Während Watson und Rayner im Original noch betonen, über Art und Zahl der Objekte mit generalisierter Wirkung keine Aussage machen zu können (vgl. Watson & Rayner, 1920; S. 10), behauptet Watson 10 Jahre später, es sei zu einer Generalisierung auf „alle behaarten Objekte" gekommen (vgl. Watson, 1930).
Insgesamt glaubt Watson, in dieser Methodik die „Gans" gefunden zu haben, die „goldene Eier legt" (a.a.O.; S.172), und er weitet seine Argumentation aus bis hin zur interparadigmatischen Polemik:
Spätestens seit dem Albert-Experiment nimmt er vermehrt die Psychoanalyse ins Visier. Er glaubt, nun einen Schlüssel dafür gefunden zu haben, die äußerst komplexen Erklärungen der Psychoanalytiker zur Entstehung von Phobien zu „widerlegen". Am Ende ihrer Veröffentlichung nehmen sich Watson und Rayner (1920) die Freudsche Auffassung von der Triebentwicklung auf der alleinigen Basis des Sexualtriebes vor. Das Experiment, so führen sie aus, habe gezeigt, daß die Furcht als eine ursprüngliche, angeborene Emotion aufgefaßt werden muß, die unabhängig von sexuellen Prozessen ist:
„Furcht ist in ihrem Einfluß auf die Persönlichkeit ein primärer Faktor wie Liebe. Furcht erhält nicht ihre Kraft in irgendeiner abgeleiteten Form von der Liebe. Sie gehört zur originären und angeborenen Natur des Menschen." (a.a.O.; S. 14; Übers: G.S.)
Fest überzeugt von der Überlegenheit ihrer Erklärungen, polemisieren sie am Schluß ihrer Veröffentlichung über die tiefenpsychologische Interpretationsweise:
„In 20 Jahren werden die Freudianer, vorausgesetzt, sie ändern ihre Hypothesen nicht, bei der Analyse von Alberts Angst vor Pelzmänteln - angenommen er käme in diesem Alter in die Analyse - aus ihm vielleicht einen Traum herauskitzeln, der gemäß ihrer Analyse zeigen wird, daß Albert im Alter von drei Jahren versucht hat, mit den Schamhaaren seiner Mutter zu spielen, wofür er heftig bestraft worden ist."
(Watson & Rayner, 1920; Übers: G.S.)
Das Experiment mit dem „Kleinen Albert" ist nun das Musterbeispiel
der behavioristischen
Humanpsychologie: Es manifestiert die behavioristischen Kernannahmen und stiftet die
Identität des neuen Paradigmas. Und vor allem: es grenzt ab nach außen. Seine
Validität steht
damit völlig außer Frage.
2. Der „Kleine Albert" in späteren Veröffentlichungen
Eine große Zahl späterer Rezipienten dieses Experiments bedient sich nun kritiklos der Watsonschen Argumentation und späteren Verallgemeinerungen. Dies tun auch (und gerade) solche Psychologen, die in ihrer Gesamtargumentation so großen Wert auf empirisch-methodische Exaktheit legen und diese gegen ihre Kontrahenten aus anderen Paradigmen argumentativ ins Feld führen (vgl. hierzu die Untersuchung psychologischer Literatur durch Harris, 1979).
Bei der Rezeption des Experiments entsteht der Mythos eines Standardexperiments, dessen Details in der Rezeptionsgeschichte sukzessive immer glatter, unproblematischer und dadurch beeindruckender dargestellt werden; hier einige Beispiele aus deutschsprachigen Lehrbüchern der Psychologie:
- Es wird keine Eisenstange geschlagen, sondern ein „Gong". (Zimbardo, 1992; S. 236)
- Die weiße Ratte wird zu Alberts „Spielkamerad" (Ruch & Zimbardo, 1975; S. 134)
- Das später furchtauslösende Kaninchen ist ein „freundlicher Hase" (Ruch & Zimbardo, 1975; S. 134)
- Die Furcht wird übertragen (generalisiert) auf:
• die „Reizdimension ´Pelz oder pelzähnlich´ „ (Ruch & Zimbardo, 1975; S. 134)
• „andere Objekte, die einer Ratte irgendwie ähnlich sehen" (Pervin, 1993; S. 354)
• „andere pelzige Objekte" (Zimbardo, 1992; S. 236)
• „rattenähnliche, pelzartige Tiere" (Bredenkamp & Bredenkamp, 1974)
In einer Analyse der Darstellungen dieses Experiments in englischsprachigen Standardwerken kommt Harris (1979) zu dem Schluß, daß die stetigen Detail-Metamorphosen in der nachfolgenden Rezeption u.a. folgende Funktionen haben:
1. Man möchte die ethische Fragwürdigkeit des Versuchsdesigns mildern. (s.o.: „Gong" statt „Eisenstange")
2. Man möchte den „Effekt" dramatisieren und pointierter darstellen (s.o.: „Spielkamerad", „freundlicher Hase"); wobei man gleichzeitig alle Einzelheiten verschweigt, die die Klarheit des Ergebnisses trüben können (z.B. die schwache Reaktion Alberts nach einem Monat).
3. Man möchte suggerieren, wie schon Watson in seinen eigenen späteren Zusammenfassungen, die Reizgeneralisierung beziehe sich auf eine klar definierte Merkmalsdimension, womit ein nachträgliches Anpassen der Daten an die Theorie erreicht wird.
Auf dem Hintergrund des Originalexperiments läßt sich kaum auf eine eindimensionale Generalisierung schließen; dies mindestens aus zwei Gründen:
Vergleicht man die „neutralen" Reize, auf die Albert Furcht zeigt (Kaninchen, Hund, Wattepaket, Seehundmantel, Nikolausmaske, Watsons Haare), mit denen, wo er dies nicht tut (Haare der Assistentinnen, Bauklötze), so läßt sich zu allen vorgetragenen Hypothesen (z.B. „Haariges", „behaarte Lebewesen", „Pelzähnliches") schon innerhalb dieses Experiments immer mindestens ein Gegenbeispiel finden.
Auf die Generalisierung einer einzigen Merkmalsdimension läßt sich nur schließen, wenn es sich um eine selektive Reaktion handelt. Da es außer Alberts Bauklötzen keine Reizalternativen gibt, ist dieses „Versuchsergebnis" durch das Design erzwungen; die postulierte „Reizgeneralisierung" auf ein Merkmal ist eine „self-fulfilling prophecy" des experimentellen Designs.
So wird ein Standardexperiment des Behaviorismus, ein „paradigmatisches Musterbeispiel", allmählich zum Mythos. Und es eignet sich immer mehr zum interparadigmatischen „Kampfinstrument":
Noch 1985 ist Eysenck davon überzeugt, daß
„... Watsons Experimente mit dem kleinen Albert (...) zeigen, daß durch einen einfachen Konditionierungsprozeß phobische Ängste erzeugt werden können und diese für lange Zeit bestehen bleiben." (Eysenck, 1985; S. 119)
Wenn auch die Mühe einer methodologischen Kritik von Seiten der Psychoanalyse kaum zu erwarten ist (von hier kommen lediglich ethische Einwände und Argumente gegen die lerntheoretische Auffassung von „Phobien" und deren Therapie), so hätte man sie „von innerhalb" des Behaviorismus doch erwarten können. Allerdings hätte man sich dann eines der „schlagendsten" historischen Argumente beraubt, und der Möglichkeit, den „gesunden Menschenverstand" auf die eigene Seite zu bringen.
Eysenck „gesteht" dieses Motiv (wider Willen):
„Jedoch fügen sich die Fakten bemerkenswert gut zusammen, und zumindest wird uns hier eine alternative Theorie geliefert, die vielen Leuten plausibler klingen dürfte als die ursprünglich von Freud entwickelte." (Eysenck, 1985; S. 121)
So bleibt es denn dabei, daß „der ewige Kampf zwischen den Behavioristen (...) und einer mannigfachen Gegnerschaft, darunter Psychoanalytiker, viele kognitive Psychologen ... und andere mehr" (a.a.O.; S. 212) ganz wesentlich mit der „Albert-Argumentation" bestritten wird.
6.3 Vier behavioristische Hauptströmungen
Nachdem im letzten Abschnitt ausführlicher die Rede war von der (von außen induzierten) motivationalen und emotionalen Dynamik bei der Entwicklung des neuen Paradigmas, soll nun wieder der Akzent stärker auf die wissenschaftlich-rationalen Aspekte des Entwicklungsprozesses des Behaviorismus gelegt werden. Auch hier ist nicht die Vollständigkeit des Überblicks angestrebt, sondern der exemplarische Einblick.
Es soll gezeigt werden, welche grundsätzlichen Auseinandersetzungen innerhalb des Behaviorismus stattgefunden haben, und an welchen Auffassungsunterschieden diese sich entzündet haben.
Watson und seine frühen Anhänger (z.B. Edwin B. Holt, Walter S. Hunter, Mary C. Jones, Albert P. Weiss) haben sich häufig damit zufrieden gegeben, auf einer relativ schwachen empirischen Basis relativ weiträumige Schlüsse zu ziehen (vgl. Marx & Hillix, 1979). Dabei sind die Schwächen ihrer Arbeiten sowohl methodologischer (s.o. Watsons „Kleinen Albert") als auch theoretischer Natur, und es bedarf auf beiden Gebieten einer Verfeinerung und Vertiefung, um wenigstens Teile des von Watson so optimistisch formulierten behavioristischen Programms einzulösen.
Seit den Experimenten von Thorndike und Pawlow zu Beginn des Jahrhunderts wird gerade in den USA eine riesige Zahl von experimentellen Arbeiten durchgeführt, mit ganz unterschiedlichen Fragestellungen, von denen aber die meisten dem „Tier-im-Kasten"-Schema folgen: Tiere, Tauben, Katzen, sehr häufig Ratten, werden dabei beobachtet, wie sie sich unter kontrollierten und manipulierten Bedingungen in einem begrenzten Raum im Laboratorium („Problemkäfig", Labyrinth, „Skinner-Box" usw.) verhalten. Da solche Experimente stets unter relativ begrenzten Fragestellungen gemacht werden, sammelt sich mit der Zeit eine große Zahl von Datenmaterial an, ohne daß dieses zunächst in größeren theoretischen Zusammenhängen systematisiert würde.
Am Anfang der 30er Jahre scheint die Zeit endlich reif für eine systematische Präzisierung der Watsonschen Position, für eine theoretische Integration der „Vor-Behavioristen" Pawlow und Thorndike, also insgesamt für die ersten großen Entwürfe behavioristischer Theorien.
Die ersten vier großen Systeme des Behaviorismus entstehen
beinahe gleichzeitig. Es sind dies
die Arbeiten von Guthrie, Hull, Skinner, Tolman und ihrer jeweiligen Schüler und
Anhänger.
6.3.1 Die grundsätzliche Reiz-Reaktions-Problematik des Behaviorismus
Vorbereitet durch den Funktionalismus der Jahrhundertwende, insbesondere aber seit der Rezeption von Pawlows Arbeiten, besteht bei einer großen Zahl amerikanischer Psychologen Konsens darin, daß der Zusammenhang zwischen „Reiz" (stimulus) und „Reaktion" (response) die zu untersuchende Grundeinheit der Psychologie sein soll. Alle psychologischen Gesetzmäßigkeiten sind in diesen Grundeinheiten zu formulieren und durch sie zu erforschen. (Vgl. z.B. Kimble, 1967)
Was auf den ersten Blick so einfach klingt, stellt sich bei genauerer Betrachtung als äußerst komplexe Problematik heraus, mit erheblichen erkenntnis- und wissenschafttheoretischen „Fallen".
(1) Das Reiz-Reaktions-Schema als reduzierendes Modell
Schließen wir uns einmal der behavioristischen Auffassung an und betrachten (ausschließlich) das „offene" Verhalten eines Organismus und die umweltbedingten äußeren Einwirkungen und lassen in Anlehnung an eine Vielzahl behavioristischer Experimente in Gedanken eine Ratte durch ein Labyrinth laufen:
- Wir sehen zunächst, wie Dewey (1896) betont, überhaupt keinen diskontinuierlichen Vorgang, sondern eine kontinuierliche Folge von Aktivitäten des Versuchstiers.
- Versetzen wir uns nun in die Lage der Ratte (was Behavioristen unglücklicherweise nicht gestattet ist!), so kommen wir leicht zu dem Schluß, daß sich auch für sie die „Reizsituation" kontinuierlich verändert, und dies aufgrund ihrer eigenen Aktivitäten: Während sie läuft, wenn sie stehen bleibt, wenn sie sich umsieht oder zu schnuppern beginnt, ständig ändern sich die physikalischen Gegebenheiten, die auf sie einwirken.
- Nun muß man aber weiter annehmen (was auch viele Behavioristen tun), daß sie natürlich ebenfalls ihre eigenen Bewegungen und noch eine Reihe weiterer Veränderungen in ihrem Körperinneren (propriozeptiv) wahrnimmt, so daß alle Reaktionen gleichzeitig auch neue Reize sind.
Insgesamt ergibt sich also ein äußerst komplexes Bild von kontinuierlich sich verändernden uns stetig miteinander interagierenden Aktivitäten und Sinneseindrücken.
Welche impliziten Annahmen, vor allem welche Einschränkungen macht man aber, wenn man, wie die Behavioristen, davon ausgeht, Verhalten sei in Reiz-Reaktions-Einheiten zu beschreiben und zu erforschen?
1. Man unterscheidet strikt zwischen afferenten („Stimuli") und efferenten Phänomenen („Reaktionen") und zerbricht damit die unserer „naiven" Erfahrung so selbstverständliche Einheit von der senso-motorischen Ganzheit des Verhaltens.
2. Man entscheidet sich, nur noch solche Reize und Reaktionen zu betrachten, die als zwei verschiedene, sukzessive, nacheinander eintretende Ereignisse interpretierbar sind.
3. Man hat sich somit entschieden, allein solche Reize und Reaktionen zu betrachten, die sinnvoll in einer einseitigen, diskreten Ursache-Wirkungs-Beziehung zu interpretieren sind (und nicht z.B. in einer stetigen Wechselwirkung).
Bei der grundlegenden S-R-Hypothese des Behaviorismus handelt es sich also nicht, wie Skinner betont, um eine offensichtliche „Realität" (vgl. Skinner, 1979), sondern um ein stark reduziertes Modell.
(Problematisch ist dies allerdings nur für das naiv-realistische Selbstverständnis mancher Behavioristen, denn schließlich wissen wir seit Popper, daß es aus erkenntnistheoretischer Sicht keineswegs ehrenrührig, sondern sogar unvermeidlich ist, nicht mit der Realität, sondern mit einem Modell der Realität zu arbeiten.)
(2) Das Dilemma zwischen engen und weiten Definitionen von Reiz und
Reaktion
Folgen wir nun den behavioristischen Grundsatzentscheidungen und betrachten wir weiter das Reiz-Reaktions-Modell (die folgende Argumentation folgt Chomsky, 1959; S. 30). In einer sehr weiten und allgemeinen Form könnte man Reiz und Reaktion wie folgt definieren:
Als „Reize" kommen in Frage: die Menge aller physikalischen Gegebenheiten, die auf einen Organismus einwirken, und als „Reaktionen" alle Aktivitäten des Organismus, die in irgendeiner Weise von außen „beobachtbar" sind.
Dies allerdings wäre eine Definition, die es unmöglich machen würde, irgendwelche Gesetzmäßigkeiten zwischen Reizen und Reaktionen zu finden, da die Zahl der zu beobachtenden und zu beschreibenden Gegebenheiten gigantische Ausmaße annehmen würde. (Man stelle sich vor: alle Sinneseindrücke der Ratte vom Start im Labyrinth bis zum Ende des Experiments und all ihre einzelnen Bewegungen.) Keine der methodologischen behavioristischen Forderungen nach experimenteller Kontrolle, nach Quantifizierbarkeit und vor allem Reproduzierbarkeit wären noch erfüllbar.
Es bleibt also keine andere Wahl, als genauere Bedingungen anzugeben, welche einzelnen physikalischen Gegebenheiten man als „Reiz" und welche diskreten Aktivitäten man als „Reaktion" ansehen will. Für eine engere, genauere Form der Definition von Reiz und Reaktion sind hier zwei Strategien denkbar:
1. Man beginnt mit der Definition des „Reizes", also einer eindeutigen Teilmenge aller physikalischen Gegebenheiten, die auf das Individuum einwirken (z.B. ein „Ton" oder ein „Hebel"). Warum nehmen wir aber aus der riesigen Menge aller für die Ratte hör- oder sichtbaren Gegebenheiten ausgerechnet diese? Was dient hier als Definitionskriterium? Warum z.B. interessiert uns ein Hebel? Natürlich weil wir sehen wollen, ob und wie oft er gedrückt wird. Das heißt aber: wir bedienen uns für die Definition des „Reizes" der „Reaktion", die wir darauf erwarten. Konsequenterweise müßten wir also zunächst die „Reaktion" genauer definieren; und dies entspricht der zweiten Strategie:
2. Wir beginnen also diesmal mit der Definition einer „Reaktion", die wir möglichst genau beschreiben wollen (z.B. Ausscheiden einer bestimmten Speichelmenge oder Drücken eines Hebels). Es stellt sich nun die analoge Frage: Warum wählen wir aus der großen Vielfalt der Rattenaktivitäten während des Labyrinthlaufs genau diese? Und woraufhin haben wir diese Reaktion so festgelegt? Natürlich weil wir erwarten (und empirisch prüfen wollen!), ob sie durch den „Reiz" auch ausgelöst wird (oder zumindest in Anwesenheit dieses Reizes abläuft). Also müssen wir diesmal zuerst den Reiz genauer festlegen, um daraufhin erst die mit ihm korrelierende Reaktion definieren zu können.
Zusammengefaßt ist also jeder Reiz nur durch die Reaktion definierbar, die er nach sich zieht, und jede Reaktion durch den Reiz, der sie verursacht. Gesetzmäßigkeiten ergeben sich stets automatisch! Sie sind in der Reiz-Reaktions-Definition inhärent. Es gibt nichts mehr zu erforschen.
Chomsky charakterisiert diese Situation so:
Daraus ergeben sich nun zwei Konsequenzen:
1. Unabhängig davon, welchem der beiden Pole (weite oder enge Definition) man zuneigt, man hat stets mit einem logischen Problem zu tun: der Zirkularität dieser Definition.
2. Jede Konzeption eines konkreten S-R-Modells in einem Forschungsprogramm verlangt eine Festlegung über den Konkretisierungsgrad von Reiz und Reaktion; d.h. es ist zu definieren, wie groß die Klassen physikalischer Ereignisse und die Klassen von Aktivitäten sind, die jeweils „Reiz" oder „Reaktionen" genannt werden sollen.
(3) Die Zirkularität des S-R-Konzepts: Reiz und Reaktion als „theoretische Begriffe"
Wenn also der „Reiz" das ist, was man braucht, um die „Reaktion" hervorzurufen und die „Reaktion" das ist, was ein „Reiz" nach sich zieht, so sind Reiz und Reaktion zweifellos zirkulär definiert und also voneinander nicht empirisch unabhängig. Nun ist aber das S-R-Konzept deshalb keineswegs unbrauchbar, wie z.B. Gibson (1960) befürchtet. Es handelt sich hier nämlich um das in wissenschaftlichen Theorien häufige Phänomen theoretischer Begriffe im Sinne des Sneed /Stegmüllerschen Strukturalismus (vgl. dazu Kapitel 2), die so aufeinander bezogen sind, daß sich jeder einzelne nur dann empirisch fassen läßt, wenn man die Gültigkeit der Theorie (bzw. der Teile, an denen die beiden Begriffe beteiligt sind) voraussetzt. Das bedeutet hier: ein Reiz läßt sich erst bestimmen (definieren und messen), wenn das Reiz-Reaktions-Konzept als gültig akzeptiert wird.
Bekanntlich ist dieses Dilemma aus strukturalistischer Sicht lösbar durch ein konkretes Meßmodell. Und genau das ist es, was Behavioristen stets tun: Sie schlagen konkrete Experimente vor und demonstrieren an diesen ihre Auffassung des Reiz-Reaktions-Konzeptes.
Insgesamt ist also aus strukturalistischer Perspektive die von Chomsky kritisierte „Zirkularität" der Begriffe „Reiz" und „Reaktion" zwar wissenschaftslogisch „ungefährlich", auf der anderen Seite hat aber das Konstrukt „Reiz-Reaktion" auch seinen naiv-realistischen „Tatsachencharakter" verloren. Es ist wissenschaftslogisch nur zu retten, solange es als „axiomatische Setzung" akzeptiert wird. Diese ist als theoretische Kernannahme allerdings gegen jeden empirischen Falsifikationsversuch immun.
(4) Der Konkretisierungsgrad von „Reiz" und „Reaktion": „molekulare" und „molare" Auffassungen
Pawlows Versuch der Reduktion aller komplexen Verhaltensweisen auf physiologische
Reflexe ist sicherlich schon eine recht molekulare Auffassung. Watsons Vorstellung von
„Verhalten" ist dagegen, wie wir am „Kleinen Albert" gesehen haben, deutlich
„gröber".
Wenn er auch die Möglichkeit des Reduzierens auf immer elementarere
Reiz-Reaktions-Verbindungen postuliert, empirisch realisieren mußte er dies nie.
Bei den Behavioristen der 30er Jahre zeigt sich eine deutliche Abstufung in der „Molarität" (Marx & Hillix, 1979) von Reiz und Reaktion:
Hull (1930, 1931) zerlegt eine Verhaltenssequenz, die z.B. in einem Labyrinth einem definierten Zielverhalten vorausgeht (Laufen, Suchen usw.) in einzelne S-R-Sequenzen und zeigt, wie diese Sequenzen durch Verkürzung das Endverhalten immer „ökonomischer" zustande bringt, wodurch der Eindruck einer „Zielorientierung" oder „Voraussicht" entsteht.
Skinner (1931, 1932) definiert „Verhalten" durch seine Wirkung, also durch das, was als Konsequenz auf das Verhalten folgt („Verstärkungskontingenzen"). Aus diesem Grund faßt er alle Verhaltensvarianten, die dieselbe Konsequenz haben, zu einer „Reaktionsklasse" zusammen, die empirisch nicht weiter unterschieden zu werden braucht.
Tolman (1932) endlich definiert Reize gar nicht mehr physikalisch, sondern durch die „Bedeutung", die sie für das Individuum in dieser Situation haben. Reize sind nun zu „Signalen" geworden; gelernt werden keine Bewegungen, sondern „Zeichen-Gestalt-Erwartungen".
6.3.2 Guthries Prinzip der „Kontiguität"
In seinen ersten grundlegenden theoretischen Arbeiten versucht Edwin R. Guthrie (1886-1959) die von Pawlow und Thorndike beschriebenen Lernprozesse auf ein gemeinsames Grundprinzip zurückzuführen (vgl. Guthrie , 1930; 1934; 1935): Alles Lernen läßt sich durch ein einziges Konditionierungsprinzip erfassen, das i.A. „Kontiguitätsprinzip" genannt wird, und das Guthrie so beschreibt:
(Guthrie , 1935; S. 26; Übersetzung: G.S.)
Guthrie nimmt außerdem an, daß dieses Reizmuster gleich beim ersten gemeinsamen Auftreten mit einer Bewegung seine volle Assoziationsstärke erreicht. Die Assoziation hält dann so lange an, bis sie durch eine andere ersetzt, also quasi „überschrieben" wird.
Nachdem Guthrie sich bei seiner Theoriebildung Anfang der 30er Jahre zunächst vor allem auf „fremde" Experimente (z.B. Muenzinger u.a., 1929) bezogen hat, liefert er „sein" klassisches Experiment zusammen mit Horton in den 40er Jahren nach (vgl. Guthrie & Horton, 1946):
Verschiedene Katzen werden in einen Glaskasten gesetzt, dessen Ausgang durch die Berührung eines Pfahls geöffnet werden kann, der sich in der Mitte des Kastens befindet. Außerhalb des Kastens finden die Katzen dann ein Stück Fisch vor. Der Auslösemechanismus ist nun mit einem Photoapparat verbunden, der automatisch genau die Bewegung festhält, mit der die Katze den Pfahl berührt hat.
Eine Reihe von Versuchsdurchgängen mit verschiedenen Katzen zeigt nun eine starke Stereotypie: Bei Wiederholung des Experiments reproduziert jede der Katzen genau die Bewegung, die beim ersten Mal den Öffnungsmechanismus auslöste. Sie streift den Pfahl auf dieselbe Weise mit der Schwanzspitze, sie drückt dagegen mit der Vorderpfote oder sie beißt hinein.
Mit diesem Grundprinzip erklärt Guthrie die klassischen Experimente in folgender Weise:
Die „bedingten Reflexe", die Pawlow experimentell erzeugt und beobachtet hat, entstehen so:
2. der konditionierte Reiz hinzu, so erzeugt er bestimmte Bewegungen des Organismus (die unkonditionierte Reaktion), die mit diesen propriozeptiven Reizen einhergehen. Damit wird (nach dem „Kontiguitätsprinzip")
3. der konditionierte Reiz (genauer: die von ihm ausgelösten propriozeptiven Reize) in Zukunft dazu tendieren, dieselben Reaktionen auszulösen.
Die Lernkurve: Da die propriozeptiven Reize eines Individuums bei jeder Reaktion auf den konditionierten Reiz etwas unterschiedlich sind, kommt es beim ersten Versuchsdurchgang zu einer Verbindung nur eines Teils dieser inneren Reize mit der unkonditionierten Reaktion, und die beobachtete konditionierte Reaktion ist somit noch nicht „maximal". Bei weiteren Konditionierungsdurchgängen werden dann noch andere innere Reize ausgelöst, die bisher nicht mit dem konditionierten Reiz assoziiert sind; es kommen also weitere Assoziationen hinzu, so daß sich die Gesamtreaktion in den weiteren Durchgängen verstärkt, bis sie endlich ihre maximale Stärke angenommen hat.
Die Löschung: Bleibt nun aber der unkonditionierte Reiz aus, und es wird nur der konditionierte Reiz dargeboten, so werden die entsprechenden propriozeptiven Reize (des konditionierten Reizes) an die Bewegungen gebunden, die das Individuum nun zufällig ausführt. Ihre Verbindung mit der konditionierten Reaktion geht sukzessive verloren.
Das Thorndikesche Lernen durch „Versuch und Irrtum", und mit ihm alle Typen von „Bekräftigungslernen" erklärt Guthrie wie folgt:
Zeigt das Individuum im Problemkäfig einmal die „richtige" Reaktion („Bewegung"), so ist diese natürlich nach dem Kontiguitätsgesetz „automatisch" mit der Reizkombination verknüpft, die unmittelbar vorher auf das Individuum eingewirkt hat (z.B. die Reizkombination „Hebel" mit der Bewegung „Drücken"). Die „Belohnung" (also z.B. die Entlassung aus dem Käfig oder das Fressen eines Futterstückes) hat nun die einzige Funktion, daß durch sie die unmittelbar vorausgehende Reizkombination verlassen wird (der Hebel ist nicht mehr zu sehen). Damit kann diese nicht mehr mit anderen Bewegungen assoziiert werden und bleibt somit mit der letzten Bewegung verbunden, die zum „Erfolg" führte.
Bleibt hingegen die „Belohnung" aus, so wird der Strom der Bewegungen unter Einwirkung des Hebels nicht unterbrochen, und es kommt zu einem „Umlernen", zu einer Zerstörung der alten Assoziationen durch neue.
In beiden Fällen, beim Aufbau wie auch bei der Extinktion eines Reflexes, erklärt Guthrie die quantitativen Veränderungen der Lernkurven analog wie beim Pawlowschen Konditionieren.
Die Deutung des Pawlowschen Konditionierens zeigt, daß Guthrie bereit ist, bei seiner Auffassung von Reiz und Reaktion über die molekulare Sicht Pawlows noch hinauszugehen. Pawlowsche Reflexe werden in weitere Bestandteile zerlegt, und ihre gesetzmäßigen Veränderungen beim Aufbau und bei der Löschung aus Veränderungen in diesen Bestandteilen erklärt. Oberhalb dieser mikroskopischen Ebene ist aber auch jede makroskopische Auffassung von Reiz und Reaktion erlaubt. Und Guthrie widersteht (im Gegensatz zu Hull und dem späten Pawlow selber) der „Versuchung" eines extremen Reduktionismus.
6.3.3 Die systematische Lerntheorie von Hull und Spence
Obwohl nun schon seit einem Viertel Jahrhundert Labyrinthversuche durchgeführt worden sind, und auch Watson sich damit ausführlich beschäftigt hatte, ist bis Ende der 20er Jahre ein für Behavioristen schwerwiegendes Problem unbearbeitet geblieben:
In vielen Tierexperimenten laufen Versuchstiere durch ein komplexes Labyrinth und lernen dort allmählich, welche Richtungsentscheidungen „richtig" sind, wenn sie am Ende einen Futterbrocken erreichen oder wenn sie einen elektrischen Schlag vermeiden wollen. Natürlich ist die Formulierung „erreichen" bzw. „vermeiden wollen" für Behavioristen völlig unakzeptabel, denn einerseits ist „wollen" ein „mentalistischer" Begriff, andererseits wird so dem Verhalten der Tiere eine „teleologische" Funktion, nämlich Zielgerichtetheit oder eine Zukunftsorientierung unterstellt. Behavioristen dagegen hätten richtiger zu fragen, welche Reize denn insgesamt das Endverhalten auslösen. Daraus ergibt sich aber das prinzipielle Problem, daß ein Reiz eine „Zukunftswirkung" haben soll, in bezug auf ein Ereignis, das im Augenblick der Reizwirkung noch gar nicht vorhanden ist.
Clark L. Hull (1884-1952) veröffentlicht seine ersten Ideen zu diesem Problem zu Beginn der 30er Jahre (vgl. Hull, 1930; 1931). Ausgangspunkt der Überlegungen ist eine neue Konzeption von Reiz und Reaktion:
„Innere" Reize und Reaktionen
Hull nimmt an, daß jede äußere Reizung S eines Rezeptors im Nervensystem zu „afferenten" neuralen Impulsen s führt, die als „Reizspur" eine zeitlang anhalten und dann abklingen: S s. Andererseits muß auch jeder „Reaktion" R eines Effektors ein innerer „efferenter" neuraler Zustand r vorausgehen: r R. Löst nun ein äußerer Reiz S eine beobachtbare Reaktion R aus, so ist dieser Vorgang beschreibbar als eine Sequenz von äußeren und inneren (neuralen) Reizen und Reaktionen: S s r R. Die eigentliche Reiz-Reaktions-Verbindung kommt damit innerhalb des Nervensystems zwischen efferenten und afferenten neuralen Impulsen zustande: s r
Eine solche Verbindung kann aber nur unter zwei Bedingungen geknüpft werden:
1. Die Aktivitäten von Affektoren (s) und Effektoren (r) müssen in enger zeitlicher Nähe ablaufen, und
2. sie müssen mit der Verringerung eines Bedürfnisses G assoziiert sein.
Sind beide Bedingungen erfüllt, so ergibt sich eine Steigerung der „Gewohnheitsstärke" dieser Reiz-Reaktions-Verbindung: S H R .
Partiell antizipierende Zielreaktionen
Die (scheinbare) Antizipation von Ereignissen kann nun behavioristisch so erklärt werden: Wird ein Gesamtverhalten einmal erfolgreich durchgeführt (z.B. ein Lauf durch das Labyrinth, der in Gang gesetzt wurde durch das Bedürfnis „Hunger" mit anschließender Bedürfnisreduktion durch Fressen), so entstehen eine Reihe neuer Verbindungen:
Auf dem Weg durch das Labyrinth haben eine Reihe von Reizen S 1 , S 2 , S 3 ... S G innerhalb des Labyrinths (Wände, Ecken, Wege ... ) auf das Individuum eingewirkt und sind von einer Reihe Reaktionen R 1 , R 2 , R 3 ... R G (Laufen, Richtung ändern ...) begleitet worden. Zu jedem dieser Einzelreize S i gehört ein afferenter Impuls s i und zu jeder Reaktion R i ein efferenter Impuls r i :

Die Reaktionen Ri und die zugehörigen afferenten und efferenten Impulse si bzw. ri.
Durch die Bedürfnisreduktion am Ende der Verhaltenssequenz wird nun der zur Zielreaktion RG nächste Reiz SG mit dieser verbunden, und zwar vermittels der afferenten und efferenten Impulse:

Verstärkung der Zielreaktion
Zielreiz SG und vorhergehende Reize

Sequenz für die Zielreaktion und noch nachwirkende efferente Impulse der vorhergehenden Reize
vor dem Zielreiz liegender Reiz

antizipierende Zielreaktion rG
Die Erklärung für Pawlows Konditionierungsexperimente geschieht in analoger Weise:
Der unkonditionierte Reiz UCS löst zu Beginn des Experiments zunächst eine affernte neurale Reizung ucs aus. Andererseits ist die unkonditionierte eine Reaktion UCR von propriozeptiven Reizen ucr begleitet. Im Konditionierungsprozeß tritt nun ein neuer, zunächst „neutraler" Reiz S hinzu mit einem effernten Impuls s (jedoch unspezifischen Reaktionen r und R).
| vor dem Konditionierungsprozeß:
|
Konditionierungsprozeß:
|
nach dem Konditionierungsprozeß:
|
Es kommt zu einer Assoziation von s und ucr, wodurch der hinzugekommene Reiz S nun eine „antizipierende Zielreaktion" ucr mit anschließender UCR auslöst.
Diese Deutung des Pawlowschen Experiments zeigt, daß auch Hull sich bemüht wie Guthrie ein einziges Konditionierungsprinzip zu postulieren, unter das alle klassischen Lernprinzipien subsumierbar sind. Auch Hull zerlegt den ( Pawlowschen) Konditionierungsprozeß in weitere S-R-Bestandteile. Er ist überdies bemüht, alle komplexen Verhaltensweisen auf (S s r R) - Sequenzen hin zu interpretieren und treibt damit den behavioristischen Reduktionismus von allen am weitesten (vgl. Hilgard & Bower, 1973).
Im Laufe der 30er und 40er Jahre führt Hull eine weitere Neuerung in die
Psychologie ein:
Er präzisiert sein Begriffs- und Aussagensystem soweit, daß eine formalisierte
mathematische
Schreibweise möglich wird (vgl. z.B. Hull u.a., 1940; Hull, 1943). In Analogie zur
„Axiomatik" der Newtonschen Mechanik und zur axiomatischen Methode der Mathematik,
werden zunächst eine Reihe von grundlegenden Postulaten formuliert,
aus denen dann versucht
wird, Sätze zu erzeugen, die sodann quantitativ empirisch zu
überprüfen sind. Deduktion wird
zu einem der bevorzugten Prinzipien der Forschungsarbeit.
Hulls berühmte Schüler, wie Neal Miller, Dollard oder Mowrer, Gesell oder Yerkes führen zwar Teile der Theorie, in keinem Fall aber den Formalismus weiter. Es zeigt sich auch bald, daß eine Revision der Begriffe notwendig wird, um die Reichweite des Systems zu erhöhen, denn, so Hilgard und Bower (1973):
„Die Postulate basierten vornehmlich auf der Interpretation von Labyrinthverhalten, von einfachem Lernen durch „Versuch und Irrtum" und von serialem Lernen. (...)
Man muß immerhin anerkennen, daß das Hullsche System zu seiner Zeit das beste war, was der Psychologie zur Verfügung stand - wenn auch nicht unbedingt das, was der psychologischen Realität am nächsten kam." (a.a.O.; S. 214/215)
Das „teleologische" Problem aller Verstärkungsexperimente (einschließlich des Thorndikeschen) ist nun zwar im behavioristischen Sinn gelöst, dafür entsteht aber ein anderes: Die Annahme von „intervenierenden Variablen" in Form von „inneren Reizen", die dieselbe Fähigkeit zur Verhaltensauslösung haben wie äußere Reize, läuft einer anderen wesentlichen behavioristischen Forderung zuwider, nämlich der, sich nur auf objektiv beobachtbare Sachverhalte zu beziehen. Propriozeptive Reizungen sind stets innerere Prozesse, die der unmittelbaren Beobachtung nicht zugänglich sind.
6.3.4 Skinners „operante" Konditionierung - eine Renaissance des „reinen" Behaviorismus
Schon früh wendet sich der junge Skinner gegen eine Reihe von Hulls Grundannahmen:
- Skinner lehnt eine allzu molekulare Fassung von Reiz und Reaktion ab. Er besteht darauf, wie er sagt, das Verhalten „lebender Organismen" zu untersuchen, und er möchte keinen „Mißbrauch der Physiologie durch die Psychologie", die er in der Pawlowschen Reflexologie sieht (vgl. Skinner, 1979; S. 68).
- Ebenso entschieden wendet er sich gegen die Arbeit mit „intervenierenden Variablen" und bevorzugt eine strikte Eliminierung alles nicht Beobachtbaren aus der Forschungsarbeit.
Durch diese Festlegungen (vgl. Skinner, 1931) vermeidet er einerseits die dem Behaviorismus in dieser Phase schon drohenden ersten „Anomalien" einer bis in die physiologischen Details vorangetriebenen „Verhaltensanalyse", die sehr bald erschreckende Ausmaße annimmt (vgl. Mackintosh, 1984). Andererseits bietet er eine Möglichkeit an, zu den Watsonschen Idealen einer „objektiven" Psychologie zurückzukehren, ohne die Verwendung „mentalistischer" Konzepte, und dabei dennoch genuin psychologische Gegenstände zu untersuchen. Hinzu kommt, daß Skinner die experimentelle Methodik in bezug auf die Variablenkontrolle soweit perfektioniert, daß seine Experimente zu „Musterbeispielen" der empirischen Psychologie werden.
Sein Einfluß auf den „mainstream" der behavioristischen Psychologen wächst stetig, und als die „Endzeit" der Dominanz des Behaviorismus anbricht, muß mit Skinner die Auseinandersetzung um die Reichweite behavioristischer Konzeptionen geführt werden (vgl. hierzu die berühmte Rezension und informationstheoretische Fundamentalkritik von Skinners „Verbal Behavior" (1957) durch Chomsky (1959) ).
(1) Skinners Experimente
Für seine erste experimentelle Serie mit Ratten baut Skinner eine Apparatur, die schon alle wesentlichen Elemente der späteren „Skinner-Boxen" besitzt (vgl. Skinner, 1932):
a) Die Skinner-Box
In einem schallisolierten Raum befindet sich ein mit Filz schallgedämpfter Kasten, der seinerseits eine „Problembox" enthält. In den ersten Experimenten ist sie mit einem Hebel ausgestattet, bei dessen Herabdrücken sich automatisch eine Klappe öffnet, die ein kleines Stück Futter freigibt. Ein (Stromkreis-) Unterbrecher sorgt dafür, daß der Mechanismus nicht mehrmals kurz hintereinander bedient werden kann, und zwar innerhalb des Zeitraumes, den das Versuchstier (hier eine Ratte) zum Fressen braucht. (Dies wären aus der Sicht des Designs „irrelevante" Reaktionen.) Mit dem Hebel ist ein automatischer Zähler verbunden, der alle Hebeldruckreaktionen aufzeichnet. Die gesamte Apparatur arbeitet vollautomatisch; Eingriffe des Versuchsleiters, ja sogar seine Anwesenheit während des Experiments, sind unnötig.
![]() |
|---|
b) Experimentelle Daten
Zur Aufzeichnung der Ergebnisse verwendet Skinner sogenannte „Kumulativschreiber": Bei jeder Reaktion (z.B. Hebeldruck) rückt der Schreiber um einen festen Abstand weiter (in Abb 6.3 nach oben), während sich unter ihm auf einer Trommel ein Papierstreifen stetig weiterbewegt (in Abb 6.3 von links nach rechts).
Entscheidend für die Interpretation ist nun die Reaktionsrate, also die durchschnittliche Zahl der Reaktionen pro Zeiteinheit. Sie entspricht in Abb 6.3 der Steigung der jeweiligen Lernkurve (Die Reaktionsrate ist also umso höher, je steiler die Kurve verläuft, und sie wird Null, wenn die Kurve parallel zur Zeitachse verläuft; dann nämlich findet keine weitere Reaktion statt, die den Schreiber nach oben bewegt.)
Abb 6.3 zeigt drei Kurven für typische experimentelle Anordnungen („Verstärkungspläne"):
Continuos reinforcement (kontinuierliche Verstärkung, Kurve a): Hier folgt auf jede Reaktion (Hebeldruck) ein Futterstück (Verstärkung); die Kurve verläuft entsprechend steil.
Extinction (Löschung der in a aufgebauten Reaktion; Kurve b): Unterbleibt nach 250 solcher Verstärkungen die Futtergabe völlig, so wird die Reaktionsrate immer geringer und nähert sich allmählich Null (der Waagerechten).
Fixed ratio (feste Quotenverstärkung, Kurve c): Wird nicht jede, sondern z.B. nur jede dritte Reaktion verstärkt, so ergibt sich zunächst eine deutlich geringere Reaktionsrate (Kurvensteigung). Diese ist aber erheblich löschungsresistenter, wie sich an der zugehörigen Löschungskurve zeigt (Kurve d).
a) „operants" - „operante Reaktionen"
Die zentrale experimentelle Einheit, mit der Skinner arbeitet, ist die „operante Reaktion" (im oben beschriebenen Experiment das Drücken eines Hebels), die zu einer fest definierten Konsequenz führt (zum Öffnen der Futterklappe). Solche Reaktionen werden von Skinner als „operants" bezeichnet, womit zwei Aspekte angedeutet werden sollen:
1. Ein operant ist „operational definiert" und, anders als bei Pawlow, Hull oder Guthrie, nicht weiter zerlegbar. Es ist nämlich gleichgültig, ob das Versuchstier das „Hebeldrücken" mit der linken oder rechten Pfote, mit der Schnauze oder seinem Hinterteil vornimmt, oder ob es mit seinem ganzen Körper darauf springt, jede dieser Einzelreaktionen gehört in dieselbe Klasse von Reaktionen, da sie zum selben Ergebnis (dem Klappenöffnen mit Futtergabe) führen. Eine „operante Reaktion" ist damit eine Klasse von Verhaltensweisen, die dieselbe Konsequenz nach sich zieht.
2. Operants werden nicht, wie konditionierte Reaktionen, zwangsläufig mechanisch „ausgelöst", sondern sie werden vom Individuum unter gegebenen Bedingungen „emittiert", also spontan hervorgebracht. Die Reizbedingungen, unter denen dies geschieht, sind damit im logischen Sinne nicht „hinreichende" sondern nur „notwendige Bedingungen" für das Auftreten einer operanten Reaktion. In diesem Sinne ist ein operant eine „Operation" eines Individuums.
b) „Verstärker"
Die Häufigkeit der Emission einer operanten Reaktion verändert sich, je nachdem, welche unmittelbaren, kontingenten Konsequenzen diese hat. Eine solche kontingente Konsequenz, die die Auftretenshäufigkeit der operanten Reaktion (ihre Reaktionsrate) steigert, wird „Verstärker" genannt. Insgesamt kann damit ein „operant" definiert werden als eine „Reaktionsklasse, auf die ein Verstärker kontingent ist" (vgl. Skinner, 1974b; S.18).
Auch hier scheint übrigens wieder eine dieser häufig kritisierten „Zirkulardefinitionen" vorzuliegen: „operant" und „Verstärker" benötigen sich gegenseitig zur Definition. Im Sinne Sneed/Stegmüllers sind also auch „operant" und „Verstärker" theoretische Begriffe. Ihre empirische Bestimmung ergibt sich aber aus Meßmodellen, von denen Skinner allerdings eine große Zahl vorstellt; vgl. hierzu auch die Strukturalistische Rekonstruktion der Theorie des operanten Konditionierens bei Kraiker (1980).
c) „Diskriminative Stimuli"
Der Zusammenhang zwischen operanter Reaktion und Verstärker ist in der Regel abhängig von einer dritten Variablen, nämlich den situativen Stimulusbedingungen, dem „Anlaß, auf den hin die operante Reaktion auftritt" (vgl. Skinner 1974b). Jedes Individuum emittiert seine operants nur, wenn bestimmte äußere Rahmenbedingungen erfüllt sind (die Ratte befindet sich in der Box, und ein Hebel ist vorhanden). Ändert sich diese Reizsituation (z.B. dadurch, daß der Verstärker nur eintritt, wenn gleichzeitig eine Lampe aufleuchtet), so beginnt das Individuum, seine Emissionen auf das Vorhandensein dieses Reizes einzuschränken, es diskriminiert die Reizsituation. Jede operante Reaktion ist also stets diskriminativ mit den Reizbedingungen, den „diskriminativen Stimuli" verknüpft, unter denen sie hervorgebracht wird. Sie wirken aber, wie schon gesagt, nicht als „Auslöser", sondern als Bedingung für die Emission der operanten Reaktion.
(3) Strategien der Theoriebildung und der experimentellen Methodik
Skinner spricht sich entschieden aus gegen eine deduktive Theoriebildung, wie Hull sie vorlegt. Er empfindet das Hullsche Vorgehen der formalen Ableitung großer Mengen von Aussagen aus wenigen Grundpostulaten mit anschließender empirischer Überprüfung als eine riesige Verschwendung von Forschungsressourcen, da das Zustandekommen solcher Aussagen zunächst wenig an reale Problemstellungen gekoppelt ist, und somit viele Untersuchungen „ins Leere" laufen (vgl. Skinner, 1979). Dagegen bevorzugt Skinner, wie oben gezeigt, einen induktiven Weg, bei dem auf der Basis konkreter Experimente und deren Ergebnisse vorsichtig nach begrifflichen Verallgemeinerungen für Gegenstände und Zusammenhänge gesucht wird.
b) Das Problem der kleinen Stichproben und der mathematischen Auswertung
In den ersten Jahren arbeitet Skinner mit vier Versuchstieren in vier Boxen gleichzeitig, und er hält einen gesetzmäßigen Zusammenhang für belegt, wenn er in der Mehrheit der Aufzeichnungen wiederzufinden ist. Er lehnt es ab, Daten zu „mitteln", da dadurch wichtige Informationen verloren gehen können; z.B. stößt er per Zufall zum ersten Mal auf eine „Löschungskurve", als der Futterspender einer der vier „Skinner-Boxen" klemmt: das Futter bleibt aus, die Lernkurve nähert sich in charakteristischer Weise der Horizontalen. Wäre dies bei einem von 24 Experimenten passiert, diese eine „falsche" Kurve wäre möglicherweise als „Fehler" interpretiert oder „herausgemittelt" worden (vgl. a.a.O.). Aber der „Zeitgeist" ist zunächst gegen Skinner: Bald kommt es zu Auseinandersetzungen mit den „Statistikern" aus Minnesota (z.B. Fisher und Heron), und Skinner läßt sich für kurze Zeit „unglücklicherweise vom Gegenteil überzeugen", denn es gab „einen großen Druck auf Psychologen, ´mathematisch´ zu sein." (a.a.O.; S. 234).
So finden also die Skinner-Experimente vorübergehend in 24 Skinner-Boxen gleichzeitig statt, und es werden 24 Lernkurven „übereinandergelegt". Die Ergebnisse sind einander aber äußerst ähnlich, und mathematisch begabte Schüler Skinners versuchen, mit raffinierteren mathematischen Analysen mehr zu erreichen als ihr Lehrer mit seinen anschaulich-intuitiven Interpretationen; allerdings, wie Skinner meint, „ohne größeren Beitrag zur Theorie" (a.a.O.; S. 235). Wenig später kehrt Skinner endgültig zu seiner „magischen Zahl" von vier Versuchstieren zurück. Er bleibt, was die „große Zahl" in psychologischen Untersuchungen angeht, bis zuletzt skeptisch. Diese, so Skinner, diene doch nur dazu, die Schwächen bei der experimentellen Variablenkontrolle zu vertuschen, indem Abweichungen durch Mitteln „weggerechnet" werden (a.a.O.).
Schon früh besteht Skinner auf der Unterscheidung zweier grundlegend verschiedener Arten der Konditionierung („Two types of conditioned reflex ..."; vgl. Skinner, 1935, 1937). Die Pawlowsche Konditionierung unterscheidet sich nämlich von der Thorndikes (in dessen Tradition Skinner sich selber sieht) durch verschiedene Reizkontingenzen:
Bei Pawlow (Konditionieren vom „Typ S") wird (der spätere konditionierte) Reiz So kontingent ( ) gefolgt von einem (unkonditionierten) Reiz S1, der eine bestimmte konditionierte Reaktion auslöst. S1 fungiert so als „Verstärker" für die Eigenschaft von S0, ebenfalls die Reaktion R1 auszulösen:
Typ S - Konditionierung nach Pawlow:
Beim „operanten Konditionieren" („Typ R") ist der „verstärkende" Reiz S1 nun nicht kontingent zu einem „Auslöser" S, sondern er folgt dem operanten Verhalten R0 unmittelbar ( ). Tut er dies, so verstärkt er das Auftreten von R0:
![]()
6.3.5 Tolmans „kognitiver Behaviorismus"
Edward C. Tolman (1889-1959), geboren in Massachusetts, wechselt erst spät, nach dem Abschluß eines Ingenieurstudiums an der M.I.T., zur Psychologie. Ebenso verspätet beginnt er Ende der 20er Jahre, sein kognitiv-behavioristisches System zu entwickeln; auch hier nach Umwegen über experimentelle Arbeiten zur „retroaktiven Hemmung", die er zu Freuds Verdrängungmechanismen in bezug setzt (vgl. Tolman, 1917), und theoretischen Überlegungen zur Bedeutung des Bewußtseins aus behavioristischer Sicht (vgl. Tolman, 1927).
So ist Tolman schon geübt im Umgang mit innerwissenschaftlichen Tabus, als er 1932 den ersten Entwurf einer neuen Form von Behaviorismus veröffentlicht: „Zweckgerichtetes Verhalten bei Tier und Mensch" („Purposive behavior in animals and man"; vgl. Tolman, 1932).
Unbeeindruckt von aller Kritik seiner behavioristischen Zeitgenossen an „teleologischen" und „mentalistischen" Konzepten, definiert Tolman Verhalten aus seinen adaptiven Zwecken, also durch die Ziele, auf die es gerichtet ist.
Tolmans Kernannahme lautet: Verhalten wird zwar durch Umweltreize oder physiologische Zustände in Gang gesetzt, es wird aber nicht allein durch einfache Assoziationen von Reizen und Reaktionen bestimmt, sondern durch „kognitive Prozesse", deren Kern eine „Mittel-Ziel-Fertigkeit" (means-end readiness) ist. Diese besteht darin, daß das Individuum sein Verhalten unter Berücksichtigung der Gegebenheiten seiner Umwelt für seine adaptiven Zwecke einsetzen kann. Entscheidend für solch zweck- und zielgerichtetes Verhalten sind dann die „Erwartungen" (expectancies), „was zu was führt" (what leads to what) (vgl. Tolman, 1932).
Damit legt sich Tolman für eine stark makroskopische („molare") Auffassung von Reiz und Verhalten fest:
„Eine Mittel-Ziel-Fertigkeit, so wie ich sie verstehe, ist eine Bedingung innerhalb des Organismus, die äquivalent ist zu dem, was wir üblicherweise eine ´Überzeugung´ nennen (eine Bereitschaft oder Disposition), die darin besteht, daß ein Element einer Klasse von Stimulussituationen unter Einsatz eines Elements einer Klasse von Reaktionen zu einem Element einer anderen, nachfolgenden Klasse von Stimulussituationen führt." (Tolman, 1959; S. 113; Übers.: G.S.)
Über Lernprozesse nimmt Tolman nun an, daß
„ ... die verschiedenen Fertigkeiten (...) (Dispositionen) zusammen (im Nervensystem) gespeichert werden. Wenn diese in Form von Erwartungen konkret aktualisiert werden, tendieren sie dazu, miteinander zu interagieren ... ." (a.a.O.; Übers.: G.S.)
(2) Experimentelle Arbeiten
Tolman konzentriert sich beim Aufbau seines Forschungsprogramms zunächst auf diejenigen Experimente, die den bestehenden S-R-Konzeptionen die größten Schwierigkeiten machen, also auf die „Anomalien" des behavioristischen Paradigmas; hier einige Beispiele:
a) „Belohnungserwartung"
Tinklepaugh und Elliot hatten 1928 jeweils ein Experiment zum „Kontrasteffekt" veröffentlicht (vgl. Tinklepaugh, 1928; Elliot, 1928):
In Tinklepaughs Anordnung wurden Affen für ein bestimmtes Verhalten mit Bananen belohnt. Wurde nun die Banane gegen weniger attraktives Futter ausgetauscht, dann nahmen die Affen dieses keineswegs an und führten das verstärkte Verhalten aus, sondern sie begannen statt dessen ein deutliches Suchverhalten.
Elliot gab im Labyrinth verschiedenen Ratten verschiedene Sorten Futter als Verstärker für erfolgreiches Durchlaufen. Die eine Gruppe bekam (attraktiven) Kleiebrei angeboten, während die andere Gruppe mit weniger attraktiven Sonnenblumenkernen gefüttert wurde. Wie zu erwarten, lernte die „Kleie-Gruppe" schneller und machte weniger Fehler als die Kontrollgruppe. Wurde aber die „Kleie-Gruppe" nach 10 Durchläufen auch nur noch mit Sonnenblumenkernen gefüttert, so stieg deren Fehlerhäufigkeit drastisch an, sie wurde plötzlich schlechter als die Vergleichsgruppe, obwohl sie dasselbe Futter bekam.
Tolman interpretiert beide Ergebnisse damit, daß bei den Versuchstieren „Vorkenntnisse" und „Erwartungen" vorhanden gewesen sein müssen, die das Endverhalten entscheidend beeinflußt haben. In eigenen Experimenten geht er nun diesem Phänomen kognitiver Prozesse weiter nach:
![]() |
|---|
b) „Ortslernen"
In einem weiteren Experiment trainieren Tolman und Honzig Ratten zunächst, durch ein Drei-Wege-Labyrinth zu laufen (vgl. Abb. 6.4). Dabei sind zunächst alle Sperren offen, und die Ratten lernen sehr schnell, auf dem kürzesten Weg 1 zum Ziel zu kommen. Dann wird Sperre A geschlossen, es bleiben als Alternativen nur Weg 2 und 3. Bald haben auch hier die Ratten den kürzeren Weg 2 gelernt. Erst wenn nun auch noch Weg 2 durch das „Tor" blockiert wird, nehmen die Ratten Weg 3. So hat sich nachprüfbar eine Wahlhierarchie „Weg 1 vor Weg 2 vor Weg 3" gebildet.
Im Hauptversuch wird nun allein Sperre B geschlossen, alle anderen Durchgänge sind geöffnet. Der gelernten Hierarchie gemäß, beginnen die Versuchstiere nun mit Weg 1 und kommen zur Sperre B, von wo sie zum Kreuzungspunkt D zurückkehren. Nun wählen sie aber nicht Weg 2, den nächsten in ihrer im Vortraining gelernten Hierarchie, sondern sie laufen sofort über Weg 3. Für Tolman und Honzig ist dies ein Indiz für einen Prozeß der „Einsicht" (insight), der in der Ratte abgelaufen sein und zu einem ökonomischeren Verhalten geführt haben müsse (vgl. Tolman & Honzig, 1930a).
c) „Latentes Lernen"
![]() |
|---|
Tolman und Honzig (1930b) trainieren drei Gruppen von Ratten, ein multiples T-Labyrinth zu durchlaufen. Die erste Gruppe erhält nach jedem Lauf eine regelmäßige Futterbelohnung, und es stellt sich die übliche Leistungsverbesserung ein (vgl. Abb. 6.5). Eine weitere Gruppe bleibt ohne Futterbelohnung und lernt entsprechend langsam. Die dritte (Versuchs-) Gruppe aber hat zunächst 10 Tage ebenfalls ohne Belohnung zu absolvieren, was zu ähnlich langsamem Lernen führt wie bei der anderen, unbelohnten Gruppe. Vom 11. Tag an erhält aber diese Gruppe ebenfalls eine Belohnung, und ihre Fehlerzahl sinkt sofort rapide.
Die Autoren interpretieren dies als deutlichen Hinweis darauf, daß die Versuchsgruppe auch in der Phase, in der sie noch ohne Futterbelohnung ist, schon etwas gelernt haben muß, was sich dann erst später aktualisiert.
Die Experimente von Tinklepaugh und Elliot zeigen, daß Individuen in der Lage sind, „Erwartungen" aufzubauen darüber, zu welchem Ziel ihr Verhalten in einer bestimmten Situation führt (Mittel-Ziel-Fertigkeit). (Hier: ein bestimmtes Verhalten „führt" zu einer bestimmten Sorte Futter.) Erfüllen sich diese Erwartungen nicht, so werden sie in bezug auf diese Situation verändert, und es kommt von da an zu einem veränderten Verhalten. (Sie beginnen zu suchen oder machen immer mehr Fehler.) Somit wird Verhalten weniger von vorliegenden Reiz-Reaktions-Kontingenzen bestimmt als von den Erwartungen, die das Individuum in bezug auf das Erreichen eines bestimmten Zieles hegt.
Gegen eine Interpretation mit Hilfe von Reiz-Reaktions-Kontingenzen sprechen auch die Ergebnisse von Experimenten zum „Ortslernen". Aus der Beobachtung, daß Individuen sich hier unter Ausnutzung von Rauminformationen sogar entgegen der „Verstärkungslage" verhalten, schließt Tolman, daß sie konkrete „Vorstellungen", eine „kognitive Landkarte" (cognitive map) der Situation besitzen müssen. Sie tun dies, um ihr Verhalten zu „optimieren", um aus den ihnen möglichen Mitteln dasjenige auszuwählen, das den Zweck des Verhaltens am besten erfüllt. Hieraus folgt ein weiteres Postulat: das Prinzip des kleinsten Aufwandes (principle of leastest effort); d.h., Verhalten wird stets so selektiert, daß der Zweck mit möglichst geringem (Verhaltens-) Aufwand erfüllt werden kann.
Das „Latente Lernen" der ungefütterten Ratten im Labyrinth schließlich zeigt, daß Lernprozesse auch ohne Verstärkung stattfinden können, indem nämlich „Kenntnisse" über die Umwelt erworben und gespeichert werden, die erst später (unter „günstigen" Bedingungen) verhaltenswirksam werden. In Tolmans Interpretation besteht damit Lernen nicht primär in der Veränderung von Verhalten, sondern darin, daß Zeichen und deren Bedeutungen gelernt werden (sign-significance learning). Lernen wird insgesamt interpretiert als Erwartungserwerb im Hinblick auf die Verhaltensziele.
Wenige Jahre später versuchen Tolman und seine Schüler (z.B. Brunswick und Humphreys), das Konzept der „Erwartungen" weiter zu quantifizieren. Sie tun dies mit Hilfe wahrscheinlichkeitstheoretischer Begriffe und entwickeln entsprechende Experimente mit Tieren und mit Menschen, die zeigen, daß die Häufigkeit des Verhaltens sich nach der „Belohnungswahrscheinlichkeit" in dieser Situation richtet. Letztere gilt als quantifizierbare Größe, die eine bestimmte „Erwartung" ausdrückt.
(4) „Konditionierte Reflexe" und das Lernen durch „Versuch und Irrtum"
a) Ein konditionierter Reiz ist ein Zeichen, das das Auftreten des unkonditionierten Reizes ankündigt. (Weshalb dieser Lernprozeß, wie Pawlow gezeigt hat, auch effektiver verläuft, wenn in der Lernphase der unkonditionierte Reiz dem zu konditionierenden folgt!) Tritt der konditionierte Reiz nun alleine auf, so aktualisiert er die Erwartung, daß nun auch der unkonditionierte auftreten werde, und das Individuum verhält sich entsprechend, es „antwortet" mit der unkonditionierten Reaktion. In Löschungssituationen, wenn also der unkonditionierte Reiz ausbleibt, wird die Erwartung seines Auftretens entsprechend geschwächt, so daß auch die Reaktion nachläßt.
b) Beim Lernen durch „Versuch und Irrtum" bildet sich ebenfalls eine bestimmte „Mittel-Ziel-Fertigkeit" heraus, gleichzeitig aber auch eine durch mehrere Versuche immer genauer werdende kognitive Landkarte, in der sich die Bedingungen des erfolgreichen Verhaltens niederschlagen. Jeder erfolgreiche Versuch steigert die Erwartung, daß das erfolgreiche Verhalten zum Ziel führt, und es wird so, entsprechend Thorndikes Beobachtungen, immer häufiger.
Trotz eklatanter Verstöße gegen die „antiteleologischen" und „antimentalistischen" Grundüberzeugungen vieler Behavioristen, wird Tolman von den meisten Autoren der Psychologiegeschichte als „Behaviorist" eingestuft (vgl. z.B.: Amsel & Rashotte, 1984; Hilgard & Bower, 1973; Marx & Hillix, 1979; Ulich, 1989; Michael Wertheimer, 1971). Dies vor allem aus folgenden Gründen:
1. Tolman bleibt dabei, die Gesetzmäßigkeiten zwischen einer Reizumgebung und dem beobachtbaren Verhalten zu erforschen und zu erklären. Verhaltensänderungen werden nach wie vor auf die Ausbildung von Assoziationen zwischen korrelierenden Ereignissen zurückgeführt.
2. Für das Zustandekommen solcher Assoziationen verwendet Tolman allerdings sehr komplexe „intervenierende Variable", eine Interpretationsfigur, die er wohl von Hull übernimmt. Die so postulierten „kognitiven Prozesse" sind dabei aber keineswegs „autonom"; d.h. es wird nicht angenommen, daß diese selbständig und unabhängig von konkreten Reizsituationen Informationen erzeugen können, oder daß sie „von sich aus" Verhalten initiieren könnten. Tolman beläßt es beim prinzipiellen Primat der Verhaltenskontrolle durch äußere Reize.
3. Er besteht konsequent auf Verhaltensbeobachtung und lehnt alle introspektiven Methoden ab. So komplex eine intervenierende Variable auch sein mag, sie muß stets, im Sinne eines „Konstrukts", aus konkreten, quantitativ erfaßbaren Indikatoren der Reizumgebung und des Verhaltens erschlossen werden.
4. Schließlich haben alle Untersuchungsmethoden objektiv und reproduzierbar zu sein, und sie müssen zu quantitativen Daten führen, mit denen es erst erlaubt ist, theoretisch weiterzuarbeiten. Das kontrollierte Tierexperiment im Labor ist auch für Tolman ein valides Modell für die Erforschung menschlichen Verhaltens.
6.4 Behavioristische Forschungsprogramme
in verschiedenen psychologischen Teildisziplinen
An Beispielen aus der Sozialpsychologie, der Entwicklungs- und Persönlichkeitspsychologie sowie der Klinischen und Pädagogischen Psychologie soll nun dargestellt werden, wie behavioristisches Denken und Forschen Eingang findet in die zentralen Teildisziplinen der Psychologie.
6.4.1 Frühe Skizzen „intendierter Anwendungen"
• Schon 1924 legt Floyd H. Allport eine streng behavioristisch aufgebaute Sozialpsychologie vor, die sich an den frühen Grundkonzepten Watsons, Thorndikes und Pawlows orientiert (vgl. Allport, 1928).
• „Can Psychology Help me Rear my Child?" fragt Watson in einem populärwissenschaftlichen Aufsatz (vgl. Watson, 1927) und stellt die neuen lerntheoretischen Erklärungsmuster für die emotionale kindliche Entwicklung vor.
• Ebenso skizziert er die ersten Grundideen einer behavioristischen Persönlichkeitspsychologie (vgl. Watson, 1930).
• Und anschließend an Watson und Rayners berühmtes „Albert"-Experiment versucht Mary Clover Jones (1924a, 1924b) die erste experimentelle systematische Löschung von Kinderängsten (übrigens mit einem solchen Erfolg, daß unverständlich bleibt, warum es bis in die 50er Jahre dauern muß, bis sich behavioristische Klinische Psychologen wieder dieser Technik annehmen; vgl. Wolpe, 1958)
Möglicherweise ist der „Strom" der Behavioristen anfänglich noch nicht stark genug, sind auch die behavioristischen Modelle noch zu spekulativ, um schon eine breite Forschungstätigkeit über die Grundlagenforschung hinaus zu etablieren. Immerhin hat man sich von Anfang an, was die methodische Arbeit angeht, selber strenge Auflagen gemacht. Vielleicht werden aber auch die großen behavioristischen Systeme (vgl. den vorigen Abschnitt ) mit allzu starker begrifflicher und methodologischer Rigorosität vorgetragen, so daß eine für die Ausweitung des Anwendungsbereichs notwendige Liberalisierung der Konzepte noch unterbunden wird. Jedenfalls beginnt erst die dritte behavioristische Generation der 40er und 50er Jahren, die verschiedenen psychologischen Teildisziplinen mit großen Forschungsprogrammen zu „besetzen".
6.4.2 Theoretische Grundlagen behavioristischer Sozial-, Entwicklungs- und Persönlichkeitspsychologie
(1) Die behavioristische Konzeptualisierung der Teildisziplinen
• Die behavioristische Sozialpsychologie untersucht die wechselseitige Beeinflussung von Individuen, wobei soziale Situationen als „Stimuli" und soziale Verhaltensweisen als relevante „responses" betrachtet werden.
• Die behavioristische Entwicklungs- und Persönlichkeitspsychologie stehen zueinander in einem äußerst engen Verhältnis, da es in beiden Bereichen um die Ausbildung von „Reaktionsgewohnheiten" geht, die konsequent behavioristisch-lerntheoretisch beschrieben und erklärt werden. Die Entwicklungspsychologie ist die „dynamische Seite" der Persönlichkeitspsychologie, die die Bedingungen zu beschreiben hat, unter denen die als „Verhaltenstendenzen" aufgefaßten Persönlichkeitseigenschaften gelernt werden.
Beim Aufbau sozialpsychologischer wie auch entwicklungs- und
persönlichkeitspsychologischer Forschungsprogramme zeigt sich bald, daß zwei
Grundphänomenen des Lernens eine
Schlüsselstellung zukommt, die in der bisherigen Grundlagenforschung
vernachlässigt wurden,
bzw. bei allzu „fundamentalistischer" S-R-Rigorosität kaum erfaßbar waren, die
„sekundären
Verstärker" und das „Modellernen":
• Einerseits ist die häufig beobachtbare Wirkung „sozialer Verstärker" (wie Lob oder Aufmerksamkeit) erklärungsbedürftig, da sie selten (im Hullschen Sinne) mit einer unmittelbaren Reduktion von Antrieben einhergeht. Außerdem zeigt sich bei persönlichkeitspsychologischen Fragestellungen, daß es offensichtlich starke individuelle „Motivsysteme" gibt, die ebenfalls kaum mit der Reduzierung biologischer Bedürfnisse in Zusammenhang stehen.
• Andererseits verführt ein wichtiger verhaltensbeeinflussender Vorgang, nämlich die „Nachahmung" (Imitation) eines Individuums durch ein anderes, immer wieder zu „mentalistischen" Deutungen. Imitation ist bislang nicht lerntheoretisch beschreibbar und steht damit weder der behavioristischen Sozial- noch der Entwicklungspsychologie als Erklärungsprinzip zur Verfügung.
Um die intendierten Anwendungen mit einiger Aussicht auf Erfolg auch auf den Bereich der Sozial- und Persönlichkeitspsychologie ausdehnen zu können, ist also eine gewisse „Liberalisierung" und Erweiterung des behavioristischen Begriffsapparates nötig. Dies geschieht zuerst und mit dem größten Erfolg in der Umgebung Hulls durch die Entwicklung der Theorie des „Sozialen Lernens".
(3) Die Theorie des Sozialen Lernens
(a) Hulls Seminar über Psychoanalyse und bedingte Reflexe
Es ist diese anfängliche Unfruchtbarkeit der S-R-Analysen für komplexere Fragestellungen, die Hull bemängelt, als er über Skinner sagt, er glaube nicht, daß dessen Konzept einen Grad erreichen könne, um nutzbringend zu werden. (Was diesen so ärgert, daß er es über 40 Jahre später noch in seiner Autobiographie erwähnt - womit nun die Kontroverse zwischen Skinner und Hull ihren Lauf nimmt.) (Vgl. Skinner, 1979; S. 205)
Zur Behebung der offenkundigen Enge damaliger lerntheoretischer Konzepte leitet Clark Hull einen Prozeß ein, der vielen behavioristischen Zeitgenossen als Sakrileg erscheinen muß: Er versammelt an seinem Institut mehrere ausgebildete Psychoanalytiker (Neal Miller, John Dollard und Robert Sears), die ab 1936 zusammen mit anderen Schülern Hulls (z.B. Mowrer, Doobs und Whiting) versuchen, bestimmte Konzepte der Freudschen Theorie in behavioristischen Begriffen umzuformulieren und mit behavioristischen Methoden zu erforschen, z.B.: Abhängigkeit, Aggression, Identifikation, Gewissen, Abwehr. Dollard und Miller (1950) begründen dies mit der höheren konzeptionellen „Vitalität" der Psychoanalyse gegenüber den behavioristischen Lerntheorien. Dies müsse allerdings ergänzt werden durch die „Exaktheit des naturwissenschaftlichen Labors". Die Ergebnisse fließen ein in drei große und einflußreiche Veröffentlichungen:
• „Frustration and Aggression" (Dollard, Doob, Miller, Mowrer & Sears, 1939)
• „Social Learning and Imitation" (Miller & Dollard, 1941)
• „Personality and psychotherapy" (Dollard & Miller, 1950)
Skinner ist entsetzt. Die Spannungen zwischen ihm und Hull gewinnen an Schärfe. Es beginnt ein Kleinkrieg um Gerätschaften und um „Amtshilfe". Skinner warnt seinen besten Freund und Kollegen, Fred Keller, sich nicht von den Hullianern „verführen" zu lassen (vgl. Skinner, 1979; S. 205). Die Sprache wird martialischer: In einem Brief an Fred Keller schreibt Skinner 1936: „Habe gerade die letzte Breitseite aus Hulls Seminar über Psychoanalyse und bedingte Reflexe bekommen. Ich fürchte, der alte Junge ist verloren." (a.a.O.; Übers.: G.S.)
Allerdings läßt sich der ältere (und wissenschaftlich etabliertere) Hull vom behavioristischen Eifer des jüngeren („Fellow") Skinner wenig beirren, und er beginnt einerseits selber an der Ausdehnung lerntheoretischer Konzepte zu arbeiten, andererseits ermuntert und unterstützt er seine Schüler nach Kräften. Und Skinner wird 10 Jahre später ähnliche Erweiterungen an seiner eigenen Konzeption vornehmen, zumindest was die „sekundären Verstärker" und das „Imitationslernen" angeht (vgl. unten, Abschnitt )
(b) Sekundäre Verstärker und sekundäre Antriebe aus der Sicht der Hullschen Schule
Voraussetzung für die Entstehung sekundärer Verstärker und Motive ist nach Auffassung Hulls (1943) zunächst eine primäre Verstärkung, bei der eine S-R-Verbindung dadurch entsteht, daß in der Reizsituation S eine Reaktion R unmittelbar zur Reduktion einer Bedürfnisspannung führt. Treten nun andere, neutrale Reize kurz vor der Bedürfnisreduktion auf, so werden sie mit dieser assoziiert, und sind von nun an in der Lage, an die Stelle der eigentlichen Bedürfnisreduktion zu treten. Sie können jetzt ebenfalls als Verstärker für beliebige S-R-Verbindungen wirken. Da sie ihre Verstärkerwirkung erst über einen vorgeschalteten Lernprozeß erwerben, werden sie „sekundäre Verstärker" genannt.
Solche sekundären Verstärker sind nun natürlich, wie die „primären Verstärker", am Aufbau von „antizipatorischen Zielreaktionen" beteiligt, wodurch auch Reizsituationen, die auf dem Weg zu einem sekundären Verstärker auftreten, selber Teile der Zielreaktion auslösen können. Auf diese Weise ausgebildete Gewohnheiten, die sich auf sekundäre Verstärker richten, können auch „sekundäre Motive" genannt werden.
Durch „Liberalisierung" einer Reihe von Annahmen Hulls (vgl. Amsel & Rashotte, 1984) erweitern Dollard und Miller (1950) das Konzept der sekundären Verstärker zu einer Theorie sekundärer Antriebe (secondary drives), die sie direkt mit Freuds Triebkonzept in Beziehung setzen. Sekundäre Triebe entstehen durch Assoziation mit Situationen, in denen biologisch bedingte primäre Antriebe befriedigt (reduziert) werden.
Damit bildet sich im Bereich des sozialen Verhaltens in bezug auf soziale Reizsituationen ein umfassendes Motivsystem heraus, das für alle folgenden Lernprozesse triebäquivalente Funktionen übernimmt. Seine individuellen charakteristischen Eigenschaften können als das interpretiert werden, was gemeinhin als „Persönlichkeit" bezeichnet wird.
Das für eine behavioral ausgerichtete Sozial- und Entwicklungspsychologie
wichtige
Phänomen, daß Individuen ihr Verhalten anderen Individuen anpassen, wenn sie
deren
Verhalten beobachten, ist seit den 40er Jahren endlich auch „rein behavioristisch" zu
erklären:
Miller und Dollard (1941) gehen davon aus (wie später auch Skinner, 1953), daß die Auftretenshäufigkeit imitierten Verhaltens deshalb steigt, weil das nachahmende Individuum wie das Modell für sein Verhalten verstärkt wird. (Die experimentellen Designs sind zunächst so angelegt, daß imitierende Individuen dieselben Auswirkungen ihres Verhaltens erfahren wie ihre „Vorbilder".) Damit wird das Verhalten des Modells zu einem sekundären Verstärker. In jedem Fall entsteht neben der Erhöhung der Auftretenshäufigkeit des konkret imitierten Verhaltens eine generalisierte Tendenz, auch in anderen Situationen ebenfalls zu imitieren (generalisierte Nachahmungstendenz).
Ein Durchbruch in der Erforschung des Modellernens gelingt Mowrer(1960), als er zeigen kann, daß nicht nur die Verstärkung des imitierten Verhaltens beim Nachahmenden Verstärkerwirkung hat, sondern auch das alleinige Beobachten einer Verstärkung des Modells (vicarious reinforcement). Hier setzen Bandura und Walters in ihrem bekannten Experiment mit Vorschulkindern an, und sie kommen zu dem Schluß, daß es sowohl von den Verhaltenskonsequenzen für das Modell als auch von den Konsequenzen für den Nachahmer abhängt, ob das beobachtete Verhalten gezeigt wird oder nicht (vgl. Bandura & Walters, 1963).
Bei aller Animosität gegen die Rolle der Psychoanalyse bei den Hullianern, kommt Skinner im Laufe der Zeit nicht umhin, gerade die eben vorgestellten Konzepte der „sekundären Verstärkung" und des „Imitationslernens" an sein System zu adaptieren. Wie dies geschieht, wird im nächsten Abschnitt skizziert.
6.4.3 Sozialpsychologische Forschungsprogramme
(1) Beispiel: „Gruppenverhalten" - „Kooperation", „Führung"; und „Wettbewerb"
In einem seiner klassischen Vorlesungsexperimenten demonstriert Skinner, wie soziale Phänomene experimentell erzeugt, untersucht und verstärkungstheoretisch interpretiert werden können (vgl. Skinner, 1962):
![]() |
|---|
Zwei Tauben lernen, zunächst einzeln, herauszufinden, auf welche von drei Scheiben sie picken müssen, um Futter zu erhalten. In dieser Vorphase des Experiments wird nach jeder Verstärkung die „richtige" Scheibe gewechselt, so daß als operantes Verhalten das möglichst schnelle „Durchprobieren" aller drei Scheiben gelernt wird.
Nun werden beide Tauben in zwei gleiche Boxen gesetzt, die durch eine Glasscheibe voneinander getrennt sind (vgl Abb. 6.6) Futter gibt es nun nur, wenn beide Tauben innerhalb einer bestimmten Zeitspanne auf die „richtige" Scheibe picken. Gelingt ihnen dies, so wird die Zeitspanne sukzessive bis auf 0,1 Sekunde verkürzt, so daß nun nur noch (quasi) „gleichzeitiges" Picken auf dieselbe Scheibe verstärkt wird. Es bleibt dabei, daß die jeweils „richtige" Scheibe unsystematisch wechselt.
Die wichtigsten Ergebnisse:
1. Die beiden Tauben beginnen, ihr Verhalten aneinander anzugleichen und ihre „Versuche" weitgehend synchron auszuführen.
2. Es entwickelt sich eine „Führungsbeziehung", die daran zu erkennen ist, daß eine der beiden stets zuerst agiert (z.B. eine Scheibe auswählt und einen Pickversuch macht), während die andere in ihrem Verhalten unmittelbar (innerhalb 1/10 Sekunde!) „nachzieht".
3. Nachahmung findet nicht nur beim Picken auf die Scheibe statt, sondern sie wird auch auf viele andere Verhaltensweisen der beiden Tauben generalisiert: trinken, explorieren, hin und her hüpfen treten ebenfalls spiegelbildlich auf.
Experiment 2:
![]() |
|---|
Unabhängig voneinander lernen zwei Tauben zunächst, einen Ball mit dem Schnabel über eine „Tischplatte" auf die andere Seite zu befördern. Sie werden mit Futter verstärkt, wenn der Ball auf der gegenüberliegenden Seite in eine Rinne fällt (vgl. Abb. 6.7).
Dann werden zwei Tauben mit der gleichen Fähigkeit einander gegenübergestellt. Sie versuchen nun den Ball hin und her zu spielen, da ja nur ein „Treffer" auf der gegenüberliegenden Seite zur Verstärkung führt.
Zeigt sich aber eine von ihnen dauerhaft „überlegen", so beendet die andere bald das Spiel, denn ihr operantes Verhalten wird gelöscht.
Die Ergebnisse der beiden Experimente werden von Skinner in folgender Weise interpretiert:
• „Kooperation" läßt sich operational und in Begriffen der Theorie des operanten Konditionierens definieren als die zeitliche Abstimmung operanter Reaktionen von zwei oder mehr Individuen in einer sozialen Situation, die das Auftreten aller Reaktionen verlangt, damit alle verstärkt werden können.
• „Führung" entsteht, wenn die operanten Reaktionen eines Individuums einseitig zu diskriminativen Stimuli für andere Individuen werden, die zur Verstärkung dieser führen.
• Die „Anpassung" durch Nachahmung eines „Anführers" wird zu einer generalisierten Reaktion.
• „Wettbewerb" ist eine besondere Form der Kooperation. Er entsteht zwischen zwei Individuen, wenn das Verhalten beider für die Verstärkung eines jeden von Ihnen nötig ist, wenn aber nur eines von ihnen verstärkt werden kann. Tritt eine Situation ein, in der nur noch ein Individuum Verstärker erhält, so wird beim anderen die operante (Spiel-) Reaktion gelöscht. Die Kooperation und der gesamte Wettbewerb gehen damit zu Ende.
Einige Vertreter der Hullschen Schule (z.B. Sears 1951; Adams & Romney, 1959) versuchen die komplexen Vorgänge der Interaktion einer S-R-Analyse auf dem Hintergrund ihrer Theorie zu unterziehen. Grundprinzip ist hier die „reziproke Verstärkung", wobei angenommen wird, daß z.B. in einer Dyade die Reaktion des einen stets Verstärker und diskriminativer Reiz für den anderen Interaktionspartner sein kann, wodurch es zu miteinander verschränkten Reiz-Reaktions-Ketten kommt.
Adams & Romney (1959) versuchen „Einflußverhältnisse" zu beschreiben, die durch „Autorität" geprägt sind. Eine Person beginnt eine andere zu dominieren, und es entwickelt sich mit der Zeit ein generalisiertes „Autoritätsverhältnis". Dies kann exemplarisch in folgender Weise geschehen: Eine Person A hat Durst und fordert eine zweite Person B auf, ihr Wasser zu geben, was diese sofort tut:
![]() |
|---|
Abb. 6.8: Interaktionsanalyse - Gegenseitiges Verstärken zweier Personen: Person B verstärkt durch ihr Verhalten („gibt Wasser") die Assoziation A1 von Person A; Person A verstärkt durch ihr Verhalten („Danke") die Assoziation B1 von Person B (nach: Adams & Romney, 1959).
1. Ziel behavioristischer sozialpsychologischer Forschungsprogramme ist es, soziales Verhalten in Abhängigkeit von sozialen Situationen zu beschreiben und zu erklären.
2. Prinzipiell wird versucht, soziale Prozesse als Lernprozesse bzw. als Ergebnisse von Lernprozessen aufzufassen.
3. In sozialen Situationen und bei sozialem Verhalten gelten dieselben Lerngesetzmäßigkeiten wie in anderen Lernsituationen.
4. Soziales Verhalten, Interaktion wie auch Gruppenverhalten, wird stets „aus dem Individuum" heraus erklärt; d.h. alle Veränderungen in sozialen Prozessen werden auf Veränderungen in den Lernprozessen der einzelnen beteiligten Individuen zurückgeführt. Jedes soziale Verhalten ist aus dem Verhalten der Einzelnen erklärbar. In diesem Sinne ist behavioristische Sozialpsychologie reduktionistisch.
6.4.4 Entwicklungs- und persönlichkeitspsychologische Forschungsprogramme
(1) „Entwicklung" und „Persönlichkeit" aus behavioristischer Sicht
Ähnlich wie in der Sozialpsychologie gehen behavioristische Forschungsprogramme der Entwicklungs- und Persönlichkeitspsychologie von drei Kernannahmen aus:
1. Individuelle „Eigenschaften" und interindividuelle Unterschiede der „Persönlichkeit" sind in ihrer Substanz auf Eigenschaften bzw. Unterschiede im Verhalten in bestimmten Situationen zurückzuführen.
2. „Entwicklung" resultiert aus Lernprozessen, die durch Umgebungseinflüsse hervorgerufen werden. Sie ist der dynamische Entstehungsprozeß der Persönlichkeit. Als grundlegende Lernprozesse werden ausschließlich die behavioristischen Lernprinzipien (oder deren Derivate) akzeptiert.
3. Forschungsmethodisch haben alle entwicklungs- und persönlichkeitspsychologischen Forschungsprogramme die Hauptkriterien der experimentellen Objektivität und Reproduzierbarkeit zu realisieren.
Als Beispiele einflußreicher Theorien und Forschungsprogramme wären zu nennen:
• Sears´ Theorie der Abhängigkeit, Aggression und Identifikation (vgl. Sears, u.a. 1953)
• Skinners Persönlichkeits- und Entwicklungstheorie des Operanten Lernens (vgl. Skinner, 1974b)
• Bijou und Bears funktionale Verhaltensanalyse kindlicher Entwicklung (vgl. Bijou & Bear, 1978)
Am Beispiel des Forschungsprogramms von Sears aus der Hullschen Tradition sollen die typische Argumentationsweise und die Forschungsmethodik vorgestellt werden.
(2) Sears´ Untersuchungen zum sozialisierenden Einfluß von „Erziehungsstilen"
• Verhalten wird in bestimmten (Reiz-)Situationen angestoßen durch biologische (primäre) Bedürfnisse. Führt es dann zur Reduktion dieser Bedürfnisse, so kommt es zu einer Verbindung dieser Situation mit diesem Verhalten (das grundlegende S-R-Konzept Hulls).
• Andere Reize, die mit einer solchen primären Bedürfnisreduktion zusammen auftreten, können selber berdürfnisartige Funktionen erfüllen, ihre Herbeiführung kann also ebenso verhaltensverstärkend sein wie die primäre Bedürfnisreduktion (secondary-drive-Theorie von Hull, Dollard und Miller).
• Wird eine primäre oder sekundäre Bedürfnisreduktion verhindert, so kann es zu aggressivem Verhalten kommen (Frustrations-Aggressions-Hypothese von Dollard, Doob, Miller, Mowrer und Sears, 1939).
Auf diesem Hintergrund untersucht Sears nun die Beziehungen zwischen dem gewohnheitsmäßigen Verhalten von Kindern und den Eigenschaften des Elternverhaltens während des Aufwachsens der Kinder („patterns of child rearing"). Haupthypothese Sears´ ist, daß bestimmte Klassen von Elternverhalten („Erziehungsstile") gesetzmäßig zu typischen generalisierten Verhaltensweisen bei den Kindern führen. (Vgl. Sears u.a. 1953; Sears, Maccoby & Levin, 1957; Sears, 1961)
Schwerpunkte der Untersuchungen sind die kindlichen Verhaltensbereiche „Abhängigkeit" und „Aggressivität". Kindliches Verhalten ist zunächst instrumentell auf die Befriedigung seiner Bedürfnisse gerichtet. Während der Sozialisation des Kindes wird sein Verhalten seiner sozialen Umgebung angepaßt, was im Kontext dyadischer Interaktionen abläuft. Emotionale Abhängigkeit entwickelt sich hier als sekundäres Motiv aus der Anwesenheit der Pflegeperson (Mutter) bei der Befriedigung primärer Bedürfnisse, Aggressivität aus der unvermeidlichen Frustration solcher Bedürfnisse während des Sozialisationsprozesses. Dabei werden diesbezügliche Verhaltens-„Gewohnheiten" immer stabiler, und es bilden sich generalisierte Verhaltensweisen und -tendenzen im Ungang mit Aggressionen aus.
In einer Untersuchung versucht Sears (1961) Zusammenhänge zu finden zwischen den frühkindlichen Erfahrungen und dem Umgang mit Aggressionen in der mittleren Kindheit. Dazu untersucht er in einer Langzeitstudie 76 Jungen und 84 Mädchen mit ihren Müttern. Als die Kinder 5 Jahre alt waren, hatte er die Mütter nach ihren Einstellungen zur Erziehung, nach ihrem Pflegeverhalten und nach ihrem Umgang mit aggressivem Verhalten ihrer Kinder befragt. Es wurden mehrere Variablen des mütterlichen Erziehungsstils identifiziert, z.B.: Permissivität bei kindlichen Aggressionen, allgemeine Permissivität, Bestrafung von Aggressionen, Bestrafungsstärke, physische Bestrafung, Liebesentzug, mütterliche Wärme.
Im Alter von 11 bis 12 Jahren werden nun die Kinder selber mit Hilfe eines Aggressionsfragebogens befragt. Dieser enthält die vier Dimensionen: Aggressionsangst (z.B. Item: „Ich fühle mich unwohl, wenn ich Freunde miteinander kämpfen sehe."), projizierte Aggression („Es gibt so viele böse Menschen auf der Welt ... „), Selbstaggression („Manchmal denke ich daran, mich umzubringen"), prosoziale Aggression („Wenn jemand eine Vorschrift verletzt, solle er hart bestraft werden."), antisoziale Aggression („Manchmal läßt sich ein Streit nur mit roher Gewalt beenden.").
Einige wichtige Ergebnisse:
• Es ergeben sich bei den 11- bis12jährigen signifikante Geschlechtsunterschiede im Umgang mit Aggressionen: Jungen äußern mehr antisoziale Aggression, Mädchen mehr Aggressionsangst und prosoziale Aggression.
Darüber hinaus findet Sears die folgenden (nicht immer „hochsignifikanten") Zusammenhänge:
• Mütterliche Permissivität korreliert bei Jungen mit erhöhter antisozialer Aggression.
• Die Stärke der mütterlichen Bestrafung korreliert bei Mädchen positiv mit der Aggressionsangst und mit prosozialer Aggression.
• Liebesentzug als mütterliche Disziplinierungstechnik reduziert bei Mädchen die Selbstaggression, erhöht sie aber bei Jungen. Bei diesen korreliert sie auch positiv mit projizierter Aggression.
6.5 Behavioristisch-lernpsychologische Prinzipien in der Klinischen und Pädagogischen Psychologie
6.5.1 Die „systematische Desensibilisierung" der klassischen Verhaltenstherapie
Nachdem es Mary Jones 1924 im Anschluß an das Watson/Rayner-Experiment in mehreren Fällen gelungen ist, Kinderphobien durch Anwendung Klassischer Konditionierung zu beseitigen (vgl. Jones, 1924a, 1924b), tritt eine 30jährige Pause ein, bis der Südafrikaner Joseph Wolpe damit beginnt, systematische Experimente zur Erzeugung und Beseitigung (phobischer) Neurosen durchzuführen (vgl. Wolpe, 1958). Verschiedene Autoren sehen die Ursache hierfür in der traditionellen Abstinenz der Psychologen von klinischen Problemstellungen und klinischer Praxis, die sie weitgehend den medizinischen Fakultäten überlassen (vgl. Ullmann & Krasner, 1969; Gordon, 1984). Wolpe faßt seine Arbeiten in dem Buch „Psychotherapy by Reciprocal Inhibition" (1958) zusammen und wird damit zum Gründer einer ganzen klinisch-psychologischen Grundrichtung, die, erweitert zur „kognitiven Verhaltenstherapie", bis heute Bestand hat.
Wie schon Watson, interpretiert Wolpe eine Neurose als Verhaltensstörung, bei der bestimmte Stimuli „falsche", also unerwünschte Reaktionen auslösen. Kernannahme seines Verfahrens ist nun, daß die Wirkung solcher Stimuli durch die Anwendung lerntheoretischer Prinzipien beseitigt werden könne. Da die häufigsten von ihm untersuchten Fehlreaktionen Ängste sind, entwickelt er auf der Grundlage des Pawlowschen Klassischen Konditionierens, der Hullschen Lerntheorie sowie den von Mowrer (1939) und N.E. Miller (1948) entwickelten Prinzipien des Vermeidungslernens seine Technik der „systematischen Desensibilisierung":
Nun beginnt die eigentliche Übungsphase, in der zunächst die Vorstellungen der Angsthierarchie einzeln, „von unten nach oben" abgearbeitet werden. Der Patient soll sich zunächst entspannen und sich dann eine angstauslösende Situation vorstellen, was solange wiederholt wird, bis die Angst bezüglich dieser Situation verschwunden ist. Ergänzt wird diese Technik dann durch Verhaltensübungen, indem z.B. kritische Situationen im Rollenspiel simuliert oder in der Realität systematisch aufgesucht werden.
Wolpe erklärt seine recht wirksame therapeutische Technik als „reziproke Hemmung" (später mit dem Begriff „Gegenkonditionierung"), die darin besteht, daß ein mit Angst unvereinbares Verhalten (Entspannung) systematisch mit der angstauslösenden Situation assoziiert wird. Die von der Situation ausgelöste Angstreaktion wird so ständig schwächer. Daß die Desensibilisierung über Vorstellungen funktioniert, liegt daran, daß diese (im Sinne Hulls „intervenierender Variablen") stets als Bindeglied zwischen dem Stimulus und der Reaktion angeordnet sind. Löscht man die Wirkung dieses Bindeglieds, so wird auch die Stärke der Reaktion reduziert. Dazu kommt, daß die systematische Konfrontation mit den Angstreizen eine Verhaltenstendez löscht, die in der Regel die Angstreaktionen aufrechterhält: das Vermeidungsverhalten. Nach Mowrer (1939) und N.E. Miller (1948) verstärkt nämlich die Verminderung eines Angstreizes durch Vermeidung eben jene Vermeidungsreaktion. Durch Vermeidung des Angstreizes wird aber dessen Löschung unterbunden, so daß die Phobie, sozusagen als „Selbstläufer", immer weiterbesteht und sich sogar durch Generalisierung auf immer mehr Reizetypen ausdehnen kann.
6.5.2 „Verhaltensmodifikation" durch planmäßige Veränderung von Verstärkungskontingenzen
Auch Skinner und seine Schüler (z.B. Aylon, Azrin, Bear, Hall, Wolf) versuchen seit den 50er Jahren, ihre Lerntheorie für die Bewältigung klinischer Probleme nutzbar zu machen.
Ausgangspunkt der Technik operanter Verhaltensmodifikation ist die Annahme, daß jedes unerwünschte Verhalten im sozialen Kontext durch Verstärker aufrecht erhalten werde. Die Analyse einer Verhaltensstörung hat deshalb damit zu beginnen, daß die einzelnen Verhaltensepisoden auf ihre unmittelbaren Konsequenzen in der sozialen Umgebung untersucht werden müssen.
Um „Fehlverhalten" zu modifizieren, gibt es dann grundsätzlich zwei Möglichkeiten: man schaltet die (meist unbeabsichtigten) Verstärker aus und/oder man veranlaßt das Entstehen alternativen Verhaltens, welches man systematisch verstärkt. Als Verstärker dienen systematisch eingesetzte soziale Verstärker (demonstrative Zuwendung, Lob) oder auch sogenannte „tokens". Dies sind symbolische Gegenstände (Chips, Kärtchen oder auch nur „Striche" auf einer Liste), die nachher gegen „echte" Verstärker (Süßigkeiten, bestimmte Privilegien usw.) eingetauscht werden können.
Die Skinnerianer behandeln bald nicht nur klinische Störungen (Autoaggression, Autismus, Hyperaktivität), sondern wenden sich auch „einfachen" Schulstörungen zu (z.B. Aufmerksamkeitsschwächen, unkooperatives Verhalten). Sie sind dabei so erfolgreich, daß ihre Verfahren im Bereich der Pädagogischen Psychologie immer intensiver für die Beeinflussung von Schülerverhalten genutzt werden. Es kommt zu einem regelrechten Boom bei der Anwendung von Prinzipien des operanten Konditionierens im öffentlichen Erziehungssystem der Vereinigten Staaten. Immer mehr Lehrer betreiben „Verhaltensanalyse", stellen „Verstärkungspläne" auf, betreiben „token-economy" oder löschen durch Steuerung von Kontingenzen „unerwünschtes Verhalten". - Und die Universitäten bedienen diese Nachfrage durch eine wachsende Zahl wissenschaftlich begleiteter Programme.
6.5.3 Der „Programmierte Unterricht"
Der Behaviorismus wird zur Grundlage des Bildungsoptimismus der 60er Jahre. Die 30 Jahre vorher so absurd klingende Aussage Watsons entfaltet nun endlich ihre suggestive Wirkung:
„Gebt mir ein Duzend gesunder, wohlgebildeter Kinder und meine eigene Umwelt, in der ich sie erziehe, und ich garantiere, daß ich jedes nach dem Zufall auswähle und es zu einem Spezialisten in irgendeinem Beruf erziehe, zum Arzt, Richter, Künstler, Kaufmann oder zum Bettler und Dieb, ohne Rücksicht auf seine Begabungen, Neigungen, Fähigkeiten, Anlagen und die Herkunft seiner Vorfahren." (Watson, 1968, Original 1930; S. 123)
Rationalisierung, Automatisierung und Technisierung haben den Industriegesellschaften im wirtschaftlichen Bereich große Erfolge eingetragen, und man erwartet dies nun auch in der Bildung, die als das wichtigste Mittel angesehen wird, noch brachliegende „menschliche Ressourcen" zu erschließen. So trifft Skinners Traum von der Technisierung der Bildung durch Lehrmaschinen auf fruchtbaren Boden.
Seit seinem programmatischen Aufsatz „The science of learning and the art of teaching" (Skinner, 1954), insbesondere aber mit der technischen Konkretisierung in „Teaching machines" (1958) setzt eine 15 Jahre dauernde stürmische Entwicklung automatisierter Lerntechniken ein, die vom „Programmierten Unterricht" mit einfachen mechanischen „Lehrmaschinen" zum „Computer-unterstützten Unterricht" Ende der 60er Jahre führt.
Grundmodell ist dabei das Skinnersche „Lernprogramm", bei dem größere Wissens- und Fertigkeitsbereiche in kleine „Lernschritte" zerlegt sind, die den Lernenden von einer Lehrmaschine sukzessive dargeboten werden (vgl. Skinner & Howland, 1974, Original 1961). In einem Sichtfenster erscheint eine kleine Informationseinheit, die mit einer eng begrenzten Aufgabenstellung abschließt. Nach Beendigung dieser Aufgabe erscheint dann automatisch die Lösung, und es wird angenommen, daß eine Übereinstimmung mit der eigenen Lösung für den Lernenden eine verstärkende Wirkung hat. Skinner sieht die Vorteile dieser Strategie u.a. in folgenden Aspekten (vgl. a.a.O.; S. VII):
• Jeder Schüler bestimmt das eigene Lerntempo selber.
• Aufgrund des kleinschrittigen Vorgehens macht er dabei fast keine Fehler (Lehrprogramme sind durch ständige Revision so optimiert, daß es im Durchschnitt zu höchstens 10% fehlerhaften Reaktionen kommt.)
• Damit ist jeder Lernende, im Unterschied zum herkömmlichen Unterricht ständig aktiv, und er wird für jeden Lernfortschritt zuverlässig verstärkt, was ein Lehrer in einer Lerngruppe kaum realisieren kann.
Die Bemühungen um eine Individualisierung der Lernprozesse führt dazu, daß Crowder (1959) den „linearen" Skinner-Programmen seine Variante verzweigter Programmierung hinzufügt, bei der auf individuelle Fehler hin individuelle „Schleifen" eingefügt werden. Zunächst sind solche Maschinen noch nicht in der Lage, Lernerantworten automatisch semantisch zu analysieren, und sie können deshalb nur auf der Basis von „multiple-choice"-Reaktionen der Lernenden angemessen reagieren. Dies ändert sich beim Einsatz von Computern ab Mitte der 60er Jahre. Nun werden auch „Klartextantworten" auf typische fehlerindizierende Stichworte untersucht, und der Computer ist in der Lage, multimedial komplexe individuelle Hilfestellungen anzubieten (durch Dias, Zusatzinformationen, oder wie bei Crowder, durch das Einschieben zusätzlicher Programmteile) (vgl. Beiner, 1972).
Mit dem Beginn der 70er Jahre beginnt die Euphorie in bezug auf die Automatisierung von Lehr- und Lernprozessen zu verblassen, und bis zum Ende des Jahrzehnts sind fast alle größeren Projekte eingestellt. Dies geschieht insbesondere aus folgenden Gründen (vgl. Eyferth, 1974; Sämmer, 1976):
• Die in vielen Projekten beobachtete anfängliche Effektivitätssteigerung läßt sich nicht über längere Zeit erhalten. Sie scheint eher aus dem Neuigkeitseffekt zu resultieren als aus der Überlegenheit der Methode („Hawthorne-Effekt"). Das Skinnersche Prinzip der kleinen Schritte ist auch mit Computern nicht entscheidend zu verbessern, und es schwächt wegen seiner Monotonie die (ohnehin nur extrinsische) Lernmotivation eher, als daß es sie steigert.
• In der Allgemeinen Didaktik gewinnt die kognitiv orientierte Richtung Bruners („Entdeckendes Lernen") (vgl. Bruner, 1973) immer mehr an Raum. Sie erfordert Interaktions- und Lernformen, die eine Lernmaschine, gleich welcher Art, nicht zu bieten hat. Darüber hinaus beginnt die gesamte Lernpsychologie sich nach der „Kognitiven Wende" von behavioristischen Konzepten abzuwenden. Das behavioristische Paradigma verliert nun sehr schnell an Einfluß.
6.6 Das Paradigma der behavioristischen Psychologie: ein paradigmatisches Subsumptionsmodell behavioristischer Forschungsprogramme
6.6.1 Das behavioristische Subsumptionsmodell
(1) Paradigmatische Basiseinheiten der behavioristischen Psychologie: zentrale Begriffe und Relationen
Der zentrale Forschungsgegenstand der behavioristischen Psychologie ist das Verhalten von Individuen. Darunter sind alle Aktivitäten zu verstehen, die von außen objektiv beobachtbar sind oder durch objektive Beobachtung erschlossen werden können.
(Psychische Phänomene, die nicht durch äußere Beobachtung direkt oder indirekt erfaßbar sind, scheiden als Untersuchungsgegenstände aus.)
Jedes Verhalten eines Individuums wird ausschließlich durch Reize veranlaßt oder in seiner Häufigkeit und Intensität verändert. Als Reize gelten alle äußeren, physikalischen Gegebenheiten, die auf ein Individuum einwirken und sein Verhalten beeinflussen können.
(Rein innerpsychische, „mentalistische" Prozesse können kein Verhalten verursachen oder hervorbringen.)
(2) Paradigmatische Fundamentalgesetze der behavioristischen Psychologie
Gesetzmäßige Verknüpfungen zwischen Reiz und Verhalten: Das allgemeine Reiz-Reaktions-Modell
Jedes Verhalten eines Individuums steht stets mit bestimmten äußeren Reizen, die auf das Individuum einwirken, in einem gesetzmäßigen Zusammenhang. Solche von identifizierbaren Reizen veranlaßten Verhaltensweisen oder Verhaltensbestandteile werden „Reaktionen" genannt.
Damit ist jedes Verhalten erklärbar als gesetzmäßige Verknüpfung von Reizen und Reaktionen, also von Reiz-Reaktions-Verbindungen:

Lernprozesse
Jede bestehende Reiz-Reaktions-Verbindung kann durch Hinzutreten weiterer Reize dauerhaft verändert werden. Eine solche dauerhafte, durch Reize veranlaßte Veränderung eines bestehenden Zusammenhangs zwischen Reizen und Reaktionen wird Lernen genannt.
(3) Die paradigmatische Methodologie der behavioristischen Psychologie
1. Die experimentelle Methodik
Das Experiment mit Menschen und Tieren im Labor wird als das geeignete empirisch-methodische Modell angesehen. Es sind möglichst optimal die folgenden Bedingungen zu erfüllen:
- objektive und quantitative Erfassung aller experimentellen Variablen (der „Reize" und der „Reaktionen"),
- Kontrolle aller Variablen,
- reproduzierbares experimentelles Design.
(Introspektive Methoden werden abgelehnt.)
2. Feldexperimente und Untersuchungen
Die Forschung in komplexen psychologischen Feldern hat sich ebenfalls quantitativer Meßmethoden zu bedienen, die ebenfalls eine objektive Erfassung von Reizumgebungen und des reaktiven Verhaltens erlauben.
Behavioristische Theorien beschreiben die experimentell modellierten Zusammenhänge zwischen der Reizumgebung und dem Verhalten von Individuen. Alle theoretischen Begriffe und Konstrukte haben sich nur auf von außen objektiv beobachtbare oder erschließbare Sachverhalte zu beziehen.
Dabei dürfen auch Prozesse innerhalb eines Organismus angenommen werden, die nicht unmittelbar beobachtbar sind (intervenierende Variable), allerdings unter der Bedingung, daß diesbezügliche Hypothesen durch direkte Beobachtungen von Reizen und Reaktionen quantitativ untersucht werden können. Alle theoretischen Aussagen sind somit stets auf quantitativ operationalisierbare und objektiv erfaßbare Vorgänge bezogen.
(Theoretische Konzepte, die nur introspektiv zugänglich sind („mentalistische" Konzepte) sind zur Theoriebildung abzulehnen.)
(4) Das Menschenbild der behavioristischen Psychologie
Verhalten und Anpassung
Zentraler Gegenstand der behavioristischen Psychologie ist das Verhalten von Menschen und Tieren. Es dient der Anpassung des Lebewesens an seine Umgebung. Jeder dauerhafte Veränderungsprozeß von Verhalten (Lernprozeß) kann als Anpassungsprozeß an äußere Gegebenheiten interpretiert werden.
Das bestehende Verhalten wie auch seine dauerhafte Veränderung sind direkt oder indirekt abhängig von äußeren Reizen, die auf das Individuum einwirken. Jedes Verhalten eines Lebewesens steht damit unter Reizkontrolle.
(In diesem Sinne ist Verhalten nicht „autonom".)
Wirkursachen
Jedes Verhalten ist das Resultat initiierender Ereignisse. Sein Zustandekommen kann als Wirkung vorausgehender Ursachen aufgefaßt werden (causa efficiens).
Verhalten und seine Veränderungen sind Ergebnis kontinuierlicher Veränderungen. Neues Verhalten baut stets ohne Bruch auf vorhandenem auf; es kann nur aus dem vorhandenen Verhaltensrepertoire hervorgehen.
6.6.2 Die Forschungsprogramme der behavioristischen Psychologie: Attributzuordnungen
Die Untersuchung der Attributzuordnungen in den vier oben beschriebenen grundlegenden Forschungsprogrammen der behavioristischen Psychologie können unter folgenden Aspekten systematisiert werden:
• Welche Gegebenheiten gelten als „Verhalten"?
• Welche Gegebenheiten werden als „Reize" interpretiert?
• In welcher Weise wird die „Verbindung" zwischen Reizen und Reaktionen (das Reiz-Reaktions-Modell) interpretiert?
• Wie werden Lernprozesse beschrieben?
In allen behavioristischen Forschungsprogrammen werden beobachtbare Aktivitäten eines Individuums zur Grundlage der Untersuchung gemacht. Sie werden in Abhängigkeit gesehen von äußeren physikalischen bzw. inneren neurophysiologischen, in jedem Fall aber objektiv erfaßbaren Gegebenheiten, die „Reize" genannt werden.
In den vier behavioristischen Hauptströmungen gibt es dazu folgende Präzisierungen:
Verhalten/Reaktionen: äußere Aktivitäten und innere physiologische Reaktionen
Reize: äußere physikalische Gegebenheiten und innere „propriozeptive" physiologische Vorgänge
Verhalten/Reaktionen: äußeres Verhalten und innere physiologische Prozesse (meßbare „Effektoraktivitäten")
Reize: alle „Affektoraktivitäten" erzeugenden Gegebenheiten, wie äußere physikalische Phänomene, innere „propriozeptive" physiologische Vorgänge sowie insbesondere „triebbedingte" innere Reize
Verhalten/Reaktionen: operante Reaktionen („operants"), also ausschließlich von außen beobachtbare Aktivitäten
Reize: „diskriminative Stimuli", also äußere situative Bedingungen sowie Verhaltenskonsequenzen (z.B. „Verstärker")
Tolman:
Verhalten/Reaktionen: äußere Aktivitäten
Reize: äußere physikalische „Hinweisreize", Situationen, Reizumgebungen, „Signale"
(2) Paradigmatische Fundamentalgesetze: Reiz-Reaktions-Modelle
Guthrie:
Reiz-Reaktions-Modell: Äußere Reize lösen Reaktionen aus, S determiniert R.
S --> R
Reiz Reaktion
Hull:
Reiz-Reaktions-Modell: Äußere Reize S werden mit Reaktionen R assoziiert, und es bilden sich Gewohnheiten SHR. Zwischen S und R werden (als intervenierende Variable) vermittelnde Prozesse angenommen, die einerseits aus einer inneren Affektoraktivität s und andererseits aus einem physiologischen Vorgang, der Effektoraktivität r bestehen, einem inneren physiologischen Korrelat der äußeren Reaktion. Die „eigentliche" Assoziation entsteht zwischen s und r S s r R und konstituiert die Gewohnheit SHR:
S --> RReiz s --> r Reaktion
Affektoraktivität Effektoraktivität
Lernen: Eine dauerhafte Veränderung einer solchen Assoziation oder der Aufbau einer neuen Assoziation findet statt, wenn ein neuer Reiz S* eine Reaktion R nach sich zieht, die zu einer Triebreduktion (Reduktion eines triebbedingten Reizes) führt. In diesem Fall wird die Gewohnheit S*HH verstärkt.
Skinner:
Reiz-Reaktions-Modell: Äußere „diskriminative Reize" s, bilden eine situative Bedingung für das Auftreten (die „Emission") einer operanten Reaktion RO („operant") (kein deterministischer Zusammenhang). Solche operants wiederum ziehen bestimmte Reize S1 als Konsequenzen nach sich („Verhaltenskontingenzen"):
S --> R
diskriminativer Reiz „operant" Verhaltenskonsequenz
Tolman:
Reiz-Reaktions-Modell: Äußere Reize sind „Zeichen", die bestimmte kognitive „Ziel-Mittel-Fertigkeiten" (als intervenierende Variable) aktivieren. Diese führen über ein bestimmtes äußeres Verhalten (dem „Mittel") zur Erreichung eines Ziels:
S --> R
Zeichen --> (Ziel-Mittel-Fertigkeit) --> zum Ziel führendesVerhalten
Lernen: Neue Reize („Zeichen"), also äußere situative
Bedingungen verursachen zunächst eine
Veränderung der Ziel-Mittel-Fertigkeit (z.B. bei den kognitiven Landkarten als
Bestandteile
dieser Fertigkeit). Diese wiederum führen zu einer Veränderung des Verhaltens,
so daß sich
insgesamt ein neuer Zusammenhang zwischen den äußeren Reizen und dem darauf
folgenden
Verhalten ergibt.
|
|