Wie in der Definition zu 'Verhalten' 3.1 beschrieben wurde, besteht 'beobachtbares' Verhalten im Kern in einer Folge von Reiz-Reaktions-Paaren (Stimulus-Response, s-r) der Art
. Schaut man sich den Artikel von Tolman 1948 [425] an, dann wird man aber nirgendwo solch eine explizite Folge von Reiz-Reaktions-Paaren finden. Was man stattdessen findet, das ist eine Beschreibung einer Versuchsumgebung
(unten 'Welt' genannt), und dann die 'Reaktionen'
der Ratte in dieser Umgebung
. Dies rührt daher, dass die Angabe der genauen Reize
, die 'tatsächlich' das biologische System stimulieren, bei biologischen Systemen eine eigenständige Forschungsaufgabe ist. Eine Versuchsumgebung
besteht in der empirischen Welt gewöhnlich aus einer großen Fülle von 'Eigenschaften' ('properties')
, und welche dieser Eigenschaften - nennen wir sie
- dann tatsächlich auf ein bestimmtes
biologisches System
als 'Reize'
einwirken, das hängt primär von den 'Sensoren' des Systems ab, sekundär aber auch von der 'Verhaltensfunktion'! Um diese Menge
bestimmen zu können, muss man eigene 'Wahrnehmungsexperimente' durchführen, um herauszufinden, auf welche Umgebungseigenschaften
ein bestimmtes System
überhaupt reagieren kann, und auf welche nicht. Hat man diese Aufgabe erledigt, dann kann man sich bei der Darstellung der Versuchsumgebung
auf jene Eigenschaftsmengen
beschränken, die das Versuchstier tatsächlich wahrnehmen kann, und dann könnte man mit Bezug auf eine aktuelle 'Position'
des Versuchstiers
in einer Umgebung
jeweils sagen, welcher 'Reiz'
bei dieser Position des Versuchstier
vorlag.
Aber selbst dann, wenn Verhaltensforscher das potentielle Reizfeld eines Versuchstiers geklärt haben, werden sie normalerweise dennoch immer die komplette Versuchsumgebung angeben und nicht nur die daraus resultierende Folge von Reizen. Mithilfe der zuvor vorgenommenen Klärung der potentiellen Reize kann man diese Reizfolge bei Vorlage der Versuchsumgebung und der jeweiligen Versuchstiere 'heraus rechnen'.
Im Falle von Computersimulationen und unter Benutzung expliziter formaler Theorien kann man die Versuchsumgebung explizit angeben und mittels einer eigenen Schnittstellenfunktion
(vgl. die Definition von 'Welt' 3.3) für jedes beteiligte Versuchstier
automatisch berechnen lassen, welches die Reizmenge
für dieses Versuchstier an einer bestimmten Position
in der Welt
ist. Dies bedeutet, man bekommt automatisch nicht nur die Versuchsumgebung
geliefert, sondern auch genau den Reiz
, den das Versuchstier an dieser Position 'wahrnimmt'. Dadurch lässt sich direkt eine Zuordnung zur zeitlich nächsten Aktion
dieses Versuchstiers als Reiz-Reaktions-Paar
herstellen. Allerdings folgt daraus nicht, dass die beobachtbare Aktion
eine direkte 'Reaktion' auf den beobachtbaren Reiz
darstellt. Dies hängt mit der grundlegenden Struktur eines 'lernenden' Systems zusammen (vgl. den Abschnitt 2.3). Ein lernendes System
verfügt ja nach
Annahme über interne Zustände
, die durch die Verhaltensfunktion
geändert werden können. Dies schließt 'Erinnerungen' mit ein. Es kann also sein, dass eine aktuelle Aktion
im Reiz-Reaktions-Paar
deswegen auf den aktuellen Reiz
reagiert, weil diesem viel früher andere Reiz-Reaktions-Paare vorausgegangen sind, die erst jetzt eine 'Wirkung' entfalten.
Im Falle der Tolman-Experimente bedeutet dies, dass der jeweilige aktuelle Reize an einer Verzweigung in der Versuchsumgebung Labyrinth nach der 'Interpretation' der Forscher zu Beginn mit keiner 'Erinnerung' korreliert. Nach immer mehr Wiederholungen der Experimente sammeln sich aber 'Erinnerungen' an, d.h. zu einem bestimmten Reiz
gibt es 'Erinnerungen' der Art, dass es zu einem Reiz
eine Reaktion
gibt und zusätzlich eine Art 'Bewertung' mit Bezug auf ein mögliches Ziel. Die Menge solcher 'erinnerbaren'
-Paare mit Bewertungen könnte man dann eventuell als mögliches Korrelat des theoretischen Begriffs 'Gedankliche Karte' ('cognitive map') ansehen.
Gerd Doeben-Henisch 2014-01-14