Aufgabe

Laut der Definition von 'Aufgabe' (vgl. 3.2) besteht eine Aufgabe aus einer Menge von Zuständen $TASK$, mit den Teilmengen $START, GOAL, MEDIAN$, so dass es zwischen $START$ und $GOAL$ mindestens einen 'Lösungspfad' gibt.

Im Fall der Tolman-Experimente war der Zielzustand $g \in GOAL$ immer ein Zustand, in dem die Ratte entweder 'Futter' ('food') oder 'Wasser' ('water') finden konnte (Vereinfachend betrachten wir im Folgenden immer nur den Fall 'Futter'). Der Startzustand $s \in START$ war eine Position im Labyrinth ohne Futter bzw. Wasser; meistens war es der Eingang. In allen Experimenten war die Menge der Zwischenzustände $MEDIAN$ nicht leer, d.h. es gab immer ein paar Positionen im Labyrinth, die durchlaufen werden mussten, um zu einem Zielzustand zu kommen. In den meisten Versuchen gab es wenigstens einen Zielzustand und wenigstens einen 'Lösungsweg' zum Zielzustand. In manchen Versuchen gab es keinen Zielzustand, da das Futter (bzw. das Wasser) erst nach mehreren Versuchen an einer Position im Labyrinth platziert wurde. Dies bedeutet, dass die 'Lernsituation' zu verschiedenen Zeitpunkten 'unterschiedlich' war und das Versuchssystem sich eine mögliche 'Lösung' aus verschiedenen Lernsituationen 'zusammen setzen musste'.

Zusätzlich gab es weitere 'Parameter' (letztlich Eigenschaften entweder der Welt $W$, $P_{W}$ oder des Versuchssystems $ S$, $P_{S}$), die Begleitumstände der Aufgabe charakterisierten.

  1. Futter Entzug: Die Versuchssysteme hatten vor dem Experiment eine definierte Zeit lang kein Futter mehr bekommen, um einen gewissen 'Hunger' hervor zu rufen. Nennen wir ein 'Bedürfnis' $\delta$, dann sollte das Bedürfnis als kleiner als ein gewisser Schwellwert $\theta$ sein.
  2. Ereignisabstand: Zwischen jedem Experiment lag ein gewisser zeitlicher Abstand $TD=t-t', t>t'$. Tolman gibt in der Regel an $TD=24h$ In einzelnen Experimenten aber auch $TD=7d$ ('d' := 'days').
  3. Vermeidung: Es gibt spezielle Eigenschaften $P^{-}$ der Versuchsumgebung, die bei ihrem Auftreten dazu führen, dass die Versuchssystem von da ab versuchen, Zustände mit solchen Eigenschaften zu meiden. Ein solches Vermeidungsverhalten kann zu weitgehenden 'Blockaden' im Verhalten führen.
  4. Markante Eigenschaft: Der Weg zu einem Zielzustand geht über mehrere Zustände, wobei jeder Zustand mehr als jeweils eine Eigenschaft $P$ besitzt. Unter der Gesamtheit aller Eigenschaften $P$ der Versuchsumgebung gibt es eine Teilmenge von Eigenschaften $P^{+}$ (z.B. bestimmte visuelle Markierungen), die immer zum Ziel führen, während andere Eigenschaften $P^{0}$ (z.B. die Abfolge der Zustände ) variieren können.
  5. Lerngeschichte: Versuchssysteme, die schon diverse Dinge erlebt haben, verfügen über andere Voraussetzungen als jene, die 'neu' sind.

Gerd Doeben-Henisch 2014-01-14