Anforderungsanalyse

Im Folgenden soll jetzt schrittweise ermittelt werden, was sich aus dieser Aufgabenstellung an konkreten Anforderungen ergibt. Ausgehend davon soll dann ein Lösungsmodell für eine mögliche Simulation erarbeitet werden.

Aktionen

  1. Grundsätzlich soll es Handlungen $a$ geben, die den Zustand eines Systems 'verbessern' oder 'verschlechtern' können: andere sind 'neutral'.
  2. Handlungen sind individuell besser oder schlechter relativ zu einem Zustand des Systems (z.B. Energie), oder global relativ zum Zustand der Population (z.B. Nachkommen).
  3. Die Herausforderung besteht darin, in einer begrenzten Zeit individuell genügend 'Energie' zu finden, um zu leben, und während dieser Zeit 'Nachkommen' hervorzubringen, die auch überlebensfähig sind. Letzteres ist nicht trivial, falls die Welt sich ändert. Zur Erzeugung von Nachkommen müssen zwei Akteure unterschiedlichen Geschlechts sich befristet zu einer Fortpflanzung verbünden.
  4. Erhöhung der individuellen Energie $IS_{Energy}$ ist 'positiv'. Nachkommen durch Paarung erzeugen $IS_{Sex}$ ist 'positiv'.
  5. Im Gegensatz zu einem klassischen genetischen Algorithmus werden die Mitglieder einer Population nicht ' automatisch' bewertet und 'selektiert', sondern die Bewertung von Aktionen geschieht 'intrinsisch' in den Systemen und Nachkommen entstehen nur dann, wenn der Mechanismus der 'Paarung' funktioniert.
  6. Eine Population stirbt entweder aus, weil es zu wenig Nachkommen gibt, oder sie überlebt bzw. vermehrt sich.

Damit die oben aufgestellten Forderungen umgesetzt werden können, wird eine Welt $W$ benötigt, die die entsprechenden Möglichkeiten bietet.

Welt

  1. Es muss in der Welt Zustände geben, die im Input eines Akteurs (i) die Energie erhöhen und (ii) es muss hinreichend viele Akteure mit unterschiedlichem Geschlecht geben.
  2. Es muss also Objekte geben, die Energie übermitteln $OBJ_{Energy} \subseteq OBJ$, und diese müssen mindestens eine Eigenschaft haben, anhand deren man sie von anderen unterscheiden kann $p_{energy} \in prop(o_{energy}) \& o_{energy \in OBJ_{ENERGY}}$.
  3. Bei den Objekten, die Akteure $ S$ sind, muss es mindestens eine Eigenschaft geben, anhand deren man ihre ' Geschlecht' erkennen kann: $(p_{m} \vee p_{f}) \in prop(s \in S)$.
  4. In einer 'partiell monotonen' Welt sind alle Objekte 'statisch' außer den Akteuren $ S$. Akteure können ihre Position ändern und damit ihre Relation zu den statischen Objekten.
  5. Es wird ein zweidimensionales Feld $POS \subseteq X \times Y$ angenommen mit jeweils einem Objekt auf einer Position.
  6. Es gibt dann folgende Art von Objekten: Freie Fläche ohne Energie $OBJ_{Floor} \subseteq OBJ$; Objekte die Energie übermitteln $OBJ_{Energy} \subseteq OBJ$; Objekte, die Akteure $ S$ sind mit zwei verschiedenen Geschlechtern $S_{m}, S_{f}$.
  7. Wenn ein Akteur sich 'neben' einem Objekt befindet das Energie abgibt und er führt eine Aktion 'Essen' aus, dann wird sein Energiehaushalt erhöht: $a_{Eat} \in O \mapsto s \in I \wedge IS_{Energy}++$.
  8. Wenn sich zwei Akteure unterschiedlichen Geschlechts begegnen (d.h. sich 'sehen'), dann steigt der Lustpegel an $IS_{Sex}+1$. Kommt es zu einer Kooperation $a_{Sex} \in O$, dann ist der Lustpegel maximal $IS_{Sex}+2$. Danach fällt er wieder ab $IS_{Sex}=0$. Für eine festgelegte Zeit ist ein Geschlecht dann 'schwanger' $IS_{Birth}=1$, bis es zur Geburt eines neuen Akteurs kommt $IS_{Birth}=2 \mapsto IS_{Birth}=0$. Ein Akteur, der schwanger ist, kooperiert nicht.

Nach der bisherigen Beschreibung des Verhaltens der Akteure in der partiell monotonen Welt stellt sich die Frage, nach dem Lernen. Was sollen die Akteure lernen können? Mann könnte sie (i) rein zufällig agieren lassen, (ii) ganz und gar deterministisch, oder eben (iii) mit Lernen.

Die 'zufällige' Variante sollte man auf jeden Fall als 'Benchmark' realisieren. Die 'deterministische' Variante ist nur von begrenztem Interesse. Aber welche Art von Lernen ist interessant?

Lernen

  1. Ganz allgemein beginnt Lernen dort, wo ein Akteur in der Lage ist, auf einen Stimulus $s \in I$ ab einem bestimmten Zeitpunkt $t$ mit einer neuen Aktion $a \in O$ zu 'antworten', die dann für eine gewisse Zeit 'stabil' bleibt. Dies setzt voraus, dass die 'Verbindung' zwischen einem Stimulus $s$ und einer Antwort $a$ 'intern' 'verwaltet' wird. Bei der Verhaltensfunktion $\phi : Shape \cup PROP \times I \times IS \mapsto IS \times O \times Shape \cup PROP$ würde man also annehmen, dass es interne Zustände $IS_{mem} \subseteq IS$ gibt, die für diese Verbindung wichtig sind, die sich ändern lassen.
  2. Im Falle der Energieaufnahme wäre es von Vorteil, wenn ein Akteur wenigstens lernen würde, die Energieobjekte anhand ihrer charakteristischen Eigenschaften $p_{energy} \in prop(o_{Energy})$ zu 'identifizieren'.
  3. Im Falle einer Kooperation zum Zwecke der Fortpflanzung muss ein Akteur $S_{i}$ mindestens lernen, einen anderen Akteur anhand der charakteristischen Eigenschaft $p_{m \cup f} \in prop(S_{i})$ zu erkennen und dann, welche Aktion zum entsprechenden Lustgewinn führt.
  4. Alle diese 'Lernaufgaben' erfordern im Prinzip eine Art 'Gedächtnis', um 'Beziehungen' ablegen und bewerten zu können (Wahrnehmung eines Objektes z.B. als $perc: I \mapsto O \times I \times IS_{Energy,Sex}$).
  5. Sobald ein Agent gelernt hat, die verschiedenen Objekte anhand bestimmter charakteristischer Eigenschaften zu unterscheiden und er weiß, welche Aktionen zum 'Vorteil' (Energie, Lust $\mapsto$ Nachkommen) führen, kann er mit weniger Aktionen und in kürzerer Zeit Energie finden bzw. Nachkommen erzeugen.
  6. Im Falle der 'Erzeugung von Nachkommen' muss die Beziehung zwischen 'Genotyp' und 'Phänotyp' für einen Erzeugungsprozess (Wachstum) festgelegt werden (genotyp als 'Bauplan' als binärer String und Phänotyp als handelnde Struktur.
  7. Im Falle der 'Erzeugung von Nachkommen' werden auf die beiden Genome die üblichen genetischen Operatoren angewendet.

Akteure können sich nach den bisherigen Anforderungen immer besser in der Welt bewegen, Energie finden und mit anderen Akteuren für die Erzeugung von Nachkommen kooperieren. Dies alles geschieht ohne Zeichengebrauch. Laut Aufgabenstellung soll der Zeichengebrauch aber so sein, dass er Vorteile bereitet für das Gewinnen von Energie und für die Nachkommen. Wie kann das sein?

Zeichen als Benennung von Etwas

  1. Wir gehen hier davon aus, dass ein Zeichen dann vorliegt, wenn es ein 'Zeichenmaterial' gibt $OBJ_{SM} \subseteq OBJ$, das über eine 'in einem Akteur realisierte Beziehung' assoziiert ist mit irgendwelchen anderen 'Repräsentationen im Akteur' $IS_{SMDEN} \subseteq IS$. Diese Repräsentationen $IS_{SMDEN}$ heißen hier 'Denotate' bzw. die 'Bedeutung' des Zeichens. Wenn eine Repräsentation $r_{smden} \in IS_{SMDEN}$ einen 'Bezug zu einem Input' aufweisen kann, dann sprechen wir von einer 'realen' oder 'empirischen' Bedeutung, andernfalls ist die Bedeutung 'abstrakt'/ 'virtuell'.
  2. Alle zuvor eingeführte Objekte $OBJ_{ENERGY}, S, OBJ_{FLOOR}$ haben eine Repräsentation im Akteur und alle diese Objekte sind 'real' in der Welt.
  3. Die Lernaufgabe besteht nun darin, die Repräsentationen der realen Objekte jeweils mit Zeichenmaterial zu einem Zeichen zu verknüpfen. Die Beziehung zwischen Zeichenmaterial und designiertem Repräsentant bildet das 'Lexikon'. Es ist eine offene Frage, ab wann man vermittelnde 'Kategorien' benötigt, die abstrakte Klassen von Repräsentanten assoziieren.
  4. Ferner besteht die Lernaufgabe darin, dass sich die Akteure bei ihrem Zeichengebrauch 'koordinieren', d.h. dass sie nach und nach für die gleichen Objekte die gleichen Zeichen benutzen.

Ist ein 'synchroner' Zeichengebrauch etabliert worden, stellt sich die Frage, in welchem Sinne der Zeichengebrauch einen 'Überlebensvorteil' bietet. Ohne solch einen Zusammenhang lohnt sich der Aufwand nicht. Die erste Bedingung, die erfüllt sein müsste, wäre die, dass der Zeichengebrauch eines Akteurs eine Wirkung auf andere Akteure haben kann.

Zeichengebrauch als Einflussnahme

  1. Angenommen, das Äußern eines Zeichens könnte weit über die aktuelle Position eines Akteurs hinaus 'wahrgenommen' werden, sowohl als Äußerung wie auch 'aus welcher Richtung', dann könnte die Äußerung eines bestimmten Zeichens eine entsprechende Information enthalten, sowohl um das Vorhandensein von Energieobjekten anzuzeigen wie auch, um die Kooperation zu verbessern.
  2. Ist eine Zeichenäußerung 'wahrnehmbar' und wird als dominante Sprechaktfunktion eine 'Mitteilungsaktion' angenommen, dann könnten andere Akteure aus einer Zeichenäußerung auf das Vorliegen eines Sachverhaltes dort schließen, 'woher' das Zeichen kommt.
  3. Im Falle einer Energieobjektes würde die Information gesendet, (i) dass dort ein Energieobjekt vorhanden ist und (ii) in welche Richtung man suchen sollte. Dies kann den Weg und die Zeit zur Energieaufnahme verbessern. Im unbekannten Gelände könnte eine Kooperation auf dieser Weise von Vorteil sein.
  4. Im Falle eines Akteurs würde die Information gesendet, (i) dass dort ein Akteur eines bestimmten 'Typs' ist, bzw. (ii) eventuell zusätzlich noch, dass dieser Akteur einen entsprechenden 'Partner' sucht. Damit könnte der Prozess der Kooperation für eine Fortpflanzung verbessert werden.

Gerd Doeben-Henisch 2014-01-14