In diesem Abschnitt geht es nun darum, das beobachtbare Verhalten eines Agenten zu modellieren, der sich entsprechend dem informellen Muster des klassischen Konditionierens verhält. Dieses soll mit Hilfe des Konzeptes eines Automaten bzw. -falls es sich um mehr als einen Agenten handelt- des Konzeptes eines Netzwerkes verknüpfter Automaten realisiert werden (Für die formalen Definitionen zu Automaten und zugehörigen Begriffen wie Abarbeitung eines automaten, Zustandsgraph bzw. Übergangsgraph eines Automaten, Ausführungsgraph usw. siehe die entsprechenden Abschnitte im Skript 'Formal Specification and Verification' (URL: http://www.uffmm.org/science-technology/single/
themes/computer-science/personal-sites/doeben-henisch/FM/SESSIONS/
THEORY/fsv/index.html ).
Ausgangspunkt ist das beobachtbare Verhalten, wie es im Bild 4.1 schematisch dargestellt wird. Angenommen wird ein Agent . Der Agent kann durch ein biologisches oder ein technisches System realisiert sein. Hier wird zunächst ein biologisches System (Pawlows Hund) angenommen. Der Agent kommt nicht isoliert vor, sondern in einer Umgebung ('E' für environment). Von der Umgebung wissen wir, dass sie Reize (stimuli) {S1, S2} liefern und Reaktionen (responses) {R1} des Agenten empfangen kann. Eine Reihenfolge liegt nicht fest.
Betrachtet man den idealisierten Ablaufplan, so sieht man, dass der Reiz S2 alleine zunächst keine Reaktion hervorruft, wohl aber der Reiz S1 (unconditioned stimulus, CS), der fest mit der Reaktion R1 verknüpft ist (unconditioned Response, UR). Nachdem der Reiz S2 aber einmal zusammen mit Reiz S1 auftrat, bewirkt auch der Reiz S2 eine Rekation R1. Jetzt spricht man von S2 als konditioniertem Reiz (conditioned stimulus, CS) und von der Reaktion R1 als einer konditionierten Reaktion (conditioned response, CR).
Eine Modellierung der beiden Grössen Umgebung E sowie Agent A könnte wie folgt aussehen (vgl. Bild 4.2):
Anmerkung: Sehr viele -eigentlich alle-, die zum ersten Mal Verhaltensdaten mittels Automaten (bzw. Zustandsgraphen) zu modellieren versuchen, haben Schwierigkeiten, zu entscheiden, wieviele verschiedene Zustände man annehmen muss. Viele meinen, dass praktische jede Aktion den Zustand ändert, weil ja 'etwas passiert'. Betrachtet man die Gesamtheit der Input- und Outputereignisse (Stimulus-Response, S-R) als eine Menge von S-R-Paaren, dann bildet diese Menge eine Funktion . Am Beispiel des Agenten zu Beginn kann man schreiben: . Erst dann, wenn diese Funktion sich im Laufe der Zeit ändert, liegt eine neue Funktion vor. Wiederum am Beispiel des Agenten kann man schreiben: . Der Übergang von der Funktion zur Funktion geschieht durch das identifizierbare Ereignis kombiniert mit bzw. kombiniert mit . Dabei spielt die Anordnung in der Zeit eine wichtige Rolle. Man kann also anhand des beobachtbaren Verhaltens eine Veränderung des Verhaltens beobachten: . Korreliert man nun einen Zustand jeweils mit einer Funktion, dann benötigt man soviele verschiedene Zustände, wie man unterschiedliche Verhaltensfunktionen aufgrund von Input-Output-Daten unterscheiden kann.
Für eine formale Darstellung mittels der Schreibweise eines Automaten muss man eine Automatendarstellung wählen, die sowohl 'gelabelte Kanten' für Eingangsereignisse wie auch Ausgangsereignisse ermöglicht. Ferner können wir im Falle des Agenten noch Eigenschaften einsetzen. Der Einfachheit halber wählen wir für beide Systeme den gleichen Automatentyp. Sowohl für den Automaten zu E wie auch für den Automaten zu A wählen wir den sogenannten endlichen Übersetzer (Finite Transducer) erweitert um Eigenschaften:
Die allgemeine Erklärung zur Struktur des endlichen Übersetzers ist wie folgt:
Die Werte für den Automaten , der das System Umwelt repräsentieren soll (das Zeichen '' repräsentiert eine leere Zeichenkette):
Die Werte für den Automaten , der das System Agent repräsentieren soll:
Auf diese Weise hat man jetzt die einzelnen Systeme als Automaten modelliert. Hält man diese isolierte Betrachtungsweise noch für einen Moment bei, dann könnte das Verhalten eines einzelnen Automaten wie folgt dargestellt werden (Format: :
Beispiel Umwelt E:
Beispiel Lerner A:
Man weiss aber auch, dass diese Systeme sich untereinander beeinflussen. Im konkreten Beispiel sind es die Eignisse oder als Output des Systems Umwelt, die auf das System Lerner als Reize (Stimuli, S) einwirken. Die Wechselwirkung findet also über den jeweiligen Input bzw. Output statt. Der Output des einen Systems kann der Input des anderen Systems sein, und umgekehrt. Hält man an der Idee fest, dass das gesamte Verhaltenssystem ein einziger Automat sein soll, dann muss man einen technischen Weg finden, die beiden einzelnen Automaten so miteinander zu verknüpfen, dass alle wichtigen Infomationen erhalten bleiben. In der Literatur findet sich dazu z.B. der Vorschlag, individuelle Automaten von Systemen in Form eines synchronisierten Produktes (synchronized product) miteinander zu verbinden (vgl. Berard et al. 2001 [10], Pp.14ff). Diese Strategie besitzt allerdings sehr viele Nachteile. Hier soll eine alternative Strategie gewählt werden, nämlich die Strategie der Input-Output Verknüpfung. Dazu bildet man eine neue Superstruktur
Eine Abarbeitung verläuft dann in zwei Phasen:
Eine Abarbeitung der beiden verknüpften Systeme könnte dann wie folgt aussehen:
Anhand der Markierungsfunktion kann man jedem Zustand auch noch eine Eigenschaft zuordnen. Wollte man automatische Testverfahren einsetzen, um das Verhalten verknüpfter Systeme zu untersuchen, dann könnte es sinnvoll sein, die jeweiligen Eigenschaften eines aktuellen Zustandes in der Ableitung mit zu notieren.
Ansonsten kann man sagen, dass mit dieser Modellierung jetzt das gesamte Verhalten aller beteiligter Systeme vollständig erfasst ist. Natüerlich liesse sich diese Modellierung weiter erweitern, z.B. um relle Zeitpunkte. Dies ist für die aktuelle Analyse allerdings nicht notwendig.
Gerd Doeben-Henisch 2010-12-16