Interaktionen

Ausgangspunkt für die Überlegungen zur Interaktion zwischen einem lernenden System als $SYS$ und einer Umgebung $ENV$ ist die Strukturannahme, wie sie in der Formulierung 2.8 ausgedrückt wird. Da das lernende System $SYS$ auf einem Computer ausgeführt werden soll liegt es nahe, von diesem lernenden System zu fordern, daß es die Struktur eines Automaten hat. Zusätzlich wird hier angenommen, daß es sich um den einfachsten Automaten handeln soll, der in der durch die Turingmaschine dominierten Hierarchie vorkommt, nämlich um einen endlichen Automaten $FSA$ ('finite state automaton')2.9.

Figure 2.5: Endlicher Automat mit externer Rückkoppelung
\includegraphics[width=2.80in]{automaton_finite_transducer_redirected.eps}

Im Schaubild 2.22 ist die Struktur solch eines endlichen Automaten zu sehen. Die zugehörige Strukturformel lautet:


$\displaystyle FSA (x)$ $\textstyle iff$ $\displaystyle x = \langle Q, I, F, IN, OUT, \Delta \rangle$ (2.22)
$\displaystyle Q$ $\textstyle :=$ $\displaystyle Set of states$ (2.23)
$\displaystyle I \subseteq Q$ $\textstyle :=$ $\displaystyle Set of initial states$ (2.24)
$\displaystyle F \subseteq Q$ $\textstyle :=$ $\displaystyle Set of final states$ (2.25)
$\displaystyle IN \subseteq \Sigma^{*}$ $\textstyle :=$ $\displaystyle Set of input words over the input alphabet \Sigma$ (2.26)
$\displaystyle OUT \subseteq \Xi^{*}$ $\textstyle :=$ $\displaystyle Set of output words over the output alphabet \Xi$ (2.27)
$\displaystyle \Delta$ $\textstyle :=$ $\displaystyle System function as transfer function$ (2.28)
$\displaystyle \Delta$ $\textstyle :$ $\displaystyle Q \times IN \longmapsto Q \times OUT$ (2.29)

Die wesentliche Eigenschaft, durch die sich ein endlicher Automat von einer Turingmaschine unterscheidet liegt darin, daß ein endlicher Automat jede Zelle des Bandes nur einmal lesen bzw. einmal schreiben kann. Es gibt kein Zurück und damit kein Gedächtnis. Der übrige Teil des endlichen Automaten ist mit der Turingmaschine identisch. Für die weiteren Überlegungen sind nun zwei Eigenschaften des endlichen Automaten von Interesse:


$\displaystyle c_{sys}$ $\textstyle =$ $\displaystyle min(t_{WRITE} - t_{READ})$ (2.30)
$\displaystyle c_{sys}$ $\textstyle >$ $\displaystyle 0$ (2.31)

Kennzeichen eines endlichen Systems ist es, daß die minimale Reaktionszeit $c_{sys}$ größer 0 ist. Man kann dies als fundamentales Zeitaxiom für endliche Systeme bezeichnen. Damit wird eine direkte Beziehung hergestellt zwischen dem Konzept des endlichen Automaten und dem Konzept der Zeit als Zeitstrahl2.10.

Der nächste Schritt besteht nun darin, dieses Konzept des lernenden Systems $SYS$ als endlichem Input-Output Automaten mit der Umgebung $ENV$ zu verknüpfen. Im Schaubild 2.6 wird gezeigt, wie die Aktionen von Umgebung und neuronalem Netz in einem Lernszenario konkret ineinandergreifen.

Figure 2.6: Interaktionen im Lernszenario
\includegraphics[width=4.0in]{lernszenario1.eps}

Wesentliche Annahme ist, daß sich sämtliche Aktionen der Umgebung $ENV$ wie auch des lernenden Systems $SYS$ entlang eines Zeitstrahls $T$ anordnen lassen. Von seiten des lernenden Systems $SYS$ gilt, daß eine Schreibaktion $WRITE_{sys}$ frühestens nach der minimalen Reaktionszeit $c_{sys}$ erfolgen kann, also $t_{WRITE} = t_{READ} + c_{sys}$. Da die Zeit technisch realisiert werden muß, gilt als kleinste Zeiteinheit $c_{clck}$. Es soll hier gefordert werden, daß die realisierte Zeit mindestens so genau ist wie die minimale Antwortzeit des lernenden Systems (vgl. Formel 2.32). Damit wird das fundamentale Zeitaxion weiter differenziert.


$\displaystyle c_{sys}$ $\textstyle \leq$ $\displaystyle c_{sys}$ (2.32)

Bleibt die Frage, wie man die Ereignisse der Umgebung $ENV$ in dieses Schema einordnen soll. Zwei Überlegungen können hier hilfreich sein. Wenn man annimmt, daß $N$-viele lernende Systeme $SYS_{i}, i \in N$ gegeben sind, dann könnten ihre Antworten im allgemeinen Fall in einem beliebigen Intervall $(t,t+c_{clck}), t \in T$ gleichmäßig verteilt sein. Der Abstand zwischen den einzelnen Ereignissen wäre dann $\frac{(t,t+c_{clck})}{N}$. Folgende Beziehungen werden hier angenommen:


$\displaystyle \frac{(t,t+c_{clck})}{N}$ $\textstyle \leq$ $\displaystyle c_{clck}$ (2.33)
$\displaystyle t_{WRITE}$ $\textstyle =$ $\displaystyle t_{READ}$ (2.34)

Dies bedeutet, es kann nicht ausgeschlossen werden, daß diese Ereignisstruktur kleiner ist als die kleinste verfügbare technische Uhr messen kann (vgl. Formel 2.34). Ferner muß gefordert werden, daß jede Antwortreaktion $WRITE$ eines lernenden Systems zeitgleich ist mit der Leseaktion $READ$ des gleichen Systems (vgl. Formel 2.34). Dies bedeutet, alles, was passiert ist aus Sicht der Umgebung gleichzeitig mit den Wahrnehmungen zu diesem Zeitpunkt. Eine Umgebung $ENV$ erscheint in diesem Modell aus Sicht eines handelnden Systems $S$ daher als zeitinvariant bzgl. des Auftretens einer Aktion und deren Wahrnehmung. Allerdings kann das lernende System $SYS$ selbst im Rahmen seiner Verarbeitung eines Stimulus eine bestimmte Zeit benötigen, sodaß zwischen dem Auftreten des Stimulus und der zugehörigen Aktion eine minimale Zeit vergeht2.11.

Gerd Doeben-Henisch 2013-01-17