Ausgangspunkt für die Überlegungen zur Interaktion zwischen einem lernenden System als und einer Umgebung
ist die Strukturannahme, wie sie in der Formulierung 2.8 ausgedrückt wird. Da das lernende System
auf einem Computer ausgeführt werden soll liegt es nahe, von diesem lernenden System zu fordern, daß es die Struktur eines Automaten hat. Zusätzlich wird hier angenommen, daß es sich um den einfachsten Automaten handeln soll, der in der durch die Turingmaschine dominierten Hierarchie vorkommt, nämlich um einen endlichen Automaten
('finite state automaton')2.9.
Im Schaubild 2.22 ist die Struktur solch eines endlichen Automaten zu sehen. Die zugehörige Strukturformel lautet:
Die wesentliche Eigenschaft, durch die sich ein endlicher Automat von einer Turingmaschine unterscheidet liegt darin, daß ein endlicher Automat jede Zelle des Bandes nur einmal lesen bzw. einmal schreiben kann. Es gibt kein Zurück und damit kein Gedächtnis. Der übrige Teil des endlichen Automaten ist mit der Turingmaschine identisch. Für die weiteren Überlegungen sind nun zwei Eigenschaften des endlichen Automaten von Interesse:
Kennzeichen eines endlichen Systems ist es, daß die minimale Reaktionszeit größer 0 ist. Man kann dies als fundamentales Zeitaxiom für endliche Systeme bezeichnen. Damit wird eine direkte Beziehung hergestellt zwischen dem Konzept des endlichen Automaten und dem Konzept der Zeit als Zeitstrahl2.10.
Der nächste Schritt besteht nun darin, dieses Konzept des lernenden Systems als endlichem Input-Output Automaten mit der Umgebung
zu verknüpfen. Im Schaubild 2.6 wird gezeigt, wie die Aktionen von Umgebung und neuronalem Netz in einem Lernszenario konkret ineinandergreifen.
Wesentliche Annahme ist, daß sich sämtliche Aktionen der Umgebung wie auch des lernenden Systems
entlang eines Zeitstrahls
anordnen lassen. Von seiten des lernenden Systems
gilt, daß eine Schreibaktion
frühestens nach der minimalen Reaktionszeit
erfolgen kann, also
. Da die Zeit technisch realisiert werden muß, gilt als kleinste Zeiteinheit
. Es soll hier gefordert werden, daß die realisierte Zeit mindestens so genau ist wie die minimale Antwortzeit des lernenden Systems (vgl. Formel 2.32). Damit wird das fundamentale Zeitaxion weiter differenziert.
Bleibt die Frage, wie man die Ereignisse der Umgebung in dieses Schema einordnen soll. Zwei Überlegungen können hier hilfreich sein. Wenn man annimmt, daß
-viele lernende Systeme
gegeben sind, dann könnten ihre Antworten im allgemeinen Fall in einem beliebigen Intervall
gleichmäßig verteilt sein. Der Abstand zwischen den einzelnen Ereignissen wäre dann
. Folgende Beziehungen werden hier angenommen:
Dies bedeutet, es kann nicht ausgeschlossen werden, daß diese Ereignisstruktur kleiner ist als die kleinste verfügbare technische Uhr messen kann (vgl. Formel 2.34). Ferner muß gefordert werden, daß jede Antwortreaktion eines lernenden Systems zeitgleich ist mit der Leseaktion
des gleichen Systems (vgl. Formel 2.34). Dies bedeutet, alles, was passiert ist aus Sicht der Umgebung gleichzeitig mit den Wahrnehmungen zu diesem Zeitpunkt. Eine Umgebung
erscheint in diesem Modell aus Sicht eines handelnden Systems
daher als zeitinvariant bzgl. des Auftretens einer Aktion und deren Wahrnehmung. Allerdings kann das lernende System
selbst im Rahmen seiner Verarbeitung eines Stimulus eine bestimmte Zeit benötigen, sodaß zwischen dem Auftreten des Stimulus und der zugehörigen Aktion eine minimale Zeit vergeht2.11.
Gerd Doeben-Henisch 2013-01-17