Phasen im Lernprozeß

Der Kontext einer Theorie lernender System2.7, benötigt unbedingt eine zeitliche Dimension, und in dieser Dimension die Unterscheidung in mindestens die folgenden drei Phasen:

  1. Das Verhalten des Systems vor dem Lernen. Dieses kann mit einer Menge $TST_{1}$ von Teststimuli überprüft werden. Selbst wenn die Testsysteme permanent lernende Systeme sind, so würden diese beim ersten Auftreten eines aufgabentypischen Stimulus $s_{TST.1}$ noch nicht aufgabenspezifisch reagieren.
  2. Das Lernen selbst (unüberwacht ('unsupervised') oder überwacht ('supervised')). Hier wird die Trainingsmenge $TR$ benutzt.
  3. Das Verhalten des Systems nach dem Lernen. Hier wird die Testmenge $TST_{2}$ benutzt.

Da biologische Systeme immer lernen, heißt vor dem Lernen im wesentlichen nur, daß bestimmte Reaktionsweisen $r$ in Abhängigkeit von bestimmten Ereignissen ('stimuli') $s$ noch nicht beobachtet worden sind. Diese Phase kann mit der Testmenge $TST_{1}$ getestet werden. In der Lernphase treten dann aufgabenspezifische Stimuli $s_{TR}$ und zugehörige Antworten $r_{TR}$ auf. Besitzt das System eine geeignete Lernfähigkeit, dann wird es mittels dieser aufgabenspezifischen Ereignissen in der Lage sein, seine Verhaltensfunktion $f_{SYS}$ so zu modifizieren, daß es in der anschließenden Testphase bei Auftreten geeigneter Teststimuli aus $TST_{2}$ 'von sich aus' solche Antworten $r_{sys}$ generiert, die mit den erwarteten Testantworten aus $TST_{2}$ hinreichend ähnlich sind. Die hier benötigten Mengen $TST$ und $TR$ kann man wie folgt näher spezifizieren:


$\displaystyle OUT_{env}$ $\textstyle \supseteq$ $\displaystyle TASK$ (2.14)
$\displaystyle TASK$ $\textstyle =$ $\displaystyle TR \cup TST$ (2.15)
$\displaystyle TST$ $\textstyle =$ $\displaystyle TST_{1} \cup TST_{2}$ (2.16)
$\displaystyle \emptyset$ $\textstyle =$ $\displaystyle TST_{1} \cap TST_{2}$ (2.17)
$\displaystyle \emptyset$ $\textstyle =$ $\displaystyle TST \cap TR$ (2.18)
$\displaystyle TST$ $\textstyle \subseteq$ $\displaystyle OBJ^{n.m}$ (2.19)
$\displaystyle TR$ $\textstyle \subseteq$ $\displaystyle OBJ^{n.m}$ (2.20)
$\displaystyle OBJ$ $\textstyle \supseteq$ $\displaystyle \mathcal{N}^{n.m} \cup \mathcal{R}^{n.m}$ (2.21)

Teil des Outputs der Umgebung sind auch mögliche Testmengen $TST$ und Trainingsmengen $TR$ im Rahmen von Lernaufgaben. Elemente $inp \in TST \cup TR$ bilden Paare von Tupeln der Art $inp = (s,r)$ mit $s \in OBJ^{n}$ und $r \in OBJ^{m}$. In beiden Fällen kann $r$ zur Kontrolle des tatsächlichen Outputs $r_{knn}$ benutzt werden. Ferner kann man die Mengen $TST \cup TR$ auch dahingehend charakterisieren, daß sie entweder den Wertebereich einer Zufallsfunktion $rand()$ -einschließlich diverser Verteilungsformen- bilden oder aber nicht.

Gerd Doeben-Henisch 2013-01-17