Classification
|
|
Klassifikation
Mit den bisher eingeführten Mitteln ist es möglich, eine empirische
Meßtheorie zu formulieren, die den Vorgang der Klassifikation
beschreibt. Es zeigt sich, daß dieser Vorgang
keinesfalls trivial ist.
Wenn man davon ausgeht, daß der Untersuchungsbereich identisch
ist mit der Menge OBJ ohne die Teilmengen INVEST und CONTEXT, dann ist
für eine 'Sortierung' der Elemente aus OBJ anhand von vorgegebenen
Eigenschaften zu fordern, daß
- (CL1) alle Elemente des
Untersuchungsbereiches durch diesen Vorgang prinzipiell erfaßt
werden können
- (CL2) die resultierenden sortierten
Objekte Klassen bilden, die disjunkt sind.
Während Forderung CL1 sich auf die Anwendung
der klassifizierenden empirischen Meßtheorie auf einen konkreten
Untersuchungsbereich bezieht und im allgemeinen Fall nur dann als potentiell
erfüllbar angesehen werden kann, wenn alle Objekte des
Untersuchungsbereiches potentiell erreichbar sind, bezieht sich
Forderung CL2 auf eine Eigenschaft, die die gemessenen Daten
erfüllen müssen, d.h. man benötigt in einer
klassifizierenden empirischen Meßtheorie neben einer Menge von
Datenfeststellungen noch ein zusätzliches Axiom, daß die
Forderung der Disjunktheit für den Bereich der Daten festhält
(siehe weiter unten).
Für jede zu identifizierende Klasse O_CL_i muß man ein
eigenes endliches Eigenschaftsbündel angeben bzw. das
Meßgerät MI muß so ausgestattet sein, daß es
diese verschiedenen interessierenden Eigenschaftsbündel
'identifizieren' kann. Durch die Meßoperation MOP muß dann
für jedes identifizierbare Eigenschaftsbündel eine
entsprechende Meßeinheit ausgewiesen werden.
Es sei MI({O_13, O_14}, <{p_1, p_2}, {p_1, p_3} >) ein konkretes
Meßgerät und die Eigenschaftsgruppe {p_1, p_2} soll durch
die Meßeinheit u_1* kodiert werden und die Eigenschaftsgruppe
{p_1, p_3} durch die Meßeinheit u_2*. Es sei DOM_INV = OBJ -
(INVEST u CONTEXT) = {(O_1,{p_1,p_2}), (O_2,{p_1,p_3}),
(O_3,{p_1,p_2, p_3}), (O_4,{p_4,p_2}), (O_5,{p_1,p_2, p_3, p_4}),
(O_6,{ p_4}), (O_7,{p_1,p_2, p_4})} die Menge der zu klassifizierenden
Objekte. Folgende Meßergebnisse dürfen angenommen werden:
- MOP({O_13, O_14}, <{p_1, p_2},
{p_1, p_3} >, {O_1,{p_1,p_2}}, s_2*) = (1,u_1*)
- MOP({O_13, O_14}, <{p_1, p_2},
{p_1, p_3} >, {O_2,{p_1,p_3}}, s_2*) = (1,u_2*)
- MOP({O_13, O_14}, <{p_1, p_2},
{p_1, p_3} >, {O_3,{p_1,p_2}}, p_3}, s_2*) = (?,?)
- MOP({O_13, O_14}, <{p_1, p_2},
{p_1, p_3} >, {O_4,{p_4,p_2}}, s_2*) = (?,?)
- MOP({O_13, {O_14}, <{p_1, p_2},
{p_1, p_3} >, {O_5,{p_1,p_2}}, p_3, p_4}, s_2*) = (?,?)
- MOP({O_13, {O_14}, <{p_1, p_2},
{p_1, p_3} >, {O_6,{ p_4}}, s_2*) = (?,?)
- MOP({O_13, {O_14}, <{p_1, p_2},
{p_1, p_3} >, {O_7,{p_1,p_2, p_4}}, s_2*) = (?,?)
Diese Beispiele repräsentieren
mindestens 6 Fälle:
- Das zu messende Objekt O_6 besitzt
keine der meßbaren Eigenschaften.
- Das zu messende Objekt O_4 besitzt
einige der meßbaren Eigenschaften.
- Die zu messenden Objekte O_1 und
O_2 besitzen genau einmal die meßbaren Eigenschaften
einer Klasse.
- Das zu messende Objekt O_3 besitzt
simultan genau die meßbaren Eigenschaften von
mehr als einer Klasse.
- Das zu messende Objekt O_7 besitzt
sowohl genau die meßbaren Eigenschaften von
einer Klasse wie auch weitere Eigenschaften, die nicht gemessen
werden können.
- Das zu messende Objekt O_5 besitzt
simultan genau die meßbaren Eigenschaften von
mehr als einer Klasse wie auch weitere Eigenschaften, die nicht
gemessen werden können.
Folgende Strategien zur Behandlung dieser
Fälle sind denkbar:
- (STR1) Alle nichteindeutigen
Fälle werden einer Restklasse zugewiesen.
- (STR2) es wird ein graduelles
(fuzzy) Zutreffen definiert.
Strategie STR1 hängt davon ab, ob es
gelingt, einen eindeutigen Fall zu definieren. Betrachten wir
uns die einzelnen Fälle genauer.
- (M+)(CL+) Fall 1 ist vom
Meßgerät direkt erkennbar; keines der
Eigenschaftsbündel wird erfüllt.
- (M+)(CL+) Im Fall 2 kann das
Meßgerät ebenfalls direkt erkennen, daß keines der
Eigenschaftsbündel voll erfüllt wird.
- (M+)(CL+) Fall 3 bedeutet die
vollständige Erfüllung eines Eigenschaftsbündels und ist
eindeutig erkennbar.
- (M+)(CL-) Fall 4 ist prinzipiell
vom Meßgerät erkennbar, würde aber die Ausgabe von so
vielen Meßwerten verlangen, wie Eigenschaftsklassen erkannt
werden. Dies hätte zur Folge, daß ein Objekt unter mehr als
eine Klasse fallen würde.
- (M-)(CL-) Fall 5 ist vom
Meßgerät prinzipiell nicht erkennbar. Das zu messende Objekt
würde wie Fall 3 behandelt werden und würde dadurch zu einer
Fehlklassifikation führen.
- (M-)(CL-) Fall 6 ist prinzipiell
vom Meßgerät nicht erkennbar und würde analog zu Fall 4
und 5 behandelt werden.
Problematisch sind also offensichtlich
die Fälle 4-6. Wenn man davon ausgeht, daß das
Meßgerät genau nur das Zutreffen jener
Eigenschaftsbündel erkennen kann, auf die hin es 'ausgelegt' ist -
und dies muß man hier voraussetzen - dann ist es prinzipiell
nicht in der Lage, den Fall 5 von den Fällen 1-3 zu unterscheiden.
Fall 4 wäre dahingehend lösbar, daß es mehr als einen
Meßwert ausgeben kann, was dann das Scheitern des
Klassifikationsversuches bedeuten würde. Und Fall 6 wäre eine
Kombination von 4 und 5.
Da sich das Zulassen mehrerer Meßwerte für einen
Meßvorgang auch durch den Einsatz entsprechend vieler
verschiedener Meßgeräte simulieren läßt, soll
hier angenommen werden,
POSTULAT: daß pro Meßgerät nur ein einziger Satz
charakteristischer Eigenschaften gemessen werden kann.
Es sei MI({O_13, {O_14}, <{p_1, p_2}, >) - abgekürzt M1 -
ein konkretes Meßgerät und die Eigenschaftsgruppe {p_1, p_2}
soll durch die Meßeinheit u_1* kodiert werden. MI({O_13, {O_14},
<{p_1, p_3}, >) sein ein weiteres konkretes Meßgerät -
abgekürzt M2 - und die Eigenschaftsgruppe {p_1, p_3} soll durch
die Meßeinheit u_2* kodiert werden. Der Untersuchungsbereich
DOM_INV sei wie zuvor ohne das Objekt O_5. Folgende Meßergebnisse
dürfen angenommen werden:
- MOP({O_13, {O_14}, <{p_1, p_2},
>, {O_1,{p_1,p_2}}, s_2*) = (1,u_1*)
MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_1,{p_1,p_2}}, s_2*) =
(0,u_2*)
- MOP({O_13, {O_14}, <{p_1, p_2},
>, {O_2,{p_1,p_3}}, s_2*) = (0,u_1*)
MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_2,{p_1,p_3}}, s_2*) =
(1,u_2*)
- MOP({O_13, {O_14}, <{p_1, p_2},
>, {O_3,{p_1,p_2, p_3}}, s_2*) = (1,u_1*)
MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_3,{p_1,p_2, p_3}}, s_2*) =
(1,u_2*)
- MOP({O_13, {O_14}, <{p_1, p_2},
>, {O_4,{p_4,p_2}}, s_2*) = (0,u_1*)
MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_4,{p_4,p_2}}, s_2*) =
(0,u_2*)
- MOP({O_13, {O_14}, <{p_1, p_2},
>, {O_6,{ p_4}}, s_2*) = (0,u_1*)
MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_6,{ p_4}}, s_2*) = (0,u_2*)
- MOP({O_13, {O_14}, <{p_1, p_2},
>, {O_7,{p_1,p_2, p_4}}, s_2*) = (1,u_1*)
MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_7,{p_1,p_2, p_4}}, s_2*) =
(0,u_2*)
Diese Beispiele repräsentieren die
folgenden Fälle:
- Fall 1: (M1+)(CL+) und (M2+)(CL+)
=> +
- Fall 2: (M1+)(CL+) und (M2+)(CL+)
=> +
- Fall 3: (M1+)(CL-) und (M2+)(CL-)
=> -
- Fall 4: (M1+)(CL+) und (M2+)(CL+)
=> +
- Fall 5: (M1+)(CL+) und (M2+)(CL+)
=> +
- Fall 6: (M1+)(CL-) und (M2+)(CL+)
=> +
In Fall 6 liegt ein Versagen von M1 vor,
da es eine Teilmengenrelation nicht erkennt, doch führt dies nur
zu einem impliziten Klassenkonflikt, da M2 auf
Nichtzugehörigkeit zu einer M2-Klasse 'erkennt'. Im Fall 3
versagen beide Meßgeräte bei einer Teilmengenbeziehung und
erzeugen dadurch einen expliziten Klassenkonflikt
Daraus ergibt sich der grundlegende Sachverhalt, daß die
Klassifikation eines endlichen Untersuchungsbereiches D immer nur
relativ zur vorausgesetzten Menge von klassifizierenden Eigenschaften
gültig ist und daß diese einen prinzipiell unscharfen
Rand bezüglich dem Tatbestand einer Enthaltensseins-Beziehung/
Teilmengenbeziehung aufweist. Umgekehrt bedeutet dies, daß
Klassifikationen nur eindeutig sind mit Blick auf die tatsächlich
gemessenen Eigenschaften.
Für die Strategie STR1 folgt daraus, daß es keine
nichteindeutigen Fälle gibt, da die nichteindeutigen
Fälle vom Meßgerät prinzipiell nicht erkennbar sind.
Es bleibt die Frage offen, ob Strategie STR2 greift?
Man wird davon ausgehen können, daß die Frage des graduellen
Zutreffens sich auf den Bereich des überhaupt Erkennbaren
beziehen muß. Der Bereich des überhaupt Erkennbaren
muß mit der endlichen Menge der identifizierbaren
Eigenschaften eines Meßgerätes geichgesetzt werden.
Daraus ergibt sich zweierlei:
- Die unlösbaren Fälle von
STR1 bleiben auch unlösbare Fälle bei STR2.
- Man kann jeder identifizierbaren
Eigenschaft eines Meßgerätes einen Anteil zuweisen -
also bei n-vielen Eigenschaften z.B. 1/n-Anteil - und dann die
Zugehörigkeit zu einer Klasse als Summe der identifizierten
Anteile ausdrücken.
Damit bekäme man folgende
Meßwerte:
- MOP({O_13, {O_14}, <{p_1, p_2},
>, {O_1,{p_1,p_2}}, s_2*) = (1,u_1*)
MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_1,{p_1,p_2}}, s_2*) =
(1/2,u_2*)
- MOP({O_13, {O_14}, <{p_1, p_2},
>, {O_2,{p_1,p_3}}, s_2*) = (1/2,u_1*)
MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_2,{p_1,p_3}}, s_2*) =
(1,u_2*)
- MOP({O_13, {O_14}, <{p_1, p_2},
>, {O_3,{p_1,p_2, p_3}}, s_2*) = (1,u_1*)
MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_3,{p_1,p_2, p_3}}, s_2*) =
(1,u_2*)
- MOP({O_13, {O_14}, <{p_1, p_2},
>, {O_4,{p_4,p_2}}, s_2*) = (1/2,u_1*)
MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_4,{p_4,p_2}}, s_2*) =
(0,u_2*)
- MOP({O_13, {O_14}, <{p_1, p_2},
>, {O_6,{ p_4}}, s_2*) = (0,u_1*)
MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_6,{ p_4}}, s_2*) = (0,u_2*)
- MOP({O_13, {O_14}, <{p_1, p_2},
>, {O_7,{p_1,p_2, p_4}}, s_2*) = (1,u_1*)
MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_7,{p_1,p_2, p_4}}, s_2*) =
(0,u_2*)
Die unlösbaren Fälle bleiben
unlösbar und die erkennbaren Fälle werden 'differenzierter'.
|
|