CHAPTER IV: Scientific Description of Reality
4.4. Simple Empirical Scales
4.4.1: Empirical Classifications





'95-Knowbot

(The english annotations below are only a rough characterization of the content of the german text)






Remark: On account of the changes in the preceding chapter about the empirical measurement theory have in this chapter some formal adjustements to be made. But this will leave the main content of this chapter unchanged.


KAPITEL IV: Wissenschaftliche Beschreibung der Wirklichkeit
4.4. Einfache Empirische Skalen
4.4.1: Empirische Klassifikation




AUTHOR: Gerd Döben-Henisch
COAUTHOR: Joachim Hasebrook
DATE OF FIRST GENERATION: Febr 12, 1998
DATE OF LAST CHANGE: Febr 13, 11:38, 1998
ADDRESS: INM - Institute for New Media, Frankfurt, Germany
EMAIL: doeb@inm.de
URL: INM
Copyright (c) Gerd Döben-Henisch
STATUS: Work in Progress
COOPERATION: Everybody is invited to share the discussions, to contribute with own ideas. The authors decide whether such contributions are accepted for incorporation in the final version.



Anmerkung: Aufgrund der Präzisierungen im vorausgehenden Kapitel zur empirischen Meßtheorie müssen in diesem Abschnitt einige formale Vereinbarungen wieder geändert werden. Die Grundaussage bleibt aber davon unberührt.


    Classification


    Klassifikation

    Mit den bisher eingeführten Mitteln ist es möglich, eine empirische Meßtheorie zu formulieren, die den Vorgang der Klassifikation beschreibt. Es zeigt sich, daß dieser Vorgang keinesfalls trivial ist.

    Wenn man davon ausgeht, daß der Untersuchungsbereich identisch ist mit der Menge OBJ ohne die Teilmengen INVEST und CONTEXT, dann ist für eine 'Sortierung' der Elemente aus OBJ anhand von vorgegebenen Eigenschaften zu fordern, daß
    • (CL1) alle Elemente des Untersuchungsbereiches durch diesen Vorgang prinzipiell erfaßt werden können
    • (CL2) die resultierenden sortierten Objekte Klassen bilden, die disjunkt sind.
    Während Forderung CL1 sich auf die Anwendung der klassifizierenden empirischen Meßtheorie auf einen konkreten Untersuchungsbereich bezieht und im allgemeinen Fall nur dann als potentiell erfüllbar angesehen werden kann, wenn alle Objekte des Untersuchungsbereiches potentiell erreichbar sind, bezieht sich Forderung CL2 auf eine Eigenschaft, die die gemessenen Daten erfüllen müssen, d.h. man benötigt in einer klassifizierenden empirischen Meßtheorie neben einer Menge von Datenfeststellungen noch ein zusätzliches Axiom, daß die Forderung der Disjunktheit für den Bereich der Daten festhält (siehe weiter unten).

    Für jede zu identifizierende Klasse O_CL_i muß man ein eigenes endliches Eigenschaftsbündel angeben bzw. das Meßgerät MI muß so ausgestattet sein, daß es diese verschiedenen interessierenden Eigenschaftsbündel 'identifizieren' kann. Durch die Meßoperation MOP muß dann für jedes identifizierbare Eigenschaftsbündel eine entsprechende Meßeinheit ausgewiesen werden.

    Es sei MI({O_13, O_14}, <{p_1, p_2}, {p_1, p_3} >) ein konkretes Meßgerät und die Eigenschaftsgruppe {p_1, p_2} soll durch die Meßeinheit u_1* kodiert werden und die Eigenschaftsgruppe {p_1, p_3} durch die Meßeinheit u_2*. Es sei DOM_INV = OBJ - (INVEST u CONTEXT) = {(O_1,{p_1,p_2}), (O_2,{p_1,p_3}), (O_3,{p_1,p_2, p_3}), (O_4,{p_4,p_2}), (O_5,{p_1,p_2, p_3, p_4}), (O_6,{ p_4}), (O_7,{p_1,p_2, p_4})} die Menge der zu klassifizierenden Objekte. Folgende Meßergebnisse dürfen angenommen werden:
    1. MOP({O_13, O_14}, <{p_1, p_2}, {p_1, p_3} >, {O_1,{p_1,p_2}}, s_2*) = (1,u_1*)

    2. MOP({O_13, O_14}, <{p_1, p_2}, {p_1, p_3} >, {O_2,{p_1,p_3}}, s_2*) = (1,u_2*)

    3. MOP({O_13, O_14}, <{p_1, p_2}, {p_1, p_3} >, {O_3,{p_1,p_2}}, p_3}, s_2*) = (?,?)

    4. MOP({O_13, O_14}, <{p_1, p_2}, {p_1, p_3} >, {O_4,{p_4,p_2}}, s_2*) = (?,?)

    5. MOP({O_13, {O_14}, <{p_1, p_2}, {p_1, p_3} >, {O_5,{p_1,p_2}}, p_3, p_4}, s_2*) = (?,?)

    6. MOP({O_13, {O_14}, <{p_1, p_2}, {p_1, p_3} >, {O_6,{ p_4}}, s_2*) = (?,?)
    7. MOP({O_13, {O_14}, <{p_1, p_2}, {p_1, p_3} >, {O_7,{p_1,p_2, p_4}}, s_2*) = (?,?)

    Diese Beispiele repräsentieren mindestens 6 Fälle:
    1. Das zu messende Objekt O_6 besitzt keine der meßbaren Eigenschaften.

    2. Das zu messende Objekt O_4 besitzt einige der meßbaren Eigenschaften.

    3. Die zu messenden Objekte O_1 und O_2 besitzen genau einmal die meßbaren Eigenschaften einer Klasse.

    4. Das zu messende Objekt O_3 besitzt simultan genau die meßbaren Eigenschaften von mehr als einer Klasse.

    5. Das zu messende Objekt O_7 besitzt sowohl genau die meßbaren Eigenschaften von einer Klasse wie auch weitere Eigenschaften, die nicht gemessen werden können.

    6. Das zu messende Objekt O_5 besitzt simultan genau die meßbaren Eigenschaften von mehr als einer Klasse wie auch weitere Eigenschaften, die nicht gemessen werden können.
    Folgende Strategien zur Behandlung dieser Fälle sind denkbar:
    1. (STR1) Alle nichteindeutigen Fälle werden einer Restklasse zugewiesen.

    2. (STR2) es wird ein graduelles (fuzzy) Zutreffen definiert.
    Strategie STR1 hängt davon ab, ob es gelingt, einen eindeutigen Fall zu definieren. Betrachten wir uns die einzelnen Fälle genauer.

    1. (M+)(CL+) Fall 1 ist vom Meßgerät direkt erkennbar; keines der Eigenschaftsbündel wird erfüllt.
    2. (M+)(CL+) Im Fall 2 kann das Meßgerät ebenfalls direkt erkennen, daß keines der Eigenschaftsbündel voll erfüllt wird.
    3. (M+)(CL+) Fall 3 bedeutet die vollständige Erfüllung eines Eigenschaftsbündels und ist eindeutig erkennbar.
    4. (M+)(CL-) Fall 4 ist prinzipiell vom Meßgerät erkennbar, würde aber die Ausgabe von so vielen Meßwerten verlangen, wie Eigenschaftsklassen erkannt werden. Dies hätte zur Folge, daß ein Objekt unter mehr als eine Klasse fallen würde.
    5. (M-)(CL-) Fall 5 ist vom Meßgerät prinzipiell nicht erkennbar. Das zu messende Objekt würde wie Fall 3 behandelt werden und würde dadurch zu einer Fehlklassifikation führen.
    6. (M-)(CL-) Fall 6 ist prinzipiell vom Meßgerät nicht erkennbar und würde analog zu Fall 4 und 5 behandelt werden.
    Problematisch sind also offensichtlich die Fälle 4-6. Wenn man davon ausgeht, daß das Meßgerät genau nur das Zutreffen jener Eigenschaftsbündel erkennen kann, auf die hin es 'ausgelegt' ist - und dies muß man hier voraussetzen - dann ist es prinzipiell nicht in der Lage, den Fall 5 von den Fällen 1-3 zu unterscheiden. Fall 4 wäre dahingehend lösbar, daß es mehr als einen Meßwert ausgeben kann, was dann das Scheitern des Klassifikationsversuches bedeuten würde. Und Fall 6 wäre eine Kombination von 4 und 5.

    Da sich das Zulassen mehrerer Meßwerte für einen Meßvorgang auch durch den Einsatz entsprechend vieler verschiedener Meßgeräte simulieren läßt, soll hier angenommen werden,

    POSTULAT: daß pro Meßgerät nur ein einziger Satz charakteristischer Eigenschaften gemessen werden kann.

    Es sei MI({O_13, {O_14}, <{p_1, p_2}, >) - abgekürzt M1 - ein konkretes Meßgerät und die Eigenschaftsgruppe {p_1, p_2} soll durch die Meßeinheit u_1* kodiert werden. MI({O_13, {O_14}, <{p_1, p_3}, >) sein ein weiteres konkretes Meßgerät - abgekürzt M2 - und die Eigenschaftsgruppe {p_1, p_3} soll durch die Meßeinheit u_2* kodiert werden. Der Untersuchungsbereich DOM_INV sei wie zuvor ohne das Objekt O_5. Folgende Meßergebnisse dürfen angenommen werden:
    1. MOP({O_13, {O_14}, <{p_1, p_2}, >, {O_1,{p_1,p_2}}, s_2*) = (1,u_1*)

      MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_1,{p_1,p_2}}, s_2*) = (0,u_2*)

    2. MOP({O_13, {O_14}, <{p_1, p_2}, >, {O_2,{p_1,p_3}}, s_2*) = (0,u_1*)

      MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_2,{p_1,p_3}}, s_2*) = (1,u_2*)

    3. MOP({O_13, {O_14}, <{p_1, p_2}, >, {O_3,{p_1,p_2, p_3}}, s_2*) = (1,u_1*)

      MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_3,{p_1,p_2, p_3}}, s_2*) = (1,u_2*)

    4. MOP({O_13, {O_14}, <{p_1, p_2}, >, {O_4,{p_4,p_2}}, s_2*) = (0,u_1*)

      MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_4,{p_4,p_2}}, s_2*) = (0,u_2*)

    5. MOP({O_13, {O_14}, <{p_1, p_2}, >, {O_6,{ p_4}}, s_2*) = (0,u_1*)

      MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_6,{ p_4}}, s_2*) = (0,u_2*)

    6. MOP({O_13, {O_14}, <{p_1, p_2}, >, {O_7,{p_1,p_2, p_4}}, s_2*) = (1,u_1*)

      MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_7,{p_1,p_2, p_4}}, s_2*) = (0,u_2*)

    Diese Beispiele repräsentieren die folgenden Fälle:
    1. Fall 1: (M1+)(CL+) und (M2+)(CL+) => +
    2. Fall 2: (M1+)(CL+) und (M2+)(CL+) => +
    3. Fall 3: (M1+)(CL-) und (M2+)(CL-) => -
    4. Fall 4: (M1+)(CL+) und (M2+)(CL+) => +
    5. Fall 5: (M1+)(CL+) und (M2+)(CL+) => +
    6. Fall 6: (M1+)(CL-) und (M2+)(CL+) => +
    In Fall 6 liegt ein Versagen von M1 vor, da es eine Teilmengenrelation nicht erkennt, doch führt dies nur zu einem impliziten Klassenkonflikt, da M2 auf Nichtzugehörigkeit zu einer M2-Klasse 'erkennt'. Im Fall 3 versagen beide Meßgeräte bei einer Teilmengenbeziehung und erzeugen dadurch einen expliziten Klassenkonflikt

    Daraus ergibt sich der grundlegende Sachverhalt, daß die Klassifikation eines endlichen Untersuchungsbereiches D immer nur relativ zur vorausgesetzten Menge von klassifizierenden Eigenschaften gültig ist und daß diese einen prinzipiell unscharfen Rand bezüglich dem Tatbestand einer Enthaltensseins-Beziehung/ Teilmengenbeziehung aufweist. Umgekehrt bedeutet dies, daß Klassifikationen nur eindeutig sind mit Blick auf die tatsächlich gemessenen Eigenschaften.

    Für die Strategie STR1 folgt daraus, daß es keine nichteindeutigen Fälle gibt, da die nichteindeutigen Fälle vom Meßgerät prinzipiell nicht erkennbar sind.

    Es bleibt die Frage offen, ob Strategie STR2 greift?

    Man wird davon ausgehen können, daß die Frage des graduellen Zutreffens sich auf den Bereich des überhaupt Erkennbaren beziehen muß. Der Bereich des überhaupt Erkennbaren muß mit der endlichen Menge der identifizierbaren Eigenschaften eines Meßgerätes geichgesetzt werden. Daraus ergibt sich zweierlei:
    • Die unlösbaren Fälle von STR1 bleiben auch unlösbare Fälle bei STR2.
    • Man kann jeder identifizierbaren Eigenschaft eines Meßgerätes einen Anteil zuweisen - also bei n-vielen Eigenschaften z.B. 1/n-Anteil - und dann die Zugehörigkeit zu einer Klasse als Summe der identifizierten Anteile ausdrücken.
    Damit bekäme man folgende Meßwerte:
    1. MOP({O_13, {O_14}, <{p_1, p_2}, >, {O_1,{p_1,p_2}}, s_2*) = (1,u_1*)

      MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_1,{p_1,p_2}}, s_2*) = (1/2,u_2*)

    2. MOP({O_13, {O_14}, <{p_1, p_2}, >, {O_2,{p_1,p_3}}, s_2*) = (1/2,u_1*)

      MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_2,{p_1,p_3}}, s_2*) = (1,u_2*)

    3. MOP({O_13, {O_14}, <{p_1, p_2}, >, {O_3,{p_1,p_2, p_3}}, s_2*) = (1,u_1*)

      MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_3,{p_1,p_2, p_3}}, s_2*) = (1,u_2*)

    4. MOP({O_13, {O_14}, <{p_1, p_2}, >, {O_4,{p_4,p_2}}, s_2*) = (1/2,u_1*)

      MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_4,{p_4,p_2}}, s_2*) = (0,u_2*)

    5. MOP({O_13, {O_14}, <{p_1, p_2}, >, {O_6,{ p_4}}, s_2*) = (0,u_1*)

      MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_6,{ p_4}}, s_2*) = (0,u_2*)

    6. MOP({O_13, {O_14}, <{p_1, p_2}, >, {O_7,{p_1,p_2, p_4}}, s_2*) = (1,u_1*)

      MOP({O_13, {O_14}, <{p_1, p_3}, >, {O_7,{p_1,p_2, p_4}}, s_2*) = (0,u_2*)

    Die unlösbaren Fälle bleiben unlösbar und die erkennbaren Fälle werden 'differenzierter'.


    A Concrete Empirical Measurement Theory for Classification


    Ein konkretes Beispiel für eine klassifizierende empirische Meßtheorie

    Nach diesen Überlegungen wird jetzt beispielhaft eine konkrete empirische Meßtheorie cl1* für Klassifikationsaufgaben angegeben.
    1. Def: EMT1(cl1*) &
    2. Def: A_spec = {Ax_5}
    3. Def: Ax_5 = '(A:t,r,i,k,m,o,k',u)( DAT(t,r,i,k,,(1,u)) => (~E:m',u')(DAT(t,r,i,k,,(1,u')))

      Da nach Voraussetzung das gleiche Meßinstrument m immer nur genau eine (positive oder negative) Zuordnung treffen kann, setzt das Auftreten eines Klassifikationskonfliktes voraus, daß bei Beibehaltung des Untersuchungszeitraums t, des Untersuchungsgebietes r sowie der beteiligten Untersucher i vom Typ k gleichzeitig wenigstens ein zweites Meßgerät m' benutzt wird, das für das gleiche Objekt o neben der Zugehörigkeit zur Klasse u auch noch die Zugehörigkeit zur Klasse u' behauptet.


    INHALT