FB2 - THEORETISCHE INFORMATIK

Einführung
Parsing von Kontextfreien Sprachen
Bsp: Top down Parsing
Bsp: Bottom up Parsing
Probleme beim Top-Down Parsing
Top down Parsing und Dynamische Programmierung; der EARLY-Parser
Prädiktive Parser und LL(1)-Grammatiken
Allgemeiner Bottom-up Parser (CYK)
Spezielle Bottom-up Parser und LR(1)-Grammatiken
Testfragen und Übungsaufgaben

I-THINF WS 0203 - Vorlesung mit Übung
VL12: Kontextfreie Sprachen II - Parsing

                    Achtung : Skript gibt nur einen Teil der mündlichen Vorlesung wieder !!!

AUTHOR: Gerd Döben-Henisch
DATE OF FIRST GENERATION: Dec-15, 2002
DATE OF LAST CHANGE: Dec-20, 2002
EMAIL: Gerd Döben-Henisch

1. Einführung

Nach der Einführung des Konzeptes einer kontextfreien Grammatik und des zugehörigen Kellerautomaten soll nun das Thema aus Sicht des Parsing analysiert werden.

Parsing kann man entweder auffassen als (i) die Abbildung einer terminalen Kette K aus den terminalen Elementen T_g* einer Grammatik g in den Ableitungsbaum S_g der Grammatik g oder aber (ii) als die Abbildung in die akzeptierenden Endzustände (oder ausgezeichnete Kellerzeichen) eines Automaten a. In dieser Vorlesung betrachten wir den Fall (i).

START

2. Parsing von Kontextfreien Sprachen

Bezüglich der Algorithmen, die sprachliche Ausdrücke erkennen können, gibt es die grobe Unterscheidung in Top down oder Bottom up sowie Generell und speziell (siehe Tabelle):

	TOP DOWN	BOTTOM UP
GENERELL	Early (Top Down, CFG) Polynomial Time Algorithms	CYK (Bottom up, CNF) Polynomial Time Algorithms
SPEZIELL	LL Linear Time algorithms	LR Linear Time algorithms

Mit 'generell' ist gemeint, dass dieser Algorithmus alle kontextfreien Sprachen erkennen kann, mit speziell, dass es nur eine Untermenge ist.

Ein Top down Parser analysiert eine Eingabe dadurch, dass er mit dem Startsymbol beginnt und solange Ableitungen erzeugt, bis er eine terminale Kette erzeugt hat, die mit der Eingabe übereinstimmt.

Ein Bottom up Parser analysiert seine Eingabe, indem er ausgehend von den terminalen Zeichen der Eingabe Erzeugungsregeln sucht, mittels deren Teile der Eingabe erzeugt werden konnten. Darauf aufbauend werden weitere Erzeugungsregeln gesucht, solange, bis nur noch das Startsymbol übrig bleibt.

Es werden zunächst zwei einfache Beispiele gegeben. Beide Beispiele benutzen die folgende einfache Grammatik aus der letzten Vorlesung:

S ---> AB
A ---> ab | aAb
B ---> c | cB

Bei der Eingabe soll es sich in beiden Fällen um folgenden String handeln: 'aabbccc'

START

3. Bsp: Top down Parsing

Einfaches paralleles Top-Down Parsing

START

4. Bsp: Bottom up Parsing

Einfaches paralleles Bottom-up Parsing

START

5. Probleme beim Top-Down Parsing

Die folgenden Überlegungen zum Top-Down Parsing basieren zu grossen Teilen auf dem sehr informativen Reader von [JURAFSKY/MARTIN 2000:357ff]. Ergänzend [AHO et al 1988].

Die wichtigsten Probleme bei einem einfachen Top-Down Parser sind:

Linksrekursivität

Mehrdeutigkeit (Ambiguität)

Backtracking

START

6. Top down Parsing und Dynamische Programmierung; der EARLY-Parser

Eine Lösung der zuvor genannten Probleme bietet dynamisches Programmieren. Ein Algorithmus, der sich dynamisches Progammieren zunutze macht, ist der EARLY-Algorithmus (EARLY 1970).

...EARLY-Algorithmus...

Obwohl der EARLY-Algorithmus vom Zeitverhalten her schon polynom ist, d.h. einen Zeitbedarf von O(N³) besitzt (N ist die Anzahl der Elemente in der Eingabe), ist er für die Praxis im allgemeinen zu langsam. Es gibt effizientere Algorithmen mit einem linearen Zeitbedarf.

START

7. Prädiktive Parser und LL(1)-Grammatiken

Sogenannte prädiktive Parser kommen ohne Rekursion aus; sie benötigen nur noch lineare Zeit, können dafür allerdings nur eine Untermenge der kontextfreien Sprachen erkennen, nämliche jene, die durch sogenannte LL(1)-Grammatiken definiert werden.

Beschreibung eines prädiktiven Parsers...

START

8. Allgemeiner Bottom-up Parser (CYK)

...Ausführung, Beispiele ...

START

9. Spezielle Bottom-up Parser und LR(1)-Grammatiken

LR(1)-Parser sind stärker als LL(1) Parser, aber haben dennoch nur linearen Zeitbedarf. Konkrete Beispiele für LR(1)-Parser kann man mit dem Parsergenerator 'yacc' ('yet another compiler-compiler') oder durch den verbesserten GNU-Parsergenerator Bison erzeugen (siehe auch lex/yacc für Windows)

Obgleich die LR(1)-Grammatiken eine Untermenge der Kontextfreien Grammatiken sind, kann man die meisten in der Praxis auftretenden Fälle von kontextfreien Sprachen mit LR(1)-Parsern bewältigen.

...Ausführung, Beispiele ...

START

10. Übungsaufgaben

Werden in der Übung gegeben.

START

I-THINF WS 0203 - Vorlesung mit Übung VL12: Kontextfreie Sprachen II - Parsing

1. Einführung

2. Parsing von Kontextfreien Sprachen

3. Bsp: Top down Parsing

4. Bsp: Bottom up Parsing

5. Probleme beim Top-Down Parsing

6. Top down Parsing und Dynamische Programmierung; der EARLY-Parser

7. Prädiktive Parser und LL(1)-Grammatiken

8. Allgemeiner Bottom-up Parser (CYK)

9. Spezielle Bottom-up Parser und LR(1)-Grammatiken

10. Übungsaufgaben

I-THINF WS 0203 - Vorlesung mit Übung
VL12: Kontextfreie Sprachen II - Parsing