Title: Linguistische Grundlagen
1Linguistische Grundlagen
- Repräsentationsformen
- Dependenz
- Konstituenz
- Merkmalstrukturen
- Modelle
- Dependenzgrammatik
- Kategorialgrammatik
- Phrasenstrukturgrammatik Transformationen
- Unifikationsgrammatiken
2Dependenz
- Eine Dependenzgrammatik (DG) ist eine Grammatik,
in der die syntaktische Struktur primär in Form
von Dependenzrelationen (Abhängigkeitsbeziehungen)
zwischen den Basiselementen (den Wörtern)
ausgedrückt wird. - Eine Dependenzrelation ist eine zweistellige
gerichtete Relation zwischen zwei Elementen der
gleichen Strukturebene in einem Satz. Eines der
Elemente (das Dependens) hängt morphologisch,
syntaktisch oder semantisch von dem anderen (dem
Regens) ab.
3Dependenzgrammatik
- Der Begriff der Abhängigkeit findet sich bereits
in den Arbeiten der frühesten bekannten
Grammatiker, z.B. der griechischen Gelehrten
Thrax und Apollonius und danach Römischer
Gelehrter wie Priscian. - Der Dependenzbegriff findet sich auch in den
Schriften Europäischer Gelehrter des
Mittelalters, insbesondere bei den Modisten und
Vertretern der spekulativen Grammatik, so z.B.
bei Thomas von Erfurt. - Die wichtigste Rolle in der Entwicklung der DG
spielte jedoch Lucien Tesnière, der als erster
Sprachwissenschaftler einen Formalismus zur
Darstellung von Dependenzstrukturen
herausgearbeitet hat. Seine Ideen wurden in dem
1959 posthum erschienenen Werk Eléments de
syntaxe structurale dargelegt. - Viele Arbeiten zur Dependenzgrammatik in den USA
in den sechziger Jahren zielten darauf ab,
Probleme der maschinellen Übersetzung zu lösen. - Nach einer Pause von 20 Jahren, in der nur in
wenigen MÜ-Projekten DG verwendet wurde, lebte
das Interesse in den 1980 Jahren wieder auf. Es
entstanden mehrere größere Projekte, die DG
verwendeten, darunter EUROTRA und DLT.
4Dependenz
A very tall professor with grey hair wrote this
boring book
professor wrote book
professor
wrote
5Dependenz
A very tall professor with grey hair wrote this
boring book
N(professor)
V(wrote)
N(book)
D(a)
A(tall)
P(with)
Adv(very)
N(hair)
D(this)
A(boring)
A(grey)
6Dependenz
N
V
N
D
P
A
Adv
N
D
A
A
A very tall professor with grey hair
wrote this boring book
7Dependenz
Fin
N
V
N
D
P
A
Adv
N
D
A
A
A very tall professor with grey hair
wrote this boring book
8Dependenzregeln
- Fin ? N V
- N ? D (A) (P)
- V ? (N) (N) (P)
- P ? N
- A ? Adv
- D ? a, this
- N ? professor, hair, book
- V ? wrote,
- A ? tall, boring,
- P ? with,
9Dependenz
Eine regierende Kategorie X zusammen mit allen
abhängigen konstituiert eine X-Phrase (XP), wobei
X N, V, A, P
Fin
N
V
N
D
P
A
Adv
N
D
A
A
A very tall professor with grey hair
wrote this boring book
10Konstituentenregeln (Phrasenstrukturregeln)
- S ? NP VP
- NP ? D (AP) N (PP)
- VP ? V (NP)(PP)
- PP ? P NP
- AP ? Adv A
- D ? a, this
- N ? professor, hair, book
- V ? wrote,
- A ? tall, boring,
- P ? with,
11Phrasenstruktur- und Transformationsgrammatik
- PSG und TG sind beides Grammatikformalismen, die
im wesentlichen aus dem Forschungsrahmen der
generativen Grammatik (im engeren Sinne)
entstammen (Chomsky). - Entwicklung
- Die bis in die 50er Jahre zurückreichende
generative Grammatik hat über die Zeit
verschiedene Entwicklungsstufen durchlaufen. - Die mit diesem Ansatz assoziierten
Grammatikmodelle haben entsprechend
unterschiedliche Bezeichnungen - Standardtheorie (60er Jahre)
- Rektions- und Bindungstheorie (80er Jahre)
- Minimalist Program (90er Jahre bis heute).
- Obwohl steter und z.T. drastischer Modifikation
unterzogen, haben sich doch bestimmte
grammatiktheoretische Annahmen konstant gehalten.
12Generative Transformationsgrammatik
- Die Konstrukte 'Oberflächen-' und
'Tiefenstruktur', die bereits in den Anfängen der
generativen Grammatik Verwendung fanden, finden
sich - in modifizierter Form, z.B. mit leicht
unterschiedlicher Funktion - auch in modernen
Theorievarianten wieder. - Das verbindende Element zwischen der Oberflächen-
und der Tiefenstruktur sind die Transformationen,
die eine gegebene TS in eine OS überführen.
13GTG Standardtheorie
- In der Standardtheorie ist man davon ausgegangen,
daß jeder Satz über zwei Strukturebenen verfügt
die Ebene der Tiefenstruktur und die Ebene der
Oberflächenstruktur. Grund für diese Annahme
waren ua. sprachliche Phänomene wie die Beziehung
Aktiv/Passiv hier wird derselbe
außer-sprachliche Sachverhalt in zwei
verschiedenen Formen wiedergegeben. - John kicked the dog / The dog was kicked by John
- Solche Sätze wurden zueinander in Beziehung
gesetzt, indem die unter-schiedlichen
Oberflächenstrukturen aus einer gemeinsamen
Tiefenstruktur abgeleitet wurden. Diese TS wurde
in Form eines Phrasemarkers repräsentiert, der
selber das Ergebnis der Anwendung von
Phrasenstrukturregeln war. - In anderen Fällen verhielt es sich umgekehrt
zwei gleiche Oberflächenstrukturen entsprangen
unterschiedlichen Tiefenstrukturen. Dieses ist
beispielsweise bei struktureller Mehrdeutigkeit
der Fall - The boy tied the man with a tie
14Architektur der GTG
15Kategorialgrammatik
- Der Terminus 'Kategorialgrammatik' umfaßt eine
ganze Reihe von Theorien über algorithmische
Verfahren zur syntaktischen und semantischen
Analyse von Sätzen. - Entwicklung
- Anfänge in den 20er Jahren (Lesniewski,
Ajdukiewicz) - erste Anwendung auf natürliche Sprachen in den
50er Jahren (Bar-Hillel) - verlor in den 60er Jahren stark an Bedeutung
- neues Interesse an kategorialgrammatischen
Ansätzen in den 70er Jahren (Stichwort
Montague-Grammatik, ROSETTA) - stete Erweiterung und Modifikation seit Mitte der
80er Jahre(Steedman)
16Kategorialgrammatik
- Grundelemente der KG sind die KATEGORIEN, die
sich jedoch bezüglich ihrer Form und ihres
Informationsgehaltes fundamental von
'herkömmlichen' Kategorien (N, V, PP, AP usw.)
unterscheiden. - Kerngedanke hinter der Struktur der Kategorien
ist die Annahme, bestimmte syntaktische und
semantische Information, die mit einem Lexem
verbunden ist, direkt in der Kategorie zu
kodieren. Beispiel - einem intransitiven Verb, wie z.B. died, würde in
der Kategorialgrammatik eine Kategorie
zugewiesen, aus der klar ablesbar ist, daß sich
dieser Ausdruck zusammen mit einem NP-artigen
Ausdruck zu einem Satz verbindet.
17Kategorialgrammatik
- Die klassische Kategorialgrammatik kennt zwei
Basiskategorien S und N. - Diese Basiskategorien können über die folgende
Regel zu einer komplexen Kategorie kombiniert
werden - wenn A eine Kategorie ist und B eine Kategorie
ist, dann ist auch A/B eine Kategorie. - Damit wären als Kategorien etabliert S/N und
N/S. - Da eine komplexe Kategorie aber selber wieder
Input für eine komplexe Kategeorie sein kann, ist
das kategoriebildende Potential einer KG
praktisch unbegrenzt
18Kategorien der KG
A B A/B
S N S/N
S/N N (S/N)/N
(S/N)/N S ((S/N)/N)/S
S/N S (S/N)/S
19Regel der KG
- Auf der Basis dieser Kategorien reicht eine
einzige Syntax-Regel, um Phrasen bzw.
Konstituenten abzuleiten. - Diese Regel wird Funktionsanwendung genannt und
hat die folgende Form - Ist a von der Kategorie A/B und b von der
Kategorie B, dann ist ab von der Kategorie A - Ist a von der Kategorie A und b von der Kategorie
A\B, dann ist ba von der Kategorie A. - (Tip die Multiplikation eines Bruches mit dem
Wert des Nenners ergibt den Zähler 1/2 x 2 1
3/8 x 8 3 usw.) - Beispiel John (ein Eigenname) ist von der
Kategorie N, jumped (ein intransitives Verb) ist
von der Kategorie S\N. Nach der zweiten Regel
gilt dann John jumped ist von der Kategorie S
(ein Satz).
20Kategorie - Funktionsanwendung
- Definition 'Kategorie
- Es gibt eine endliche Menge von Basiskategorien,
z.B. N ( Name) und S ( Satz) - Es gibt einen Operator in den beiden Ausprägungen
'/' und '\'. - Jede Basiskategorie ist eine Kategorie
- Wenn A und B Kategorien sind, sind auch A/B und
A\B Kategorien - Regel Funktionsanwendung
- Wenn x von der Kategorie A/B ist und y von der
Kategorie B dann ist xy von der Kategorie A - Wenn x von der Kategorie A\B ist und y von der
Kategorie B dann it yx von der Kategorie A.
21Lexikon
Zur Beschreibung unseres Satzes a very tall
professor with grey hair wrote this boring book
benötigen wir folgende Kategorien
- Basiskategorien
- Det (a, this)
- Appelativa (professor, hair, book)
- Adjektive (tall, grey, boring)
- Gradadverb (very)
- Transitives Verb (wrote)
- Präposition (with)
- S und N
- N/(N/N)
- N/N
- (N/N)/(N/N)
- ((N/N)/(N/N))/((N/N)/(N/N))
- (S\N)/N
- ((N/N)\(N/N))/N
22Parsing mit KG
a
very
tall
professor
with
grey
hair
wrote
this
boring
book
23Kategorialgrammatik
- Wesentliche Merkmale einer KG
- synchroner Aufbau von syntaktischer und
semantischer Strukturbeschreibung - Kodierung syntaktischer/semantischer Information
in den Kategorien. - Die Art der Kategorisierung lexikalischer und
syntaktischer Kategorien hat Auswirkungen auf das
Verhältnis zwischen den einzelnen Komponenten der
Grammatik. - Die traditionelle KG kommt mit einer einzigen
Syntax Regel aus. Durch diesen radikalen
Lexikalismus, hier also die Angabe der
syntaktischen Merkmale eines Lexems bereits im
Lexikon, wäre es redundant, diese Art der
Restriktion nochmals durch Syntax Regeln zu
erfassen. - Der Nachteil aber ist, daß die Kategorienkomponent
e, wie gesehen, extrem aufgebläht werden muß, um
den möglichen syntaktischen Kombinationen, die
ein lexikalisches Element eingehen kann, Rechnung
zu tragen.
24Unifikationsgrammatiken
- Unifikationsgrammatik steht für eine Reihe
moderner Grammatikformalismen, bei denen
Merkmalstrukturen und deren Unifikation für die
Ableitung grammatisch korrekter Formen eine
zentrale Rolle spielt. - Dazu gehören u.a.
- die LFG ( Lexical-Functional Grammar)
- die GPSG ( Generalized Phrase Structure Grammar)
- die HPSG (Head-Driven-Phrase-Structure Grammar)
25Merkmalstrukturen
- Eigenschaften linguistischer Objekte
(Linguistische Elemente wie z.B. Wörter oder
Phrasen) werden in einer Unifikationsgrammatik
als Bündel von Merkmalen verstanden. - Diese Merkmalstrukturen haben die Form von
Attribut-Wert Paaren, wobei die Werte entweder
atomare Symbole oder aber selber wieder
Merkmalstrukturen sein können.
26Unifikation
- Unifikation ist eine formale Operation, bei der
zwei kompatible Merkmalsstrukuren zu einer neuen
Merkmalsstruktur vereinigt werden können
27Unifikation
- Stimmen allerdings die Werte jeweils gleicher
Attribute nicht überein, können die
Merkmalstrukturen nicht unifiziert werden
28LFG
- Erste Anfänge der LFG finden wir Ende der
siebziger Jahre (Bresnan, Kaplan), z.T. motiviert
aus der Kritik an der damaligen Modellvariante
der generativen Transformationsgrammatik. - Im Unterschied zu selbiger haben in der LFG z.B.
die grammatischen Funktionen den Status von
Grundbegriffen, sind also nicht aus bestimmten
Strukturen abgeleitet. - Phänomene, die in der TG über Transformationen
erklärt wurden, werden hier als primär
lexikalisch behandelt und also durch
entsprechende Lexikoneinträge bzw. lexikalische
Regeln beschrieben. - In einer LFG werden zwei Ebenen der syntaktischen
Repräsentation unterschieden - die C- (Constituent)-Structure und die
- F(Functional)-Structure
- Diese werden parallel über die Phrasenstrukturrege
ln der Grammatik erzeugt werden.
29Standard Theorie
30Architektur der LFG
31F-Strukturen in LFG
- Die F-Struktur ist eine Merkmalsstruktur, deren
Attribute sowohl die grammatischen Funktionen
(SUBJ, PRED) wie auch morphosyntaktische Merkmale
wie z.B. CASE, NUM oder TENSE umfassen.
32Transfer mit F-Strukturen
- John likes the dog
- Der Hund gefällt John
-
- (PRED) 'like lt(SUBJ1) (OBJ2)gt'
- ß Transfer Ý
- (PRED) 'gefallen lt(SUBJ2) (OBJ1)gt'
33Transfer mit F-Strukturen
TRANSFER
34F-Struktur
Subj
PRED 'write lt(Subj)(Obj)gt'
Tense Past
Obj
Spec Mod PRED 'boring' PRED 'book'