Title: LFG als Interlingua in der maschinellen
1LFG als Interlingua in der maschinellen
Übersetzung
- Referat von Zuzana Pesselová
- am Mittwoch, den 05.02.2003
2Typen der MÜ (designs)
- direkte MÜ
- minimale Analyse
- transfer-basierte MÜ
- zunehmende Analyse
- kontrastive Basis
- interlingua-basierte MÜ
- maximale Analyse
- universelle Basis
3Interlingua
- Ziel Eine Repräsentation soll Hierarchien von
Substrukturen abbilden, dabei jedoch klare
Zwischenbeziehungen zeigen. - gewünschtes Ergebnis Eine Repräsentation des
Textes, die unabhängig von einer Einzelsprache
existiert ( Basis für die Generierung des
zielsprachigen Textes). - Nachteile Analyse und Generierung müssen streng
getrennt sein Während der Generierung ist es
nicht möglich, auf den Originaltext
zurückzugreifen.
4strukturelle Repräsentation in den
Interlingua-Systemen
- Propositionale Logik
- Any government is dependent on its supporters.
- All(X), government (X), indefinite (Y), plural
(Y), support (Y, X, T), depend on (X, Y, T),
timeless (T) - Wertung
- Problemlose Analyse, Generierung beinahe
unmöglich, da keine syntaktische Information
vorhanden. - Lösungen multilingual paraphrasing
- Every governmet has supporters which it depends
on. - People who support all governments are depended
on by them. - All governments depend on people who support them.
5strukturelle Repräsentation in den
Interlingua-Systemen
- LFG
- Zusammenfassung mehrerer Sprachen beim
gleichzeitigen Ausgleich deren Unterschiede.
6lexikalische Repräsentation in den
Interlingua-Systemen
- Konzepte
- sprachunabhängige lexikalische Einheiten
- meanings derived from the process of
understanding of texts - Text (sein linguistischer Inhalt), über Phänomene
(Einheiten, Aktionen, Begebenheiten) außerhalb
des Textes (außersprachliche Realität)
7Definition von Interlingua
- Eine Interlingua ist keine Sprache in
herkömmlichen Sinne, sondern eine Art der
Repräsentation (der Struktur). - Üblicherweise wird sie gezielt bei ausgewählten
Sprachpaaren oder bei mehreren verwandten
Sprachen angewandt.
8Die Interlingua-Grammatiken
- Generative Transformationsgrammatik (Chomsky,
seit 1955) - 50.-90. Jahre
- Oberflächenstruktur vs. Tiefenstruktur
- Transformationen, die eine TS in eine OS
überführen - Die Annahme, dass es sich um eine
sprach-unabhängige Basis für die semantische
Interpretation handelt, hat sich nicht bestätigt.
9Die Interlingua-Grammatiken
- 2. Kasusgrammatik(Fillmore, 1968)
- Vermutung, dass die Repräsentationen der
Kasusstruktur die Syntaxuniversalien abbilden - oft benutzt worden in bilingualen
transfer-basierten Systemen (z.B. Japanisch) - Problem Kasusrollen nicht standardisiert(no
widely agreed set of case relations)
10Maschinelle Übersetzung mit LFG
- 70. Jahre (Bresnan, Kaplan)
- als Kritik an GTG
- zwei Ebenen der syntaktischen Repräsentation
- C-Struktur (constituent-structure)
- F-Struktur (functional-structure)
- werden erzeugt über die Phrasenstrukturregeln
- zusätzlich
- Funktionen (als Grundbegriffe)
- Lexikoneinträge (mit lexikalischen Regeln)
11C-Struktur und F-Struktur
12C-Struktur und F-Struktur
- C-Struktur
- Phrasenstrukturbaum
- geordnete Aufstellung der Wörter und Phrasen des
Satzes - kontextfreie Notation
- F-Struktur
- hierarchische Funktion
- enspricht den grammatischen Funktionen (S, O,
etc.) - umfaßt auch morphosyntaktische Merkmale (Case,
Num, Tense)
13Transfer mit F-Strukturen
- Einlesen des Quellsprachensatzes (Parser)
- Ergebnis ist/sind F-Struktur(en) der Quellsprache
- Übersetzung der F-Struktur(en) mithilfe von
- Transfer-Lexikon (inkl. Subkategorisierung)
- Top-Down-Verfahren
- Ergebnis ist/sind F-Struktur(en) der Zielsprache
- Generieren der Oberfläche (Generator)
14Top down beim Transfer mit F-Strukturen
- Suche von PRED (zunächst das vom Wurzelknoten
dominierte PRED) - Überfprüfung der Valenz in der vorliegenden
F-Struktur - Suche vom Eintrag mit der gleichen Valenz
- Eintrag Grundlage für die F-Struktur der
Zeilsprache - anschl. PRED der nächste niedrigen Stufe wird
gesucht
15Transfer mit F-Strukturen
16Funktionen in der LFG
- Description-by-analysis
- Die Struktur kann nur diejenigen Eigenschaften
haben, die aus der Information abgeleitet wurde,
die in der vorliegenden Struktur explizit
identifiziert wurde. - Codescription
- Diese Beschreibungen lassen zu, dass die
endgültige Struktur Eigenschaften hat, die in der
F-Struktur nicht vorhanden sein können.
17Funktionen in der LFG
- Funktionen signalisieren das Überführen der
Strukturen in andere Strukturen (z.B. von
C-Strukturen zu F-Strukturen, von F-Strukturen zu
semantischen Strukturen).
18Vorgehensweise bei der MÜ mit LFG (Stufe 2)
- Die Beschreibung der zielsprachigen Strukturen
ist von den quellsprachigen Strukturen mittels
Analyse und Codescription abgeleitet. - Dabei werden zusätzliche Vermerke auf der Basis
der C-Strukturen und der lexikalischen Einheiten
gemacht. - Dies dient als Input für die Generierung der
zielsprachigen Version.
19Beispiel für die Leistungsfähigkeit
- The student is likely to work.
- Il est probable que letudiant travaillera.
20Beispiel für die Leistungsfähigkeit
- Berücksichtigung der Tempuskonkordanz
21Fazit des Ansatzes von Kaplan
- an approach to machine translation that exploits
the potential of simultaneous correspondences
between different levels of linguistic
representation - it allows partial specification and
multi-level-transfer
22Kommerzielle Nutzung
- XLE (Xerox Linguistic Environment)
- Xerox Palo Alto Research Center in California
- Xerox Research Center in Europe (Grenoble)
- Institut für maschinelle Sprachverarbeitung
(Stuttgart) - FUJITSU (Japan)
- NEC (Japan)