Title: LFG: Grammaire lexicale fonctionnelle
1LFG Grammaire lexicale fonctionnelle
- Annie Zaenen
- avec Ron Kaplan, Richard Crouch, Mary Dalrymple,
etc.
2Plan
- Caractéristiques théoriques
- Interface syntaxe-sémantique
- Implantation
3Aspects théoriques
4Idées directrices
- Forme externe/superficielle
- Lieu de variation entre les langues
- Forme interne/profonde
- Plus uniforme (mais jusquà quel point
exactement?)
5Formalisation
- Représentations multiples modélisant les
différents aspects des langues naturelles - Hétérogénéité des représentations
- Mise en correspondance fonctionnelle entre les
différentes représentations
6Forme extérieure
- Analyse en constituants, à la structuralisme
américain, définit lordre des mots et les sous
groupements de surface - Grammaire hors contexte
- Arborescence (avec relation dordre)
7Forme intérieure
- Pas de référence à la conceptualisation à la Von
Humboldt - Pas une représentation sémantique universelle
- Tentative de trouver une représentation plus
universelle que structure de constituants - Grammaire de dépendances
- Grammaire contextuelle
- Graphe (avec bouclesstructures réentrantes)
(sans relation dordre)
8Expressivité - complexité
linéaire
exponentielle
9Motivation pour la structure-c variation
linguistique
S
NP
VP
N
Adj
Det
V
NP
les
Aux
enfants
Det
N
V
petits
le
chien
ont
chassé
10Motivation pour la structure f les invariants
11Correspondances fonctionnelles entre les diverses
représentations
Encode les relations entre prédicats et arguments
Encode lordre et le groupement en syntagmes
12Grammaire LFG
Règles
Entrées lexicales
John ( PRED)John ( NUM)SG likes (
PRED)likelt( SUBJ) ( OBJ)gt ( SUBJ NUM)SG
)
(
- Combinaison de systèmes mathématiques simples
- Grammaire hors-contexteThéorie dégalités sans
quantificateurs - Les règles hors-contexte définissent les
arborescences - Les annotations donnent les équations que les
structures-f doivent satisfaire. - Si le système dégalités peut être résolu les
structures-c et les structures-f sont valides.
La structure-f est une solution du système
dégalités, en fait cest la solution minimale
qui est pertinente du point de vue linguistique.
13Les regles sont des conditions de bonne formation
S
SUBJ
NP
VP
Une arborescence contenant S dominant NP - VP est
OK si lunité-f correspondant au noeud NP est
le sujet de lunité-f
correspondant au noeud S la même unité-f
correspond au noeud S et au noeud VP
14Equations inconsistantes
f v et (v SUJ PERS)1 gt (f SUJ
PERS)1
Si un raisonnement valide conclut à FAUX, les
prémises sont insatisfaisables.
(f SUJ PERS)3 and (f SUJ PERS)1
gt 31 gt FAUX
15- Equations existentielles
- (? SUJ PERS) c 3
- Non monotonique mais pas essentiel
16Principes de bonne formation
- Principe dunicité le même attribut ne peut
apparaître deux fois dans une même
sous-structure-f - Principe de cohérence toutes les fonctions
sous-catégorisables doivent être gouvernées par
un prédicat local - Jean aime Marie Pierre
- Principe de complétude toutes les
sous-structures doivent comportées toutes les
fonctions gouvernées par un prédicat local - courent
17Exemple
Règles lexicales vouloir ( PRED)vouloirlt(
SUJ) ( OBJ)gt ( SUJ)( OBJ SUJ)
S
? ?
(? SUJ)?
VP
NP
Jean
(? OBJ)?
? ?
VP
V
veut
partir
18Extensions de la théorie originelle
- Incertitude fonctionnelle
- Traitements de la coordination
- Coordination de constituants
- Coordination de non-constituants
- Ordre fonctionnel
19Incertitude fonctionnelle
- Jean demande qui Marie pense que Paul regarde
- Jean demande qui tu penses que tout le monde
sait que Paul regarde
Préd
penserltSuj, Objgt
Regle S ? XP S ( TOP)( OBJ
OBJ) ( TOP) ?
Top
qui
Préd
Suj
Préd
Marie
Obj
Préd
regarderltSuj,Objgt
Suj
Préd
Paul
Obj
20Incertitude fonctionnelle
- Jean demande qui Marie pense que Paul regarde
- Jean demande qui tu penses que tout le monde
sait que Paul regarde
Préd
penserltSuj, Objgt
Regle S ? XP S ( TOP)( OBJ
OBJ) ( TOP) ?
Top
qui
Préd
Suj
Préd
Marie
Obj
Préd
regarderltSuj,Objgt
Suj
Préd
Paul
Obj
21- (f a) v ssi f est une structure-f, a est un
symbole et la paire lta,vgt ? f - (f a) v ssi f est une structure-f, a est un
ensemble de séquences, et il y a un s dans cet
ensemble a, pour lequel (f s) v - (f as) ((f a) s) pour un symbole a et une
séquence (peut-etre vide) de symboles s - (f e) f, pour la séquence vide e
22Incertitude fonctionnelle inversée
- Marie a dit que Pierre pense que Paul la vue
- (a f) g ssi g est une structure-f, a est un
symbole et la paire (a,f) ? g - (e f) f pour la séquence vide e
- (sa f) (s (a f)) pour un symbole a et une
séquence (peut-etre vide) de symboles s - (a f) g ssi g est une structure-f, a est en
ensemble de séquences et il y a un s dans
lensemble a pour lequel (s f) g - Note lincertitude inversée se comporte comme
une contrainte existentielle
23La coordination de constituants
- Jean prend et mange une pomme
S
NP
VP
Jean
NP
V
une pomme
V
Cnj
V
?
?
?
?
et
mange
prend
24Si a est un trait distributif et s est un
ensemble de structures-f, (s a)v ssi (f a) v
pour toutes les structures f qui sont membres de
lensemble s Si a est un trait non distributif,
(f a) v ssi la paire lta,vgt ? f. Les traits
associés avec et sont non distributifs
25Coordination de non-constituants
- David a présenté Chris à Marie et Jeanne à Pierre
- Point de depart VP? V NP PP
- La partie droite peut etre analysée comme VP-x
x-VP (ou VP-x ? V et x-VP ? NP NP dans lexemple
donne) - Comme la partie droite des regles LFG est une
expression réguliere, on peut lanalyser comme
ayant un préfixe (les constituants qui précedent
la coordination) et un suffixe composé des
constituants coordonnés
26Fonction inverse
- f f-précede g ssi pour tout n1 f-1(f) et pour
tout n2 f-1(g), n1 précede n2 - Ceci nest pas une relation dordre
27Projections
s
28Interface syntaxe-sémantique la colle sémantique
29Compositionalité
- Mais pas de correspondance directe entre les
règles hors contexte et la sémantique - La composition dépend essentiellement de la
structure-f - omdat Jan Marie een liedje leerde zingen
- parce que Jean Marie une chanson a-appris
a-chanter - La structure-f rassemble déjà tous les éléments
qui forment les unités sémantiques - Dautres projections peuvent jouer un rôle mineur
30Colle sémantique
- Permet plusieurs théories logiques, pour les
illustrations ici une logique de prédicat est
utilisée - Les instructions qui gèrent la combinaison de
sens sont traitées comme des prémisses dans une
déduction logique - Cette logique est une logique linéaire
31Constructeurs de sens
- Exemple
- Marcher V ( Préd) marcher(Suj)
- lX.marcher ( Suj)s o s
- Marcher est un prédicat avec un argument et si
nous trouvons une ressource sémantique pour le
sujet nous pouvons construire une ressource
sémantique représentant la phrase en consumant la
ressource sujet - David N ( Préd) David
- David s
32S
( Suj) ?
?
NP
VP
( Préd) David David s
David
( Préd) marcher(Suj) lX.marcher ( Suj)s o
s
marche
33S
Préd marcher(Suj)
(y Suj) d
NP
VP
Suj
Préd David
y
d
(d Préd) David David ds
David
(y Préd) marcher(Suj) lX.marcher (y Suj)s o
ys
marche
34Deduction (isomorphisme Curry-Howard)
- (sens) (colle)
- David ds
- lX.marcher ds o ys
-
- X f
- P f o g
- P(X) g
35Comparaison rapide a la grammaire catégorielle
- La composition de sens est un processus déductif
comme en grammaire catégorielle - Les primitifs sont des notions fonctionnelles et
non des séquences de surface - La sémantique est construite sur base dune
syntaxe plus abstraite et moins variable dune
langue à une autre quen grammaire catégorielle - La logique linéaire utilisée est commutative
tandisque la logique Lambek p.e. ne lest pas
36Pourquoi la logique linéaire?
- Notion de ressource et de consommation
- A - A, A A, B - A .
- Une bonne modélisation du fait quen langues
naturelles lajout ou la soustraction de mots
change le sens
37Est-ce que les principes de complétude et de
cohérence syntaxique peuvent être réduits aux
principes sémantiques gérés par la logique
linéaire
- Non
- pleut
- Jean mange
- Aussi Jean court rapidement
38Exemple de quantification
- Tout le monde marche
- Tout-le-monde (X, personne (X), marcher (X))
- Tout-le-monde N ( Préd) tout-le-monde
- lS.tout-le-monde(X, personne
X, S (X)) VH. s o H o H - H est une variable sur les structures sémantiques
qui correspondent aux portées possibles du
quantificateur
39 S
Préd marcher(Suj)
NP
VP
Suj
Préd tml
y
d
lS.tout-le-monde(X, personne X, S (X)) VH. ds
o H o H
Tout le monde
lX.marcherds o ys
marche
40- Tout-le-monde(X, personne) lY.marcher(Y)(X))
- Tout-le-monde(X, personne(X), marcher(X))
41Modificateurs a portée ambigüe
- Dérivations multiples à partir dun ensemble
unique de prémisses
Prémises criminel f
soi-disant f ? f de-Londres f ? f
Deux dérivations distinctes 1.
de-Londres(soi-disant(criminel)) 2.
soi-disant(de-Londres(criminel))
42Quantification ambigüe
43(No Transcript)
44Ce qui est implanté pour la colle
- Implication et logique propositionnelle avec
variables sur des propositions atomiques - Lextension à un fragment tenseur est prévue
- Lextension à un fragment avec exponentielle
pourrait ne pas être nécessaire
45Commutativité
- LL non-commutative (p.e. Lambek) (ohne weiteres)
- deux portées pour tout le monde a vu quelque
chose - mais seulement 3 portées pour les constructions
ditransitives - Une différente portée pour lobjet direct et
lobjet indirect nécessite un changement de
lordre des mots - LL commutative
- 6 portées
- La logique dassemblage sémantique est
commutative - La logique qui rend compte de lordre des mots
est non-commutative
46Aspects computationnels
47Les grammaires LFG sont des grammaires
contextuelles
- J Implantation transparente à partir de
composants existants parseurs hors contexte et
un solveur déquations - Lanalyse hors contexte est cubique
- La solution déquations est linéaire
- mais
- L la combinaison mène à des computations
exponentielles - Thème de recherche Efficacité
- Optimisations locales
- Solutions cubiques la plupart du temps
48Sources de complexité
- Combinaisons booléennes des contraintes
- Nombre exponentiel darborescences
49Lambiguïté est explosive
si les choix se multiplient à travers les
composantes du système
50- Remède lutilisation dheuristiques pour
éliminer des hypothèses
X
X
X
Syntax
Semantics
Discourse
Tokenize
Morphology
X
Rapide mais le résultat est souvent erroné
51Stratégies
- Restrictions formelles
- Attendre les effets de la loi de Moore (le
problème général reste insoluble mais dans les
cas concrets ça marche) - Optimiser pour les cas fréquents
- Par exemple en général les disjonctions
distantes (dans la phrase) ninteragissent pas
52Gestion des ambiguïtés en XLE
Combien de moutons? Combien de poissons?
The sheep saw the fish.
- Si les choix sont indépendants les options
peuvent être condensées - Le système est optimisé pour des choix
indépendants et condensés
53Une des idees cles Contraintes contextualisees
- (a v b) x (c v d) ?
- p ? a p?b x q ?c q ?d
- P, q contextes
- a, b, c, d faits
- Produit une conjonction plate de faits
contextues, la disjonction a disparu
54Bibliographie
- Bresnan, J. (ed) (1982) The Mental Representation
of Grammatical Relations, The MIT Press - Butt, M. , T.King les actes des colloques
annuels LFG, URL csli-publications.stanford.edu/
LFG/ - CrouchR J van Genabith (in preparation) Linear
logic for linguists, URL www.cs.bham.ac.uk/essll
i/notes/crouch - Dalrymple, M., R.Kaplan, J. Maxwell, A. Zaenen
(eds) (1995) Formal Issues in LFG, CSLI
Publications - Dalrymple, M. (ed) (1999) Semantics and Syntax in
LFG the resource logic approach, The MIT Press - Dalrymple, M. (2001) LFG, Academic Press