Cours 7 - PowerPoint PPT Presentation

About This Presentation
Title:

Cours 7

Description:

Exemple de propri t commune ces groupes. Peuvent tre suivis d'un verbe dans une phrase ... [l'h tel], [seul], [apr s avoir] [recommand ] [ son domestique] [de l'attendre] ... – PowerPoint PPT presentation

Number of Views:66
Avg rating:3.0/5.0
Slides: 33
Provided by: lapo4
Category:
Tags: cours | recommande

less

Transcript and Presenter's Notes

Title: Cours 7


1
Cours 7
  • Grammaires algébriques
  • Constituants syntaxiques

2
Syntaxe
  • Je vais fermer l'autre porte
  • autre fermer je l'porte vais
  • Comment les mots se combinent-ils en phrases qui
    ont un sens ?
  • Dans quel ordre ?
  • Quelles combinaisons sont possibles ?

3
Constituants syntaxiques
  • Certaines suites de mots dans une phrase forment
    des constituants
  • Exemple groupes nominaux
  • vingt autres journaux
  • l'Inde
  • l'offre
  • une seconde section d'équilibristes
  • l'un des meilleurs bâtiments à voile de la
    compagnie
  • Exemple de propriété commune à ces groupes
  • Peuvent être suivis d'un verbe dans une phrase

4
Constituants syntaxiques
  • vingt autres journaux titrent...
  • l'Inde est...
  • l'offre parvient à...
  • une seconde section d'équilibristes arriva
  • l'un des meilleurs bâtiments à voile de la
    compagnie peut...
  • ce n'est pas vrai de n'importe quelle séquence de
    mots
  • journaux titrent...
  • l'parvient à...
  • seconde d'équilibristes arriva
  • On doit donc pouvoir spécifier "un groupe nominal
    peut être suivi d'un verbe"

5
Constituants syntaxiques
  • Exemple groupes nominaux prépositionnels
  • depuis quelques mois
  • Déplacement de ce groupe
  • Depuis quelques mois la situation évolue
  • La situation depuis quelques mois évolue
  • La situation évolue depuis quelques mois
  • ce n'est pas vrai de n'importe quelle séquence de
    mots
  • Depuis mois la situation quelques évolue
  • La depuis situation quelques mois évolue
  • La situation mois évolue depuis quelques

6
Grammaires algébriques
  • Context-free grammars
  • Outil de manipulation des constituants
    syntaxiques
  • Règles indiquent la combinaison et l'ordre des
    éléments
  • GN --gt Det N GAdj
  • GN --gt Npr
  • GAdj --gt GAdv Adj
  • GAdv --gt GAdv Adv
  • GAdv --gt Adv
  • Lexique Liste des mots (symboles terminaux)
  • Liste des symboles non terminaux GN GAdj GAdv
    Det...

7
Grammaires algébriques
  • Les règles peuvent comporter des mots dans le
    membre droit
  • Npr --gt Luc
  • Det --gt un
  • N --gt bâtiment à voile
  • Adj --gt réputé
  • Adv --gt assez
  • GN --gt Det offre de GN
  • Membre gauche obligatoirement un non-terminal
  • Membre droit séquence de symboles terminaux ou
    non terminaux

8
Dérivation
  • Réécriture utilisant les règles
  • GN --gt Det N GAdj (règle)
  • --gt Det N GAdv Adj (règle GAdj --gt GAdv Adj )
  • --gt Det N Adv Adj (règle GAdv --gt Adv )
  • --gt un N Adv Adj (règle Det --gt un )
  • --gt un bâtiment à voile Adv Adj (règle N --gt
    bâtiment à voile )
  • --gt un bâtiment à voile assez Adj (règle
    Adv --gt assez )
  • --gt un bâtiment à voile assez réputé (règle
    Adj --gt réputé )
  • On peut dériver un bâtiment à voile assez réputé
    de GN

9
Arbre de dérivation
GN
GAdj
Det
Adj
N
GAdv
Adv
un
bâtiment à voile
assez
réputé
10
Axiome
  • Le langage formel engendré par la grammaire est
    l'ensemble des séquences de terminaux dérivables
    à partir de l'axiome
  • Axiome
  • un des non-terminaux
  • Si la grammaire engendre des phrases, l'axiome
    correspond au symbole "phrase"
  • Phrase grammaticale
  • phrase engendrée par la grammaire
  • Analyse syntaxique
  • associer à une phrase son (ou ses) arbres de
    dérivation

11
Règles pour les phrases
  • P --gt GN préfère GN Luc préfère cette compagnie
  • P --gt GN quitte GN Prép GN
  • Luc quitte Paris vers 10 h
  • P --gt GN part Prép GN
  • Luc part après la réunion

P
GN
GN
Det
N
préfère
cette
Luc
compagnie
12
Règles pour les phrases
  • P --gt montrez-PRO GN Montrez-moi tous les vols
  • P --gt est-ce que il y a GN Prép GN ?
  • Est-ce qu'il y a un dîner sur le vol 312 ?
  • P --gt GN proposent GN ?
  • Quels vols proposent un dîner ?
  • Notation parenthésée
  • (P (GN (Det Quels) (N vols)) proposent (GN (Det
    un) (N dîner)) ?)

13
Constituants non récursifsou chunks
  • Constituants qui ne contiennent pas un
    constituant de la même catégorie
  • Exemple
  • (GN l'un des meilleurs bâtiments à voile de (GN
    la compagnie))
  • Un GN inclus dans un autre
  • Le petit est un chunk, le grand non
  • (GN (GN l'un des meilleurs bâtiments à voile)
    de (GN la compagnie))
  • Une suite de deux chunks
  • Si le GN est précédé d'une préposition, on
    l'inclut dans le chunk

14
Constituants non récursifsou chunks
  • Parmi ces passagers du Mongolia, on
    comptait divers fonctionnaires civils et des
    officiers de tout grade
  • Une phrase est presque une séquence de chunks,
    surtout nominaux
  • on comptait chunk verbal
  • M. Fogg quitta l'hôtel, seul, après
    avoir recommandé à son domestique de
    l'attendre
  • seul chunk adjectival
  • Oui ! oui ! répétait machinalement le
    pauvre garçon
  • machinalement chunk adverbial

15
Règles pour les groupes nominaux
  • GN --gt Det N un arrêt
  • GN --gt Det Adj N une petite attente
  • GN --gt Det GAdj N la plus longue attente
  • GN --gt Det N GAdj un coût trop élevé
  • GN --gt Det de N beaucoup d'attente
  • GN --gt Det N Prép GN les vols pour Toulouse
  • GN --gt Det N Rel
  • les vols qui arrivent à Toulouse avant midi
  • GN --gt Det N Prép GN Prép GN
  • les vols de la soirée pour Toulouse

16
Ambiguïté
  • La tempête n'a pas eu l'ampleur redoutée en
    raison de la concomitance d'une forte marée
  • (Le Monde 12 novembre 2007)
  • A paper in this week's Science purports to
    identify an impact crater as big as the famous
    "dinosaur killer" at Chicxulub, in Mexico
  • (The Economist 15 mai 2004)

17
Ambiguïté
  • les vols de (la soirée de lundi) pour Toulouse
  • les réponses de Luc à (plusieurs questions de
    Marie)

GN
Det
N
Prép
Prép
GN
GN
les
vols
de
Npr
pour
Det
N
GN
Prép
lundi
Toulouse
la
soirée
de
18
Ambiguïté
  • les vols de (la soirée de lundi) pour Toulouse
  • les réponses de Luc à (plusieurs questions de
    Marie)

GN
Det
N
Prép
Prép
GN
GN
Npr
les
réponses
de
à
Det
N
GN
Prép
Luc
plusieurs
questions
de
Npr
Marie
19
Ambiguïté
  • le livre de (la fille sur la photo) dans le sac
  • le livre de la fille sur (la photo dans le sac)

GN
Det
N
Prép
Prép
GN
GN
le
livre
de
sur
Det
N
GN
Prép
Det
N
la
photo
dans
la
fille
Det
N
le
sac
20
Règles pour la coordination
  • GN --gt GN Conj GN un arrêt et une attente
  • P --gt P Conj P On s'arrête et on attend
  • GAdj --gt GAdj Conj GAdj tentant mais dangereux
  • etc.
  • GN --gt Det N Prép GN les vols pour Toulouse
  • GN --gt Det N Prép GN Conj Prép GN
  • les vols pour Toulouse ou depuis Toulouse

21
Accord grammatical
  • P --gt GN attend Le public attend
  • Le GN est obligatoirement au singulier
  • Les spectateurs attend
  • P --gt GN attendent Les spectateurs attendent
  • Le GN est obligatoirement au pluriel
  • Le public attendent
  • On considère les traits du GN et de attendre
    comme des paramètres
  • On ajoute des équations aux règles

22
Accord grammatical
  • P --gt GN ltattendregt
  • GN.nombre ltattendregt.nombre
  • GN.personne ltattendregt.personne
  • Le public attend
  • Les spectateurs attendent
  • Vous attendez
  • Les équations peuvent être vérifiées par
    unification

23
Têtes des constituants
  • Le mot le plus important de chaque constituant
    est appelé sa tête

P (préfère)
GN (compagnie)
GN (Luc)
Det (cette)
N (compagnie)
préfère
cette
Luc
compagnie
24
Grammaires de dépendance
  • On remplace chaque symbole non terminal par la
    tête correspondante, et on supprime le noeud
    redondant
  • Arbre de dépendance

préfère
préfère
compagnie
compagnie
Luc
Luc
compagnie
cette
cette
préfère
Luc
cette
compagnie
25
Grammaires de dépendance
  • Informations perdues
  • - étiquettes des constituants (on compense en
    ajoutant des étiquettes aux arêtes)
  • - ordre des mots (on compense si nécessaire en
    ajoutant des contraintes sur l'ordre des mots)

préfère
objet
sujet
compagnie
Luc
déterminant
cette
26
Lexicalisation
  • Lorsqu'un mot a des compléments, la forme des
    compléments dépend du mot
  • P --gt GN ltpréférergt GN à GN
  • Luc préfère cette compagnie à la concurrence
  • P --gt GN ltquittergt GN Luc quitte Paris
  • P --gt GN ltpartirgt Prép GN Luc part pour Toulouse
  • Nombre de compléments
  • Prépositions devant les compléments
  • Grammaire lexicalisée
  • Chaque règle comporte au moins un mot du lexique
    (la tête en général)
  • Nombre de règles nombre de mots x nombre de
    constructions

27
Grammaires non lexicalisées
  • On regroupe tous les mots qui entrent dans une
    même construction
  • On fait une règle commune
  • P --gt GN V GN à GN V.N1àN2 ""
  • Luc préfère cette compagnie à la concurrence
  • P --gt GN V GN V.N1 ""
  • Luc quitte Paris
  • Luc préfère cette compagnie
  • P --gt GN V Prép GN
  • V.PrépN1 "" V.Prép Prép
  • Luc part pour Toulouse

28
Analyse syntaxique
  • Parsing
  • Entrées une phrase étiquetée et une grammaire
    algébrique
  • Sorties le ou les arbres de dérivation de la
    phrase
  • Algorithmes
  • Ascendants
  • Descendants
  • Programmation dynamique
  • Cascade de transducteurs

29
Transducteurs
  • Un transducteur fini est un automate fini dont
    les transitions sont étiquetées par des couples
    de séquences une séquence d'entrée, une
    séquence de sortie
  • Entrée brrr ! Sortie pfff !
  • Etats 0 1 2 3 4
  • Transitions 0b/p1 1r/f2 2r/f3 3?/?2 3!/!4
  • Etats initiaux 0
  • Etats finaux 4

b/p
!/!
r/f
r/f
4
0
1
2
3
?/?
30
Transducteurs
  • Les règles d'une grammaire algébrique peuvent
    être représentées par des transducteurs
  • Exemple GN --gt Det N
  • _at_/_at_ l'ensemble des couples a/a pour tout
    symbole a
  • Entrée Det N V GN à GN
  • Sortie GN V GN à GN

_at_/_at_
_at_/_at_
Det/?
N/?
?/GN
3
0
1
2
_at_/_at_
31
Cascade de transducteurs
  • Mode d'application d'un ensemble de transducteurs
    à un ensemble de séquences S0
  • Entrée S0
  • i 0
  • tant que (condition)
  • appliquer un ou plusieurs transducteurs aux
    séquences de Si, obtenir Si1
  • i i1
  • Sortie Si
  • Variantes
  • - on a n transducteurs T1, T2... Tn et on les
    applique dans l'ordre
  • - on a un transducteur et on l'applique
    itérativement jusqu'à ce que Si1 Si

32
Analyse syntaxique par cascade de transducteurs
  • Entrées une phrase étiquetée S0 et les
    transducteurs des règles
  • i 0
  • faire
  • appliquer les transducteurs aux séquences de Si,
    obtenir Si1
  • i i1
  • jusqu'à Si-1 Si
  • Sortie Si
  • Si Si contient l'axiome, S0 est conforme à la
    grammaire
  • Pour construire l'arbre de dérivation, il faut
    marquer les relations entre les séquences de Si
    et celles de Si1
Write a Comment
User Comments (0)
About PowerShow.com