Ressources - PowerPoint PPT Presentation

1 / 31
About This Presentation
Title:

Ressources

Description:

Ressources lectroniques pour l analyse syntaxique Amalia Todirascu todiras_at_unistra.fr – PowerPoint PPT presentation

Number of Views:94
Avg rating:3.0/5.0
Slides: 32
Provided by: LSH72
Category:

less

Transcript and Presenter's Notes

Title: Ressources


1
Ressources électroniques pour lanalyse syntaxique
  • Amalia Todirascu
  • todiras_at_unistra.fr

2
Plan
  • Quelles ressources pour une analyse syntaxique
    classique?
  • Utilisations possibles
  • Les grammaires darbres adjoints lexicalisés
  • Lexique
  • Grammaire
  • Un exemple danalyseur LTAG

3
Analyse syntaxique  classique 
  • identifier les formes des mots et les parties du
    discours
  • un lexique complet (toutes les formes)
  • Ou
  • un étiqueteur dérivation de formes fléchies
  • construire les arbres syntaxiques pour un texte
    donné
  • Un ensemble de règles de grammaires et des
    contraintes associés
  • Accord sujet-prédicat, dépendences à distance
    etc.
  • modèles linguistiques

4
Utilisation des ressources
  • analyse syntaxique et sémantique
  • aide à la traduction
  • phénomènes linguistiques à traiter règles
    d'accord, verbes transitives et intransitives,
    dépendences à distance
  • lexique (expressions figées)
  • traduction automatique
  • systèmes à base d'arbre syntaxiques
  • apprentissage d'une langue etrangère
  • consulter les règles de grammaire

5
Lexique
  • Informations
  • Toutes les formes
  • lemmes
  • Propriétés
  • morphologiques
  • sémantiques
  • unités lexicales vs. mots composés
  • exhausitivité

6
Exemples de lexiques
  • Sur le CNRTL (Centre national de ressources
    textuelles et lexicales) http//www.cnrtl.fr/lexiq
    ues/
  • Morphalou
  • 400000 formes fléchies
  • Format XML
  • Propriétés mophologiques et lemmes
  • Prolex un lexique de noms propres

7
Exemples de lexiques
  • Anglais
  • http//www.ahds.ac.uk/litlangling  
  • Multext-EAST dictionnaires pour plusieurs
    langues de lEurope Centrale et de lEst
  • http//nl.ijs.si/ME/V3/

8
Grammaires
  • Plusieurs aspects
  • organisation du lexique
  • stratégies d'analyse automatique
  • Plusieurs modèles pour la grammaire
  • GPSG (Generalized Phrase Structure Grammar)
    (Gazdar)
  • LFG (Lexical Function Grammar) (Kaplan)
  • HPSG (Head Phrase Structure Grammar) (Pollard,
    Sag, 1994)
  • TAG (Joshi, 1985), LTAG (Joshi, 1995)

9
Exemples de ressources
  • Une grammaire HPSG pour plusieurs langues
  • http//www.delph-in.net/index.php?page3
  • ERG pour l'anglais
  • http//www.delph-in.net/erg/
  • espagnol http//www.upf.edu/pdi/iula/montserrat.ma
    rimon/spanish_resource_grammar.html
  • LFG (anglais, allemand, norvégien)
  • http//decentius.aksis.uib.no/logon/xle.xml

10
TAG
  • Tree Adjoining Grammars (Joshi, 1975, 1995)
  • l'hypothèse représenter les contextes
    syntaxiques locales (des arbres syntaxiques)
  • contraintes sur les combinaisons entre ces arbres
    syntaxiques
  • justification linguistique (structure
    prédicat-argument)
  • prise en compte de l'ordre locale des mots

11
TAG (II)
  • La grammaire un symbole initial, des symboles
    non-terminaux, des symboles terminaux
  • Les règles de réécriture un ensemble d'arbres
  • arbre initial un arbre ayant le noeud racine
    étiqueté avec le symbole initial
  • noeuds feuilles symboles terminaux
  • arbre auxiliaire un seul noeud feuille étiqueté
    X, la même étiquete que l'étiquette du noeud
    racine

12
Arbre initial et arbre auxiliaire
X
W1
W2
W
Arbre auxiliaire ?
Arbre initial a
13
Adjonction
?'
X
X
X
t
X
X
t
14
Lexicalized Tree Adjoining Grammars (LTAG)
  • association entrée lexicale - arbres
  • description complète de l'environnement
    syntaxique
  • possibilité de traiter les expressions figées
  • modifications par rapport au TAG
  • ancrage lexical
  • deux opérations substitution (obligatoire) et
    adjonction (facultative)

15
Arbres LTAG
  • Arbres élémentaires décrivent des arguments
    obligatoires avec d'autres arbres
    tête-complément
  • au moins un noeud ancre (l'unité lexicale)
  • des noeuds de substitution (?)
  • Arbres auxiliaires relations tête-modifieurs
  • un noeud ancre
  • un noeud pied (), l'étiquette est identique au
    noeud racine

16
Exemples
nv1
nvn1
adv1
np1
GN
Np ?
17
Propriétés
  • Grammaire lexicalisée
  • arbres
  • unités lexicales associées aux arbres
  • opérations
  • localité
  • un arbre élémentaire contient tous les arguments
    dans la même structure
  • pour chaque unité lexicale, on associe plusieurs
    arbres
  • recursivité arbres auxiliaires

18
Arbres dérivés et arbres de dérivation
  • arbres dérivés
  • le résultat obtenu suite aux opération de
    substitution et d'adjonction, sur les arbres
    associés aux unités lexicales de la phrase
    d'entrée
  • arbres de dérivation
  • les noeuds étiquetés avec le nom de l'arbre et
    l'ancre (le lemme)
  • les liens opérations d'adjonction ou de
    substitution
  • arbre de dépendances
  • on supprime les noms des arbres dans l'arbre de
    dérivation

19
Ressources
  • XTAG (Doran et al, 1994)
  • grammaire de grande couverture
  • étiqueteur, analyseur morphologique, analyseur
    syntaxique
  • http//www.cis.upenn.edu/xtag/
  • FTAG (Abeillé, 2002)
  • grammaire de grande couverture pour le français

20
L'analyseur syntaxique LTAG
  • développé par Langue et Dialogue, LORIA,
    INRIA-Lorraine
  • http//www.loria.fr/azim/LLP2/help/fr/index.html
  • utilise un lexique et une grammaire d'arbres
    adjoints (Joshi 1995)
  • chaque mot est associé à une famille d'arbres
  • un arbre décrit le comportement syntaxique de
    chaque mot
  • grammaire d'arbres adjoints lexicalisée (LTAG)
    (Abeillé et al, 2001)
  • possible extensions pour les structures de traits

21
L'analyseur syntaxique LTAG (II)
  • Combiner les arbres associés aux mots de la
    phrase
  • opération de substitution structure
    prédicat-argument
  • opération d'adjonction les modifieurs
  • coût important d'adaptation des ressources aux
    domaines nouveaux

22
Jean dort énormément
Arbres
Lexique
substitution
dort
énormément
adjonction
Jean
dormir
Adv
23
Ressources
  • une DTD qui décrit les familles d'arbres, de
    lemmes et d'unités lexicales
  • un arbre
  • au moins un noeud ancre (attribut type)
  • un noeud tête (l'élément central qui porte les
    propriétés du constituant)
  • des noeuds de type substitution (subst) ou
    adjonction (foot)
  • lien avec le lemme lexicalisation
  • unités lexicales morphoLib

24
Exemple d'arbre
  • lttree id"prep_mod_temp"gt
  • ltnode cat"VP"gt
  • ltnode cat"VP" type"foot"/gt
  • ltnode cat"PP"gt
  • ltnode cat"Prep" name"_head" type"anchor"gt
  • lt/nodegt
  • ltnode cat"N" type"subst"gt
  • lt/nodegt
  • lt/nodegt
  • lt/nodegt
  • lt/treegt

25
Exemples de ancrage
  • ltlexicalizationgt
  • ltfamilygt
  • lttree id"for_n_adj"/gt
  • lt/familygt
  • ltanchor noderef"_head"gt
  • ltlemmaref cat"Prep" name"FOR"/gt
  • lt/anchorgt
  • lt/lexicalizationgt

26
Exemple d'entrée
  • ltmorph lex"for"gt
  • ltfsgt
  • ltf name"cat"gt
  • ltsym value"prep"/gt
  • lt/fgt
  • lt/fsgt
  • ltlemmaref cat"Prep" name"FOR"/gt
  • lt/morphgt

27
Autres outils
  • French MetaGrammar parser http//alpage.inria.fr/a
    lpi.fr.html
  • autres parseurs
  • http//alpage.inria.fr/software.fr.html 
  • XTAG parser (Bangalore, 1997) utilisant des
    informations statistiques pour réduire le nombre
    d'arbres

28
Avantages et Limites
  • avantages
  • modèle opérationnel
  • adaptable pour l'analyse partielle
  • motivation linguistique
  • limites
  • coût important pour créer les ressources
  • nécessite une sélection préalable des arbres

29
Réferences
  • Abeillé, A., L. Clément, and F. Toussenel. 2003.
    Building a treebank for French', in A. Abeillé
    (ed) Treebanks , Kluwer, Dordrecht
  • Abeillé, A., Schabes, Y., Joshi, A. 1990. Using
    Lexicalized Tags for Machine Translation. COLING
    1990 1-6
  • Abeillé, A. 2002. Une grammaire électronique du
    français, CNRS Editions, Paris.
  • Doran et al 1994. XTAG System A Wide Coverage
    Grammar for English. In Proceedings of COLING'94.

30
Réferences (II)
  • Kaplan, R., Bresnan, J. 1983. Lexical Functional
    Grammar A Formal System for Grammatical
    Representation. In J.Bresnan (ed.) The Mental
    Representation of Grammatical Relations. MIT
    Press, Cambridge, Massachusetts
  • Joshi, A. 1995. Introduction to Tree Adjoining
    Grammars. In Computational Intelligence
  • Joshi, A., Levy, L., Takahashi, M. 1975. Tree
    Adjunct Grammars. J. Comput. Syst. Sci. 10(1)
    136-163

31
Sujet
  • Réalisez un dossier de 6-8 pages qui présente un
    outil d'analyse automatique (étiqueteur,
    analyseur syntaxique) ou une ressources (lexique,
    grammaire), avec les avantages et les
    inconvenients de chaque modèle.
Write a Comment
User Comments (0)
About PowerShow.com