Introduction la linguistique - PowerPoint PPT Presentation

1 / 14
About This Presentation
Title:

Introduction la linguistique

Description:

Li es la complexit du langage naturel : paraphrase, ambigu t , productivit , implicite ... Construite en fonction de l'application cible. Pour un domaine de ... – PowerPoint PPT presentation

Number of Views:924
Avg rating:3.0/5.0
Slides: 15
Provided by: christo114
Category:

less

Transcript and Presenter's Notes

Title: Introduction la linguistique


1
Introduction à la linguistique
  • Notions importantes

2
Introduction à la linguistique
  • Définition de la linguistique
  • Niveaux de l'analyse linguistique
  • Phonétique / Phonologie
  • Morphologie
  • Syntaxe
  • Sémantique
  • Pragmatique

3
Morphologie au niveau du "mot"
  • Qu'est-ce qu'un mot ?
  • Le morphème
  • Caractéristiques du mot
  • catégorie grammaticale
  • propriétés morphologiques
  • mot plein vs. vide
  • Formation des mots

4
Syntaxe au niveau de la phrase
  • Les groupes de mots / les syntagmes
  • Relations entre syntagmes

5
Liens entre les unités
  • Liens de forme
  • homonymie
  • flexion
  • dérivation
  • Lemme
  • Liens de sens
  • hyperonymie /hyponymie
  • synonymie
  • antonymie

6
Le sens des unités
  • Polysémie
  • Beaucoup d'ambiguïté
  • lexicale
  • syntaxique
  • Exemple
  • "La belle porte le voile."

7
Le TAL
  • Les applications
  • Difficultés
  • Liées à la complexité du langage naturel
  • paraphrase, ambiguïté, productivité, implicite
  • Exemple recherche d'information
  • adéquation entre corpus et requête appariement
  • précision rappel
  • Utilisation d'expressions booléennes

8
Indexer
  • Eliminer les mots vides (grammaticaux, outils,
    etc.)
  • Utiliser les liens entre les unités
  • familles morphologiques
  • familles sémantiques
  • Utiliser les formes complexes

9
Traiter les textes électroniques
  • Recherche plein texte à la surface, dans du
    texte brut (vs. texte mis en forme ou texte avec
    informations linguistiques)
  • Un texte une suite de caractères une suite de
    nombres
  • Codages de caractères ASCII, ISO-Latin, UNICODE
  • Visualiser un texte ligne visible vs. ligne
    logique

10
Recherche dans les textes
  • A l'aide de la forme
  • Segmenter les unités
  • utilisation des caractères (ponctuation, espaces,
    etc.)
  • Problèmes tirets, elision, sigles, etc.
  • Utilisation de lexiques (mais non exhaustifs)
  • Identifier les unités l'étiquetage
  • Regrouper les unités (utilisation d'informations
    syntaxiques)

11
Outils pour l'analyse linguistique
  • Concordanciers (KWIC)
  • Collocations
  • Etiqueteurs morphosyntaxiques
  • catégorie morphosyntaxique
  • lemme
  • exemple TreeTagger
  • www.ims.uni-stuttgart.de/projekte/corplex/TreeTagg
    er/
  • règles de décision
  • probèmes mots inconnus, mal orthographiés,
    mauvais découpage, désambiguïsation, besoin du
    sens, etc.

12
Ressource terminologique
  • Double pertinence
  • Construite en fonction de l'application cible
  • Pour un domaine de spécialité
  • Applications classiques et électroniques
  • Contenu termes et relations entre les termes
  • Recours aux textes (corpus), aux RT existantes,
    aux experts
  • Feed-back des utilisateurs
  • Utilisation des outils du TAL

13
Syntex
  • Analyseur syntaxique de corpus
  • Entrée texte étiqueté
  • Sortie
  • texte analysé syntaxiquement (relations de
    dépendance syntaxique entre les unités)
  • réseau de syntagmes (en fonction des têtes et
    expansions des syntagmes)
  • Utilisations possibles analyse linguistique,
    construction d'une RT, applications plus larges
    de TAL

14
Autres qusetions ?
Write a Comment
User Comments (0)
About PowerShow.com