Title: Direction de la Technologie
1- Direction de la Technologie
- Département DTA3
- Â Technologies de lInformation et de la
Communication -  Les technologies de la langueÂ
stephane.chaudiron_at_technologie.gouv.fr
http//www.technologie.gouv.fr
2Trois moyens daction
- Réseaux Recherche et Innovation Technologiques
(RRIT) - collaboration entre recherche publique
et industrielle - RNRT, RNTL, RIAM
- Programme  Veille stratégique pour les
entreprises - Développement doutils de veille automatisée
- Programme  TechnolangueÂ
- Action d accompagnement à la RD
3R2IT
- 1998 gt RNRT gt 2002 Télécommunications
- Quelques thèmes
- Commande et reconnaissance vocale,
- Dialogue H/M en LN,
- Indexation et organisation des contenus distants,
- Analyse et modélisation des profils utilisateurs,
- Filtrage syntaxique et sémantique,
- etc.
- Budget de 13 M ( contribution MinEFI)
- Clôture de lAAP le 14 mars à 14h
- http//telecom.gouv.fr/rnrt
4R2IT
- 2000 gt RNTL gt 2002 Technologies Logicielles
- Quelques thèmes
- Structuration des données favorisant un accès
personnalisé et visualisation associée - Entrepôts de données répartis sur le Web
- Interrogation de bases de documents semi
structurés (XML) - Fouille de données structurées ou non structurées
(texte), découverte de connaissances - Agents de recherche d'informations pertinentes
- Reconnaissance et synthèse de la parole
- Interaction en langue naturelle
- Multilinguisme
- etc.
-
5R2IT
- 2000 gt RNTL gt 2002 Technologies Logicielles
- Budget de 13 M ( contribution MinEFI)
- Clôture le 11 février
- Projets en cours d évaluation
- http//www.industrie.gouv.fr/rntl
-
6R2IT
- 2001 gt RIAM gt 2002 Audiovisuel Multimédia
- Quelques thèmes
- Lindexation (semi-)automatique de documents
numériques - Lindexation des contenus par les utilisateurs
- Lindexation et la consultation sappuyant sur le
raisonnement et la représentation des
connaissances, les terminologies et les
ontologies - La recherche et le filtrage de linformation
- Le génie documentaire appliqué à la multiplicité
des données - vidéo, son, voix, texte, images,
procédures 2D/3D, - L intermodalité dans le génie documentaire
- La conception d'interfaces de représentation et
de navigation, au niveau de la recherche dans de
grandes bases multimédia - etc.
7R2IT
- 2001 gt RIAM gt 2002 Audiovisuel Multimédia
- Appel à propositions en continu
- Budget de 3 M ( contribution MinEFI et MC)
- http//www.cnc.fr/riam/
- Contact unique RIAM_at_cnc.fr
8Programme  Veille stratégique pour les
entreprisesÂ
- 1998 gt VSE gt 2002 Logiciels de veille sur
Internet - Recherche et filtrage dinformations semi
structurées et non structurées - Fouille de données textuelles
- Analyse de flux et de gros corpus
- Résumé et génération automatique de textes
- Outils daide à la traduction
- Modélisation de profils dintérêts
- Cartographie et visualisation delinformation
- etc.
-
9Programme  Veille stratégique pour les
entreprisesÂ
- Caractéristiques du programme
- Automatiser des fonctions de veille
- Soutien à la demande et non à loffre
- Prise en compte des besoins utilisateurs (PME /
PMI) - Pérenniser la pratique de la veille dans le tissu
économique - Chaque proposition doit associer des
utilisateurs. - Budget de 700 K?
- Lancement de lAAP fin mars
- Clôture fin mai
- Sélection des projets fin juin
- http//www.technologie.gouv.fr/technologie/
-
10Programme  TechnolangueÂ
- Lancé à la demande du Premier Ministre par le MR
avec le MinEFI et le Min. Culture - Doté d un budget de 4 M (année 2002)
- Premier programme interministériel de grande
ampleur spécifiquement dédié aux technologies du
langage - gt écrit et oral
- Programme coopératif (associe laboratoires
publics et industriels)
11Programme  TechnolangueÂ
- Programme dinfrastructure pour la RD mais la
RD reste dans les R2IT et les programmes
spécifiques. -
RNRT
RNTL
RIAM
VS
TECHNOLANGUE
12Programme  TechnolangueÂ
- Objectif
- Mettre en place une infrastructure pour
- Stimuler la production et la diffusion de
ressources linguistiques - Organiser lévaluation des technologies de la
langue - Soutenir la participation des acteurs français
aux instances de normalisation et de
standardisation - Mettre en place un dispositif de veille
informationnelle. -
13Programme  TechnolangueÂ
- Organisation
- Un comité de pilotage présidé par C. Fluhr (CEA)
- Composé de
- B. Bachimont (INA - RIAM), S. Chaudiron (MR), K.
Choukri (ELRA), E. Geoffrois (DGA), D. Malberg
(MC), J. Mariani (MR), J. Mathieu (MinEFI), B.
Normier (Lingway), P. Paroubek (Limsi-CNRS),
J.-J. Rigoni (Elan Informatique), C. Sedogbo
(Thalès - RNTL), F. Segond (Xerox), C. Waast (IBM
- RNRT). - Un appel à propositions en 2002 sur les 4 actions
identifiées - Ressources linguistiques
- Évaluation
- Normes et standards
- Veille informationnelle
-
14Programme  TechnolangueÂ
- Action 1 - Stimuler la production et la diffusion
de ressources linguistiques pour - répondre aux besoins minimaux (Basic LAnguage
Resource Kit) - favoriser la réutilisabilité des ressources
- soutenir la recherche
- aider au développement d applications
industrielles - diminuer le coût du  ticket d entrée dans le
secteur. -
15Programme  TechnolangueÂ
- Sont concernés
- les données linguistiques orales et écrites
- corpus oraux, lexiques de prononciation, etc.
- bases de données pour la synthèse de la parole
- corpus textuels mono et multilingues (parallèles,
alignés...) - lexiques, terminologies, grammaires,...
- ressources lexicales sémantiques ontologies,
thésaurus,... - corpus multimodaux,...etc
16Programme  TechnolangueÂ
- Sont concernés
- les outils logiciels  de baseÂ
- analyseurs morphologiques, syntaxiques,
sémantques, - extracteurs de terminologie,
- identifieurs de langue,
- outils d étiquetage de corpus,
- lemmatiseurs,
- etc.
-
17Programme  TechnolangueÂ
- Les projets devront
- justifier lintérêt de la production
- indiquer clairement les conditions de validation
des ressources produits (conformité aux
recommandations techniques en vigueur, normes,
standards,...) - préciser comment sera effectuer le processus de
validation et par qui - définir les conditions juridiques de production
et de diffusion - indiquer comment sera assurée la diffusion des
résultats et par qui - donner des garanties pour la pérennité de la
distribution.
18Programme  TechnolangueÂ
- Action 2 - Organiser lévaluation des
technologies de la langue - 3 volets
- Évaluation de technologies (TREC, MUC, Grace,
Amaryllis) - Évaluation d applications
- Réflexion sur les méthodologie d évaluation
19Programme  TechnolangueÂ
- Évaluation de technologies
- Organisation de campagnes d évaluation sur des
secteurs non couverts par des programmes
européens ou internationaux, ou selon des
méthodologies différentes. - Toutes les technologies de l IL sont ouvertes
pour laction (en contexte monolingue,
multilingue ou interlingue) - L intérêt scientifique et industriel doit être
démontré (nombre de participants) - Les projets doivent préciser la méthodologie
d évaluation retenue en justifiant les aspects
pratiques de l organisation et le choix des
outils d analyse.
20Programme  TechnolangueÂ
- Évaluation d applications
- Lobjectif est de développer des méthodologies
dévaluation pour des produits industriels ou
pré-industriels - Les méthodologies pourront aboutir à des  boîtes
à outils ou à des logiciels de test - Les méthodologies devront être génériques
(classes dapplications) - et prendre en compte les contextes dusage
- Toutes les applications sont a priori concernées
- Les propositions devront démontrer lintérêt
économique et industriel du projet.
21Programme  TechnolangueÂ
- Réflexion sur les méthodologie d évaluation
- Améliorer les méthodologies dévaluation
existantes - Identifier de nouvelles approches (quantitatives
et qualitatives pour des technologies déjÃ
évaluées - enjeux socio-techniques et psycho-cognitifs,
- modélisation de lusabilité des logiciels,
- paradigme cognitif de lévaluation.
- Identifier des prorocoles pour de nouvelles
technologies et applications.
22Programme  TechnolangueÂ
- Action 3 - Soutenir la participation des acteurs
français aux instances de normalisation et de
standardisation - Soutenir la création de consortiums pour
renforcer la présence française dans les
instances (JTC1, CEN, W3C,...) - Aider la mutualisation des efforts
- jeux de caractères,
- balisage et format d échange,
- transcription d alphabet phonétique informatisé,
- ordre et tri de caractères,
- etc.
23Programme  TechnolangueÂ
- Action 4 - Mettre en place un dispositif de
veille informationnelle - Créer un portail sur lingénierie linguistique
pour permettre l accès à de l information sur - le panorama de l offre industrielle et
technologique, - état de l art scientifique et technologique,
- identification des ressources linguistiques,
- identification des thèmes de recherche et des
verrous technologiques, - recensement des appels à propositions,
- présentation des chiffres clés du marché,
- information sur les normes et les standards,
- etc.
-
24Programme  TechnolangueÂ
- Action 4 - Mettre en place un dispositif de
veille informationnelle - Public visé
- les  nouveaux entrants dans le secteur,
- besoin d information ponctuelle,
- pas de concurrence avec les courtiers en
information. - Durée 36 mois
- Nécessité d articuler le projet avec les sites
et les projets existants (ATALA, ELRA, APIL,...). -
25Programme  TechnolangueÂ
- Procédure
- Appel à propositions sur les 4 actions du
programme - Projets nécessairement coopératifs (acad.
industriel) - Projet à coût partagé
- Entre 12 et 36 mois
- Lancement de l appel début avril
- Clôture fin mai
- Sélection des projets fin juin
-
26Les technologies de la langue
- Merci de votre attention...
-