Codage de la Parole par indexation ind - PowerPoint PPT Presentation

1 / 11
About This Presentation
Title:

Codage de la Parole par indexation ind

Description:

Codage de la Parole par indexation ind pendant du locuteur ... A l' tat actuel le codage avec des unit s ALISP n'est fonctionnel que pour un locuteur ... – PowerPoint PPT presentation

Number of Views:99
Avg rating:3.0/5.0
Slides: 12
Provided by: THOMS1
Category:

less

Transcript and Presenter's Notes

Title: Codage de la Parole par indexation ind


1
Codage de la Parole par indexation indépendant du
locuteur
Dijana PETROVSKA-DELACRETAZGérard
CHOLLET(petrovsk, chollet)_at_tsi.enst.frENST/CNRS
-LTCI46 rue Barrault75634 PARIS cedex 13
2
Plan
Plan
  • Situer le problème de la dépendance au
    locuteur
  • Passage dépendant gt indépendant du
    locuteur
  • Choix et caractéristiques de la base de
    données utilisée
  • Protocole expérimental
  • Rappel des étapes principales du codage
  • Premiers résultats du codage par indexation
    ALISP indépendant du
    locuteur
  • Conclusions et perspectives

3
Situer le problème
  • A létat actuel le codage avec des unités ALISP
    nest fonctionnel que pour un locuteur prédéfini
  • Situation peu réaliste
  • Cas idéal codage de nimporte quel locuteur,
    parlant nimporte quelle langue
  • Cas intermédiaire codage des locuteurs
    masculins, parlant français de la base de donnés
    BREF

4
Comment réaliser le passage dépendant gt
indépendant au locuteur
  • Cas locuteur unique L données parole (
    env. 1 heure entraînement et 10 min test)
  • Cas indépendant du locuteur suffisamment (?)
    de données parole dun échantillon
    représentatif pour les données
    d entraînement et dun autre ensemble de
    locuteurs disjoints pour le test

5
Base de données BREF et ses caractéristiques
  • Caractéristiques principales corpus
    français composé de textes lus, extraits du
    journal  Le Monde  120 locuteurs, avec en
    moyenne 40-70 min de parole par loc. Séparés
    en 80 locuteurs pour lentraînement, 40 de
    développement et 20 de test, avec des textes
    différents Enregistrement qualité studio,
    échantillonné à 16kHz

6
Protocole expérimental
  • Cas indépendant du locuteur - 33 locuteurs
    masculins pour lentraînement (env. 30
    heures de parole) et - 3 locuteurs pour le
    test
  • Comparaison avec cas dépendant du locuteur -
    les données des 3 locuteurs de test sont
    subdivisées en env. 30-40 min pour
    lentraînement dépendant du loc. Et env.
    10 min pour les tests communs

7
Rappel des étapes principales de codage
  • Phase dentraînement Acquisition
    automatique des unités ALISP Entraînement
    dun reconnaisseur HMM pour ces unités
    Sélection des représentants des HMMs pour la
    synthèse
  • Phase de codage - décodage Reconnaissance
    des unités ALISP Sélection du meilleur
    représentant par unité Transmission des
    indices Synthèse

8
Résultats pour le codage indépendant du locuteur
  • Caractéristique des unités ALISP, longueur
    moyenne de 66 ms
  • Longueur moyenne des phones est de 100-200 ms
    ? unités ALISP plus courtes que les phones
  • Débit moyen denviron 140 bps
  • Spectrogrammes original synthèse LPC
    cas dépendant du locuteur (synthèse
    LPC) cas indépendant du locuteur (synthèse
    LPC)
  • Fichiers sonores

9
Influence de la synthèse LPC
Original
Synthèse LPC
10
Codage dépendant et indépendant du locuteur
(synthèse LPC )
dépendant du locuteur
Indépendant du locuteur
11
Perspectives
  • Relation entre la taille du dictionnaire et la
    qualité de parole
  • le codeur reconnaît til le timbre de la voix ?
    Peut ton lutiliser pour vérifier lidentité du
    locuteur ?
  • Diminution de la taille mémoire et du débit par
    des techniques de transformation vers des
    locuteurs canoniques
Write a Comment
User Comments (0)
About PowerShow.com