Title: Codificaci
1Codificación bidimensional de patrones vocales
mediante un esquema de reducción dimensional
basado en redes neuronales
Alejandro Bassi A. Universidad de
Chile Departamento de Ciencias de la
Computación abassi_at_dcc.uchile.cl
2Caracterización fonética del timbre
- oído interno descompone en frecuencias
- escala no lineal
- lo importante es la envolvente del espectro
3Caracterización articulatoria del habla
4Relación articulación/timbre
5Codificación de la envolvente del espectro
- cepstrum
- reducción dimensional
- lineal (componentes principales)
- no lineal (redes neuronales)
- calidad de la reconstrucción
6Reconstrucción lineal (2D)
7Reconstrucción lineal (3D)
8Reconstrucción lineal (4D)
9Reducción dimensional con redes neuronales
- estructura codificador/decodificador
- entrenamiento autoasociativo
- decodificador basado en composición gausiana
10Codificación inicial
11Codificación final
12Reconstrucción (diptongos)
13Posición de formantes
14Reconstrucción (palabra "cuatro")
15Reconstrucción (otra palabra "nueve")
16Reconstrucción (diptongos, otro hablante)
17Comparación entre hablantes
18Conclusiones
- buena reconstrucción (visualización)
- reducción dimensional / seguimiento
formantescontexto general / contexto local - Reconocimiento de patrones (TDW, HMM)
- varios hablantes?
- normalización del "triángulo"