Procesamiento y Compresi - PowerPoint PPT Presentation

About This Presentation

Title:

Procesamiento y Compresi

Description:

Title: PowerPoint Presentation Last modified by: Angel de la Torre Vega Created Date: 1/1/1601 12:00:00 AM Document presentation format: Presentaci n en pantalla – PowerPoint PPT presentation

Number of Views:89

Avg rating:3.0/5.0

Slides: 34

Provided by: ugrEs

Category:

more less

Transcript and Presenter's Notes

Title: Procesamiento y Compresi

1
Procesamiento y Compresión de Señales de Audio

PROGRAMA DE POSGRADO EN
SISTEMAS MULTIMEDIA
Ángel de la Torre

2
Organización

Audición.
Implantes cocleares.
Reconocimiento robusto de voz.
Presentación de trabajos.
( 1/2 hora y/o memoria)
Transparencias en
http//www.ugr.es/atv
E-mail atv_at_ugr.es

3
Reconocimiento robusto de voz
4
Sistemas de reconocimiento automático de voz
(ASR) en ruido

El ruido contamina la señal de voz en todas las
aplicaciones reales
Entorno de oficina (ventiladores, HDs, teclados,
gente, música.)
Línea de teléfono (entorno y línea)
Telefonía móvil (además canal de radio y codec)
ASR de voz adquirida en automóvil
El ruido degrada ASR

5
Consideraciones sobre el ruido en ASR

En qué condiciones se va a adquirir la señal de
voz?
Métodos para robustecer el sistema frente al
ruido
ASR en ruido es una línea de investigación
importante

6
Métodos de robustecimiento

Principal problema mismatch train-reco
Representaciones robustas
Compensación de la voz ruidosa
Adaptación de los modelos limpios

7
Representación de la voz

Voz cuasi-estacionaria en segmentos de 30-50 ms
(duración de los fonemas)
Información relevante para ASR características
espectrales de tiempo corto
Representaciones típicas para ASR cepstrum-FFT
cepstrum-LPC MFCC

8
Representación de la voz MFCC

Pre-énfasis
Segmentación en frames (20 40 ms)
Ventana de Hamming
Banco de filtros en escala MEL (FBO)
Escalado logarítmico (log-FBO)
Transformada discreta del coseno (MFCC)
Energía derivadas (Delta) segundas derivadas
(Delta-Delta)

9
Efecto del ruido aditivo

El ruido distorsiona el dominio log-FBO

10
Distorsión del dominio log-FBO
11
Distorsión del dominio log-FBO
12
Distorsión PDFs
13
Aleatoriedad del ruido
14
Ruido y ASR

Experimentos con voz contaminada artificialmente
Ruido AWGN
Tarea de dígitos conectados
Retrain (adaptación ideal)
Baseline (sin robustecimiento)
Degradación debida a mismatch
Degradación debida a pérdida de información

15
Métodos para ASR robusto

Representaciones robustas
Ventanas de liftering (cepstrum-LPC)
Proyección ceptral (cepstrum-LPC)
Modelos auditivos
Cepstrum en escala MEL (MFCC)
Parametrizaciones discriminativas (LDA, DFE)
Eliminación de variaciones lentas RASTA CMN
coeficientes Delta y Delta-Delta

16
Métodos para ASR robusto (II)

Compensación de la voz
Mapeo lineal de parámetros
Sustracción espectral / filtrado de Wiener
Realce estadístico

17
Métodos para ASR robusto (III)

Compensación de los modelos
Descomposición de HMM PMC
Filtrado de Wiener dependiente del estado
Adaptación estadística de los modelos
Contaminación del corpus de entrenamiento

18
Compensación del efecto del ruido basada en el
método de Monte Carlo
19
Compensación del efecto del ruido

Compensación en el dominio log-FBO
Estimación del ruido en log-FBO usando un VAD
Compensación canal por canal

20
Compensación del efecto del ruido

Estimación basada en método de Monte Carlo
Generamos voz y ruido de acuerdo con las
probabilidades
Calculamos parejas voz-limpia voz-ruidosa
Calculamos valor esperado de voz limpia dada la
voz ruidosa observada

21
(No Transcript)
22
Compensación del efecto del ruido

Compensación definida como una función
Implementación práctica interpolación lineal con
algunos puntos (k)

23
(No Transcript)
24
(No Transcript)
25
Experimentos de reconocimiento

Base de datos VODIS en francés
Voz grabada en entorno de automóvil
Condiciones reales de ruido
Grabaciones con dos micrófonos
Far-talk
Close-talk
Test siempre con Far-talk
Diferentes condiciones de conducción

26
Experimentos de reconocimiento

Tarea de reconocimiento números de teléfono (en
francés)
Sistema de reconocimiento
CHMM
Cada palabra representada como un HMM de 10
estados
Cada estado es una pdf mezcla de Gaussianas
(entre 1 y 8 Gauss/estado)
Front-end MFCC

27
Experimentos de reconocimiento

Métodos comparados
CMN
Compensación en dominio log-FBO basada en método
de Monte Carlo
Adaptación de los modelos a las condiciones de
reconocimiento
Reentrenamiento en condiciones Far-Talk

28
(No Transcript)
29
Experimentos de reconocimiento (ruido añadido
artificialmente)

Ruido AWGN
Añadido artificialmente
Dígitos conectados
Baseline (CMN) y retrain como referencias
Compensación Monte Carlo, VTS, UTS

30
(No Transcript)
31
Comentarios

Con AWGN los resultados re-train y compensación
coinciden
Re-entrenamiento es óptimo
Compensación es (casi) óptimo
Con ruido real
Re-entrenamiento es sub-óptimo
Compensación es sub-óptimo
Mejor solución compensación de ambos

32
Resumen

Importancia del ruido en aplicaciones del
Reconocimiento Automático de Voz
Importancia de los métodos de robustecimiento
Mecanismos de degradación
Mismatch (distorsión del espacio de repr.)
Pérdida de información (aleatoriedad)

33
Resumen (2)

Métodos de robustecimiento
Orientados a eliminar el mismatch
Métricas robustas
Compensación de representación
Adaptación de modelos
Experimentos ruido real / controlado
Resultados
Combinación de adaptación de modelos y
compensación de la representación

Write a Comment

User Comments (0)

About PowerShow.com

Recommended Relevance Latest Highest Rated Most Viewed

Sort by:

Related More from user

CrystalGraphics Presentations

Introducing-PowerShowcom PowerPoint PPT Presentation

Introducing-PowerShowcom - Introducing-PowerShowcom (Without Music)

CrystalGraphics 3D Character Slides for PowerPoint PowerPoint PPT Presentation

CrystalGraphics 3D Character Slides for PowerPoint - CrystalGraphics 3D Character Slides for PowerPoint

Chart and Diagram Slides for PowerPoint PowerPoint PPT Presentation

Chart and Diagram Slides for PowerPoint - Beautifully designed chart and diagram s for PowerPoint with visually stunning graphics and animation effects. Our new CrystalGraphics Chart and Diagram Slides for PowerPoint is a collection of over 1000 impressively designed data-driven chart and editable diagram s guaranteed to impress any audience. They are all artistically enhanced with visually stunning color, shadow and lighting effects. Many of them are also animated. And they’re ready for you to use in your PowerPoint presentations the moment you need them. – PowerPoint PPT presentation

Related Presentations

Pemex Gas y Petroqumica Bsica PowerPoint PPT Presentation

Pemex Gas y Petroqumica Bsica - Con el objetivo de modernizar los equipos de compresi n de gas ... Fuente: 'Replacing Wt seals with dry seals in centrifugal compressors' (EPA430-B-03-012) ... | PowerPoint PPT presentation | free to view

Perceptrn Multicapa PowerPoint PPT Presentation

Perceptrn Multicapa - Para qu se puede usar un perceptr n multicapa? ... Introduction to HMM/Connectionist Continuous Speech Recognition', Nelson Morgan ... | PowerPoint PPT presentation | free to view

ROBTICA INDUSTRIAL AVANZADA U'T'1: Introduccin PowerPoint PPT Presentation

ROBTICA INDUSTRIAL AVANZADA U'T'1: Introduccin - M ster de Autom tica e Inform tica Industrial. Universidad Polit cnica de Valencia ... Discretos o continuos, procesamiento local, ancho de banda, capacidades de ... | PowerPoint PPT presentation | free to view

Nuevas bases para procesamiento de msica en el dominio de tiempo frecuencia PowerPoint PPT Presentation

Nuevas bases para procesamiento de msica en el dominio de tiempo frecuencia - Nuevas bases para procesamiento de m sica en. el dominio de tiempo - frecuencia ... Exactas y Naturales. Universidad de Buenos Aires. Motivaciones. Encontrar una ... | PowerPoint PPT presentation | free to view

FRACTALTECConsultora Investigacin Desarrollo en DATA MINING PowerPoint PPT Presentation

FRACTALTECConsultora Investigacin Desarrollo en DATA MINING - FRACTALTEC Consultor a Investigaci n Desarrollo en DATA MINING. Agenda ... Potencia de procesamiento a nivel hardware. - Estudio de modelos de 'falsas alarmas' ... | PowerPoint PPT presentation | free to view

Modelado de la seal de voz Grupo PAS Universidad de Deusto PowerPoint PPT Presentation

Modelado de la seal de voz Grupo PAS Universidad de Deusto - Percepci n de la voz. Compresi n y codificaci n de la voz. ... (a menos de un bit por muestra de se al CELP (Code-Excited Linear Prediction) ... | PowerPoint PPT presentation | free to view

An - Aprender como 'se forma' la voz y sus caracter sticas principales. ... En 1779, el cient fico dan s Christian Gottlieb Kratzenstein, que trabajaba en ... | PowerPoint PPT presentation | free to view

FUNDAMENTOS DE LOGICA DIFUSA PowerPoint PPT Presentation

FUNDAMENTOS DE LOGICA DIFUSA - La l gica difusa o borrosa (Fuzzy logic) descansa en la idea que en un instante ... Dadas las funciones de pertenencia para cada variable medida, el procesamiento ... | PowerPoint PPT presentation | free to view

Complementos de Procesado de Seales y Comunicaciones PowerPoint PPT Presentation

Complementos de Procesado de Seales y Comunicaciones - Complementos de Procesado de Se ales y Comunicaciones. PROGRAMA DE POSGRADO EN ... Hay que preocuparse del nivel de la se al. Objetivo compresi n instant nea: ... | PowerPoint PPT presentation | free to view

Analizador de la transformada de Haar desde un punto de vista topolgico PowerPoint PPT Presentation

Analizador de la transformada de Haar desde un punto de vista topolgico - Calcular las medias para cada pareja: 3. La transformada de Haar. Algoritmo. Paso 1: Calcular las diferencias: Vector que llevamos calculado: Vector original: ... | PowerPoint PPT presentation | free to view

Complementos de Procesado de Seales y Comunicaciones - Para procesamiento digital de se ales: Compresi n de datos. Transmisi n de datos ... media huella. Cuantizador de. media contrahuella. x. x. ATV 2002 Dpto. ... | PowerPoint PPT presentation | free to view

PROCESAMIENTO DE IMGENES DIGITALES PowerPoint PPT Presentation

PROCESAMIENTO DE IMGENES DIGITALES - PROCESAMIENTO DE IM GENES DIGITALES. ETIQUETADO DE COMPONENTES CONEXAS EN ... Para cada etiqueta-antigua hay que recorrer el quadtree entero. NDICE. Objetivos. ... | PowerPoint PPT presentation | free to view

Process Validation General PowerPoint PPT Presentation

Process Validation General - Validaci n de los procesos. M dulos Complementarios de la Capacitaci n sobre ... Peso de la cubierta. M dulo1, Parte 3: Validaci n de procesos Diapositiva 14 de 22 ... | PowerPoint PPT presentation | free to view

Procesamiento y compresin de seales de audio PowerPoint PPT Presentation

Procesamiento y compresin de seales de audio - Formado en el 5 mes de vida ... presi n del aire entre caja del o do medio y el exterior ... onda viajera, apareciendo un pico para la frecuencia sintonizada ... | PowerPoint PPT presentation | free to view

wtn - Arreglos de Antena para Comunicaciones. Redes y T cnicas Multi-Usuario. RAS, DEPFI-UNAM ... Arreglos de Antena - Antenas Inteligentes. Incremento de Capacidad ... | PowerPoint PPT presentation | free to view

Aplicaciones de Sensado Compromido al procesamiento de Se PowerPoint PPT Presentation

Aplicaciones de Sensado Compromido al procesamiento de Se - Title: An lisis de electroferogramas usando la teor a de Compressed Sensing Last modified by: mvergar Document presentation format: Presentaci n en pantalla (4:3) | PowerPoint PPT presentation | free to view

Procesamiento y Compresi PowerPoint PPT Presentation

Procesamiento y Compresi - Ajustar los par metros del sistema de implante coclear para que el paciente obtenga un aprovechamiento ptimo: ... | PowerPoint PPT presentation | free to view

Procesamiento y Compresi - El implante coclear trata de imitar el mecanismo de conversi n del sonido en potenciales de acci n. Caracter sticas del o do humano Configuraci n de la c clea: ... | PowerPoint PPT presentation | free to view

Jorge De Nova Segundo PowerPoint PPT Presentation

Jorge De Nova Segundo - UD8: Instalaci n y administraci n de servicios de audio y video Servicio de audio. Jorge De Nova Segundo Funcionalidad del servicio de audio. | PowerPoint PPT presentation | free to view

Radioespectro, TV digital PowerPoint PPT Presentation

Radioespectro, TV digital - Introducci n a la inform tica, telem tica y procesamiento de datos C tedra Becerra Clase te rica: Radioespectro, implementaci n de sistemas de TV digital | PowerPoint PPT presentation | free to view

Frame Relay - ... red reduciendo el procesamiento efectuado sobre los paquetes en cada uno de los nodos. Los nodos actuan s lo como relevadores : ... | PowerPoint PPT presentation | free to view

Contenidos y destrezas ling PowerPoint PPT Presentation

Contenidos y destrezas ling - Contenidos y destrezas ling sticas para el aprendizaje de segundas lenguas Por: Juan Carlos Cruz Producci n y compresi n en una lengua extranjera Compresi n ... | PowerPoint PPT presentation | free to view

Compresi - Compresi n de Im genes en Escala de Grises mediante el uso de WAVELETS Tom s Olarte Hern ndez Juan Pablo Tamayo tolarteh@eafit.edu.co jtamay10@eafit.edu.co | PowerPoint PPT presentation | free to view

Procesamiento digital de Im PowerPoint PPT Presentation

Procesamiento digital de Im - Procesamiento digital de Im genes Mejoramiento de im genes en el dominio espacial | PowerPoint PPT presentation | free to view

Universidad de Vigo Departamento de Ingenier PowerPoint PPT Presentation

Universidad de Vigo Departamento de Ingenier - Title: Universidad de Vigo Departamento de Ingenier a Telem tica Proyecto Fin de Carrera Author: Invitado Last modified by: HNOS BRION Created Date | PowerPoint PPT presentation | free to view

Petr - Petr leo Origen, procesamiento y aplicaciones. Origen Y Formaci n El petr leo se form hace millones de a os, a partir de organismos vivos que se mineralizaron ... | PowerPoint PPT presentation | free to view

Compresor de aire exento de aceite | 11-450kW | ELGi –España PowerPoint PPT Presentation

Compresor de aire exento de aceite | 11-450kW | ELGi –España - Los compresores de aire exentos de aceite ELGi proporcionan aire exento de aceite certificado de clase 0, que cumple con las normas ISO 8573-1. | PowerPoint PPT presentation | free to view