Title: Procesamiento y Compresi
1Procesamiento y Compresión de Señales de Audio
- PROGRAMA DE POSGRADO EN
- SISTEMAS MULTIMEDIA
- Ángel de la Torre
2(No Transcript)
3Imagen Rx de un implante
4(No Transcript)
5Sistemas de petaca y retroauricular
6Percepción de la voz
Representación de la voz en el nervio auditivo
Adquisición de la voz
respuesta
Aparato auditivo
Producción de voz
Aparato fonador
7Percepción de la voz con I.C.
Representación de la voz en el nervio auditivo
Adquisición de la voz
respuesta
Implante Coclear
Producción de voz
Aparato fonador
8Cuándo es necesario el I.C.(criterios de
selección de candidatos)
- Sordera neurosensorial
- No en sordera retrococlear Implante de tronco
cerebral - No en sordera de transmisión (Pérdidas
moderadas) Prótesis auditivas, reconstrucción
cadena huesecillos - Sordera bilateral profunda
- Incapacitante para comprensión de voz
9Aportaciones del I.C.
- Percepción de la voz
- Percepción de otros sonidos
- Limitaciones
- Objetivo comunicación oral
- Desarrollo lingüístico en niños
- Comunicación en adultos
- Funcionamiento del I.C.
10Espectrograma (representación tiempo -
frecuencia)
m b o i a kom p r a R p a n
11Información relevante de la señal de voz
- Para reconocimiento de voz
- Envolvente espectral (formantes)
- Evolución temporal de los formantes
- Información espectral de tiempo corto
- Información complementaria
- Tono fundamental
- Estructura fina del espectro
12Características del oído humano
- Aspectos anatómicos y fisiológicos
- 6.000 células ciliadas internas
- 40.000 terminaciones nerviosas
- Repolarización 2 ms (400 - 500 disparos/seg)
- Conexión sináptica sin interacción entre canales
- Mecanismos de adaptación
- Capacidad de un oído entrenado
- Resolución espectral 1/9 tono (entre 20 Hz y 20
kHz) - Resolución temporal 400 - 500 Hz
- Resolución de intensidad 1 dB
13Limitaciones del implante coclear
- No hay conexión sináptica
- Un electrodo estimula muchas fibras
- Si se estimulan simultáneamente varios electrodos
hay interferencia entre canales - Consecuencias
- Pocos electrodos (se representa sólo la
envolvente espectral) - Alta tasa de estimulación
- En cada instante sólo se estimula un canal
14Percepción con Implante Coclear
- Implante varios electrodos (muchos menos de
4000) - Por qué no más electrodos?
- Intervalo de frecuencia 200 Hz - 8500 Hz
- Respuesta en el tiempo 1500 ... 3000
disparos/seg. - Respuesta a los distintos niveles de intensidad
15Diseño de los Implantes Cocleares
- Limitaciones acoplamiento entre electrodos y
terminaciones nerviosas - Limitaciones
- procesamiento de señal
- comsumo
- tamaño
- Posibilidades y límites sonidos / voz
16Cómo oye un implantado?
- No se puede saber
- Sólo unos pocos pacientes están en condiciones de
hacer comparaciones - Observación indirecta (qué son capaces de hacer)
- Teniendo en cuenta todo el proceso de
estimulación se puede sintetizar la señal tal y
como la oiría un implantado
17Aportaciones del Implante Coclear
- Percepción auditiva con calidad suficiente para
comprensión del habla (sin ruido) - Para ello, antes hay que desarrollar....
- habilidades perceptuales
- habilidades lingüísticas
- Comprensión de la voz en ruido difícil
- Percepción de los distintos sonidos, música
- proporciona toda la información temporal que un
oído normal puede percibir (poca resolución
espectral)
18Estrategias de codificación
- Analógicas
- Compressed Analog (Clarion)
- Pulsátiles
- Extracción de características
- F0/F1/F2 (Cochlear)
- MPEAK (Cochlear)
- Híbridas
- SMSP / SPEAK (Cochlear)
- N-of-M (Medel)
- Forma de onda
- ACE / CIS / CIS (Cochlear Clarion Medel)
19Compressed Analog
Banco de filtros
Ajuste de niveles
Adquisición de la señal
Estimulación
20Compressed analog
- Estimulación analógica (no pulsátil)
- Estimulación simultánea de todos los electrodos
(interacción entre canales) - Estimulación bipolar
- Campo eléctrico de cercanía
21F0 / F1 / F2
- Estima parámetros
- F0 tono fundamental (frecuencia)
- F1 primer formante (frecuencia y amplitud)
- F2 segundo formante (frecuencia y amplitud)
- Estimula dos electrodos en cada ciclo
- los correspondientes a las frecuencias F1 y F2
- con las amplitudes estimadas para F1 y F2
- con la tasa de estimulación asociada a F0
22F0 / F1 / F2
23F0 / F1 / F2
Selecciona uno entre canales 6-20
Selecciona uno entre canales 1-5
24MPEAK (Multi Peak)
Electrodo 20
4 k - 6 k
Ajuste de niveles
Electrodo 17
2.8 k - 4 k
Electrodo 14
2 k - 2.8 k
Generador de estímulos
F2
F2 800 - 4 k
A2
F1
F1 300 - 1 k
Generador de estímulos
A1
F0 0 - 270
Generador de pulsos
Selección de electrodos
Adquisición de la señal
Extracción de características
Estimulación
25Extracción de características
- Presentan la información esencial para percibir
la voz - Tono fundamental (F0)
- Primer y segundo formante
- Representación pobre de la voz
- Sensibilidad a estimación de F0, F1 y F2
- Respuesta pobre en condiciones de ruido
26SMSP, SPEAK y N-of-M
27- Implementaciones (alta tasa de estimulación)
- SMSP SPEAK N-of-M
- Ventajas
- Mejor representación que extracción de carac.
- Menos sensible a ruido de fondo
- Inconvenientes
- Se pierde información (canales con menos energía)
- Compromiso
- Número de canales - tasa de estimulación
28CIS Continuous Interleaved Sampling
29- Implementaciones (alta tasa de estimulación)
- ACE (Nucleus)
- CIS (Clarion)
- CIS (Medel)
- Ventajas
- Todos los electrodos estimulados en cada ciclo
con alta tasa de estimulación - Mejor representación de la señal de audio
- Mejor resolución en intensidad
- Mayor sensibilidad
30- Tendencias en estrategias de codificación
- Reducir extracción de características
- Alta tasa de estimulación
- Todas las estrategias actuales (CA, SPEAK, CIS)
proporcionan resultados satisfactorios - Envolvente espectral
- Resolución temporal
- Resolución en intensidad
- Prestaciones
- Representación audio suficiente para comprender
voz - Limitaciones música y ruido
31Qué es programar el I.C.?
- Ajustar los parámetros del sistema de implante
coclear para que el paciente obtenga un
aprovechamiento óptimo - Parámetros de estimulación
- Parámetros de representación del sonido
32Montaje para programar I.C.
Transmisor
Interface
Procesador
Ordenador para acceder al procesador
33Programación del procesador
- Parámetros ajustables
- conexión de electrodos
- niveles de estimulación en cada electrodo
- Umbrales de percepción THR
- Máximos niveles de confort MCL
- parámetros especiales
- Objetivos
- adaptar la estimulación a los valores
particulares de cada paciente - proporcionar la máxima calidad de audición
34Importancia del ajuste
- Electrodos activados
- La banda útil se reparte entre los electrodos
activos. Si un electrodo no es funcional debe
desconectarse - Umbrales de percepción
- Para tener sensibilidad (20 - 30 dB) y para poder
discriminar niveles de volumen - Máximos niveles de confort
- Para escuchar los sonidos fuertes (80 - 110 dB)
fuertes pero sin llegar a sensación de dolor
35Dificultades del ajuste
- Colaboración paciente - programador
- Capacidad / tiempo de atención del paciente
- Capacidad de expresión del paciente
- Descripción del paciente subjetiva
- Tolerancia del paciente a imprecisión
- Evolución fisiológica del paciente
- Objetivos mínimos cubiertos
36Influencia de la programación en la capacidad de
percepción
- El número de electrodos
- rango de frecuencia
- Electrodos no funcionales conectados
- excepciones transitorias
- Electrodos con estimulaciones colaterales
- Sobre-estimación de umbrales
- Infra-estimación de umbrales
- Desajustes de MCL
37Parámetros ajustables
- Parámetros de estimulación
- Determinación de electrodos funcionales
- Rango dinámico de cada electrodo umbral y máximo
nivel de confort - Parámetros de representación del sonido
- Modo de estimulación
- Estrategia de codificación
- Bandas de frecuencia asignadas a electrodos
- Tasa de estimulación
- Mapeo de intensidad, volumen, sensibilidad
38Determinación de electrodos funcionales
- Electrodos dentro de la cóclea
- Electrodos dentro de la cóclea en zona poco
inervada - Electrodos fuera de la cóclea
- Estimulación colateral
39Rango dinámico de cada electrodo
- Rango dinámico eléctrico es el intervalo
comprendido entre - Umbral (THR) mínima estimulación eléctrica que
detecta el paciente - Máximo nivel de confort (MCL) máxima
estimulación eléctrica que tolera el paciente - El rango dinámico debe establecerse para cada
electrodo independientemente
40- Mapeo del rango dinámico acústico al eléctrico
41Ejemplo de rango dinámico
Ecualización de canales
42Parámetros relacionados con la representación del
sonido
- Modo de estimulación
- Estrategia de codificación
- Bandas de frecuencia asignadas a electrodos
- Tasa de estimulación
- Mapeo de intensidad
- Volumen
- Sensibilidad
- Programas para situaciones especiales
43Modo de estimulación
- Configuración eléctrica de los electrodos
44Modo de estimulación
- Distribución de la corriente eléctrica
45Bandas de frecuencia asignadas a electrodos
- Rango espectral
- Distribución de los filtros en frecuencia
- (Ancho de banda y frecuencia central de cada
canal) - Lineal, logarítmica, lin-log....
- Elegida libremente por el programador
46Tasa de estimulación
- Es el número de estímulos por segundo en cada
electrodo - Mejor cuanto más alta
- Tiempo de repolarización 2ms
- Conviene que sea superior a 800 o 1000 disparos
por segundo - Limitada por
- Tecnología del procesador
- Número de electrodos activos en cada ciclo de
estimulación - Duración de los pulsos eléctricos
47Mapeo de intensidad (maplaw)
48Mapeo de intensidad (maplaw)
49Control de volumen
MCL
MCL utilizado
Niveles estimados
THR utilizado
THR
0
0
100
Nivel de volumen
50Control de volumen
MCL
Niveles estimados
THR
0
0
100
75
Nivel de volumen
51Control de sensibilidad
52Control de sensibilidad
MCL
Nivel estim. eléctrico
THR
100 dB
20 dB
Rango dinámico acústico
53Control de sensibilidad
MCL
Nivel estim. eléctrico
THR
100 dB
20 dB
Rango dinámico acústico
54Resultados en Implantes Cocleares
- Factores que afectan
- Edad de implantación
- Nivel de lenguaje previo a sordera
- Experiencia auditiva previa a sordera
- Otros factores
- Habilidades intelectuales
- Entorno social-familiar
- Presencia de otras patologías
- Etc....
55(No Transcript)
56(No Transcript)