Title: Nessun%20titolo%20diapositiva
1Politecnico di Milano
RIGENERAZIONE DI SEGNALI VOCALI TRAMITE TECNICHE
DI SOTTRAZIONE SPETTRALE IMPLEMENTAZIONE SU
DIOPSIS740
Relatore Prof. Anna Antola Correlatore Ing.
Marco Domenico Santambrogio
Tesi di laurea di Alessandro Enrico Cesare
Redondi matricola 662895
A.A. 2005/2006
2Sommario
- Obbiettivi e motivazioni
- Panoramica sullarchitettura Diopsis 740
- Il metodo di sottrazione spettrale
- Implementazione dellalgoritmo su scheda
- Risultati
- Conclusioni
Alessandro Redondi
2
3Obbiettivi e motivazioni
- Studio accurato dellarchitettura dual - core
prodotta da Atmel e degli strumenti di sviluppo - Studio di un metodo di rigenerazione dei segnali
vocali la sottrazione spettrale - Implementazione della tecnica studiata su
Diopsis740
- Produrre unapplicazione real-time volta a
migliorare lintelligibilità di segnali vocali
immersi nel rumore - I risvolti pratici potrebbero essere utilizzati
sia in sistemi di comunicazione, che in sistemi
automatici di riconoscimento vocale.
Alessandro Redondi
3
4Diopsis740
- Architettura dual - core che unisce la
versatilitàdi un processore ARM alla potenza di
calcolo diun DSP - Particolarmente indicato per applicazioni audio
ARM7TDMI - Master, gestione periferiche mAgic
DSP - Slave, calcoli sui dati
Alessandro Redondi
4
5JTST - JigTeST for Diopsis740
- Prototipo che offre molteplici risorse per lo
sviluppo di applicazioni - oscillatore a
25 MHz - 2 porte seriali - 4 canali I/O
audio stereo - convertitori AD/DA -
display a 7 segmenti - porta USB 2.0 a 12 MHz
Alessandro Redondi
5
6La sottrazione spettrale
FT
IFT
y(t) x(t) n(t)
y(t) x(t) n(t)
X(f) Y(f) - N(f)
x(t)
- Tecnica di rigenerazione di segnali vocali
immersi nel rumore - Relativamente poco costosa dal punto di vista
computazionale - Poco adatta in casi in cui il SNR sia basso
phaseY(f)
mode 2
y(n)
x(t)
X(f)
Y(f)
-
Sovrapposizione e somma
Hamming
FFT
IFFT
N(f)
mode 1
Alessandro Redondi
6
7Implementazione
Problematiche
principali - divisione dei compiti - scambio
dei dati tra i processori - ottimizzazione
dellapplicazione operare su codice e scelte
tecniche
Soluzioni - ARM si occupa delle periferiche
(ADDA e USART), mAgic dei calcoli - NON
utilizzare la memoria condivisa, ma sfruttare il
System Mode - utilizzare le funzioni ottimizzate
di Atmel, operare su blocchi da 128 campioni con
una fc 8 KHz
Alessandro Redondi
7
8Implementazione
- ARM effettua la copia e la lettura ogni 64
campioni - Lipotesi di fondo (sempre
verificata) è che questa operazione sia più
veloce del tempo di un campionamento
Alessandro Redondi
8
9Risultati Diopsis740 VS Matlab
Entrambe le implementazioni producono un
miglioramento di 12 dB!
MA
- D740 in real-time! - Tempo di calcolo circa
1/20 del tempo disponibile
Alessandro Redondi
9
10Conclusioni e sviluppi futuri
Conclusioni
- D740 nel complesso molto efficace per
applicazioni audio - Sottrazione spettrale
tecnica valida e poco dispendiosa, ma in
applicazioni con SNR non troppo bassi
Sviluppi futuri
- Implementazione di un VAD (Voice Activity
Detector) per lautomazione del dispositivo -
Migliori risultati possono essere ottenuti con un
sistema di postprocessing
Alessandro Redondi
10