Title: 2. REPREZENTAREA NUMERICA A SEMNALULUI VOCAL
12. REPREZENTAREA NUMERICA A SEMNALULUI VOCAL
- Reprezentarea numerica implica urmatoarele
operatii - esantionarea efectuata cu o frecventa Fe
compatibila cu cerintele - impuse de teorema esantionarii
- cuantizarea fiecarui esantion cu un pas de
cuantizare q, - ales în functie de precizia dorita pentru
reprezentare
- codarea adecvata aplicatiei particulare.
2- 1. Esantionarea
- spectrul semnalului vocal se poate întinde pâna
la 12 kHz
gt ar trebui aleasa o frecventa de esantionare
Fe 24 kHz
gt costuri (filtrare, transmisie, înregistrare
etc.) ridicate.
- în cazul transmisiilor telefonice spectrul
semnalului vocal - este limitat la 3.4 kHz
gt se alege frecventa de esantionare Fe 8 kHz.
- în aplicatii de sinteza sau recunoastere a
vorbirii, valoarea - frecventei de esantionare creste (de exemplu
Fe 16 kHz).
- semnalul audio (voce plus muzica) pretinde o
buna - reprezentare în domeniul frecventa pâna la
peste 20 KHz
gt utilizarea unei frecvente de esantionare Fe
44 - 48 kHz.
3- 2. Cuantizarea
- operatia de cuantizare a esantioanelor produce
o eroare care - se comporta ca un zgomot alb suprapus peste
semnal.
- pasul de cuantizare q va fi impus de catre
raportul - semnal/zgomot dorit.
- în cazul transmisiei telefonice fiecare
esantion este - reprezentat pe 8 biti.
- cuantizarea semnalului audio necesita o eroare
de cuantizare - mai mica, folosindu-se cuvinte de 16 biti.
- caracteristica esentiala care rezulta din modul
de - reprezentare este debitul binar (debitul
informational) biti/s.
- transmisia telefonica necesita un debit de 8000
? 8 64 Kb/s.
- transmisia sau înregistrarea unui semnal audio
necesita un - debit de pâna la 48000 ? 16 768 Kb/s.
43. Codarea a) Codarea directa a semnalului
(waveform coding codarea formei de
unda). PCM Pulse Code Modulation, DPCM
Differential PCM, ADPCM Adaptive Differential
PCM, DM Delta Modulation, ADM Adaptive Delta
Modulation, SBC Sub-Band Coding, ATC Adaptive
Transform Coding etc.
b) Codarea parametrica (source coding
codarea sursei).
- parametrii ce caracterizeaza transmitanta
tractului vocal - (câstigul ? si coeficientii ai)
- parametrii ce caracterizeaza modul de excitatie
al tractului - vocal (zgomot alb sau tren de impulsuri
periodice).
5(No Transcript)
6(No Transcript)
73. PROPRIETATI STATISTICE ALE SEMNALULUI
VOCAL
- semnalul vocal realizare particulara a unui
proces aleator nestationar.
- doua tipuri de statistica
- statistica pe termen lung
- - proprietatile statistice medii ale semnalului
vocal sunt - estimate pe intervale de timp de ordinul
câtorva zeci de - secunde si mediate pe mai multi vorbitori
- statistica pe termen scurt
- - evaluarea proprietatilor statistice pe transe
temporale - de ordinul a 10-30 ms, în decursul carora
semnalul - poate fi considerat cvasistationar.
8Reprezentarea în timp a semnalului vocal obtinut
la pronuntarea cuvântului sase
9a
s
10Caracteristici statistice ale semnalului vocal
- Principalele caracteristici statistice ale
semnalului vocal sunt - densitatea de probabilitate
- valoarea medie
- varianta
- rata trecerilor prin zero
- functia de autocorelatie
- functia de autocovarianta
- coeficientul de autocorelatie
- densitatea spectrala de putere
- densitate spectrala de putere pe termen scurt.
111. Densitatea de probabilitate
- densitatea de probabilitate a semnalului xn
(pp. ergodic si stationar)
- estimari experimentale ale acestei densitati de
probabilitate, - realizate pe segmente de vorbire de ordinul a
50 secunde si - mediate pe câteva zeci de vorbitori, au aratat
ca aceasta - densitate de probabilitate este apropiata de
distributia Laplace.
12(No Transcript)
132. Valoarea medie
- Pentru semnalul vocal aceasta medie va fi
presupusa nula - (ea nu contine nici o informatie utila).
143. Varianta
- acest parametru reprezinta energia medie a
semnalului.
15Evolutia variantei (energiei) pe termen scurt a
semnalului vocal corespunzator cuvântului sase,
estimata pe transe de 200 esantioane (25 ms)
164. Rata trecerilor prin zero
- Pentru un semnal esantionat se considera ca
exista treceri prin zero - atunci când doua esantioane succesive au
semnul opus.
- Rata trecerilor prin zero pe termen lung
prezinta o repartitie - apropiata de cea gaussiana, cu o valoare medie
de 0.49 pentru - fonemele nesonore si de 0.14 pentru cele
sonore.
17Rata trecerilor prin zero pentru cuvântul sase
185. Functia de autocorelatie
19Proprietati ale functiei de autocorelatie
206. Functia de autocovarianta
217. Coeficientul de autocorelatie
- În cazul transei sonore, functia de
autocorelatie este - cvasiperiodica si în primul maxim diferit de
cel din origine - permite determinarea frecventei fundamentale
- În cazul transei nesonore, functia de
autocorelatie nu mai este - periodica si în general nu mai contine maxime
comparabile - cu cel din din origine.
22(No Transcript)
238. Densitatea spectrala de putere
249. Densitatea spectrala de putere pe termen scurt