2. REPREZENTAREA NUMERICA A SEMNALULUI VOCAL - PowerPoint PPT Presentation

1 / 24
About This Presentation
Title:

2. REPREZENTAREA NUMERICA A SEMNALULUI VOCAL

Description:

2. REPREZENTAREA NUMERIC A SEMNALULUI VOCAL Reprezentarea numeric implic urm toarele opera ii: e antionarea efectuat cu o frecven Fe compatibil cu ... – PowerPoint PPT presentation

Number of Views:63
Avg rating:3.0/5.0
Slides: 25
Provided by: poly51
Category:

less

Transcript and Presenter's Notes

Title: 2. REPREZENTAREA NUMERICA A SEMNALULUI VOCAL


1
2. REPREZENTAREA NUMERICA A SEMNALULUI VOCAL
  • Reprezentarea numerica implica urmatoarele
    operatii
  • esantionarea efectuata cu o frecventa Fe
    compatibila cu cerintele
  • impuse de teorema esantionarii
  • cuantizarea fiecarui esantion cu un pas de
    cuantizare q,
  • ales în functie de precizia dorita pentru
    reprezentare
  • codarea adecvata aplicatiei particulare.

2
  • 1. Esantionarea
  • spectrul semnalului vocal se poate întinde pâna
    la 12 kHz

gt ar trebui aleasa o frecventa de esantionare
Fe 24 kHz
gt costuri (filtrare, transmisie, înregistrare
etc.) ridicate.
  • în cazul transmisiilor telefonice spectrul
    semnalului vocal
  • este limitat la 3.4 kHz

gt se alege frecventa de esantionare Fe 8 kHz.
  • în aplicatii de sinteza sau recunoastere a
    vorbirii, valoarea
  • frecventei de esantionare creste (de exemplu
    Fe 16 kHz).
  • semnalul audio (voce plus muzica) pretinde o
    buna
  • reprezentare în domeniul frecventa pâna la
    peste 20 KHz

gt utilizarea unei frecvente de esantionare Fe
44 - 48 kHz.
3
  • 2. Cuantizarea
  • operatia de cuantizare a esantioanelor produce
    o eroare care
  • se comporta ca un zgomot alb suprapus peste
    semnal.
  • pasul de cuantizare q va fi impus de catre
    raportul
  • semnal/zgomot dorit.
  • în cazul transmisiei telefonice fiecare
    esantion este
  • reprezentat pe 8 biti.
  • cuantizarea semnalului audio necesita o eroare
    de cuantizare
  • mai mica, folosindu-se cuvinte de 16 biti.
  • caracteristica esentiala care rezulta din modul
    de
  • reprezentare este debitul binar (debitul
    informational) biti/s.
  • transmisia telefonica necesita un debit de 8000
    ? 8 64 Kb/s.
  • transmisia sau înregistrarea unui semnal audio
    necesita un
  • debit de pâna la 48000 ? 16 768 Kb/s.

4
3. Codarea a) Codarea directa a semnalului
(waveform coding codarea formei de
unda). PCM Pulse Code Modulation, DPCM
Differential PCM, ADPCM Adaptive Differential
PCM, DM Delta Modulation, ADM Adaptive Delta
Modulation, SBC Sub-Band Coding, ATC Adaptive
Transform Coding etc.
b) Codarea parametrica (source coding
codarea sursei).
  • parametrii ce caracterizeaza transmitanta
    tractului vocal
  • (câstigul ? si coeficientii ai)
  • parametrii ce caracterizeaza modul de excitatie
    al tractului
  • vocal (zgomot alb sau tren de impulsuri
    periodice).

5
(No Transcript)
6
(No Transcript)
7
3. PROPRIETATI STATISTICE ALE SEMNALULUI
VOCAL
  • semnalul vocal realizare particulara a unui
    proces aleator nestationar.
  • doua tipuri de statistica
  • statistica pe termen lung
  • - proprietatile statistice medii ale semnalului
    vocal sunt
  • estimate pe intervale de timp de ordinul
    câtorva zeci de
  • secunde si mediate pe mai multi vorbitori
  • statistica pe termen scurt
  • - evaluarea proprietatilor statistice pe transe
    temporale
  • de ordinul a 10-30 ms, în decursul carora
    semnalul
  • poate fi considerat cvasistationar.

8
Reprezentarea în timp a semnalului vocal obtinut
la pronuntarea cuvântului sase
9
a
s
10
Caracteristici statistice ale semnalului vocal
  • Principalele caracteristici statistice ale
    semnalului vocal sunt
  • densitatea de probabilitate
  • valoarea medie
  • varianta
  • rata trecerilor prin zero
  • functia de autocorelatie
  • functia de autocovarianta
  • coeficientul de autocorelatie
  • densitatea spectrala de putere
  • densitate spectrala de putere pe termen scurt.

11
1. Densitatea de probabilitate
  • densitatea de probabilitate a semnalului xn
    (pp. ergodic si stationar)
  • estimari experimentale ale acestei densitati de
    probabilitate,
  • realizate pe segmente de vorbire de ordinul a
    50 secunde si
  • mediate pe câteva zeci de vorbitori, au aratat
    ca aceasta
  • densitate de probabilitate este apropiata de
    distributia Laplace.

12
(No Transcript)
13
2. Valoarea medie
  • Pentru semnalul vocal aceasta medie va fi
    presupusa nula
  • (ea nu contine nici o informatie utila).

14
3. Varianta
  • acest parametru reprezinta energia medie a
    semnalului.

15
Evolutia variantei (energiei) pe termen scurt a
semnalului vocal corespunzator cuvântului sase,
estimata pe transe de 200 esantioane (25 ms)
16
4. Rata trecerilor prin zero
  • Pentru un semnal esantionat se considera ca
    exista treceri prin zero
  • atunci când doua esantioane succesive au
    semnul opus.
  • Rata trecerilor prin zero pe termen lung
    prezinta o repartitie
  • apropiata de cea gaussiana, cu o valoare medie
    de 0.49 pentru
  • fonemele nesonore si de 0.14 pentru cele
    sonore.

17
Rata trecerilor prin zero pentru cuvântul sase
18
5. Functia de autocorelatie
19
Proprietati ale functiei de autocorelatie
20
6. Functia de autocovarianta
21
7. Coeficientul de autocorelatie
  • În cazul transei sonore, functia de
    autocorelatie este
  • cvasiperiodica si în primul maxim diferit de
    cel din origine
  • permite determinarea frecventei fundamentale
  • În cazul transei nesonore, functia de
    autocorelatie nu mai este
  • periodica si în general nu mai contine maxime
    comparabile
  • cu cel din din origine.

22
(No Transcript)
23
8. Densitatea spectrala de putere
24
9. Densitatea spectrala de putere pe termen scurt
Write a Comment
User Comments (0)
About PowerShow.com