Title: Multimedie- och kommunikationssystem, lektion 4
1Multimedie- och kommunikationssystem, lektion 4
- Forts. Kap 2 Signaler och Kvalitetsmått
- Kap 3-4 Ljud- och videokompression
2Sampling och DA-omvandling
2500 Hz 2,5kHz.
10000 sampels/sek 10kHz
.
Kvantisering (avrundning) till 8 värden.
Digitalisering ger 3 bit per värde 101 000 010
110 000.
3PCM Pulse Code Modulation Digitalisering av
analoga signaler och seriell överföring
Sifferexempel från PSTN publika telefonnätet
011011010001...
1
0
Högtalare
Mikrofon
8000 sampels per sek
300-3400Hz bandpass-filter. Spärrarallt över
4000Hz.
4Exempel
En 6 sekunder lång ljudinspelning digitaliseras.
Hur stor är inspelningens informationsmängd? a)
22000 sampels/sekund, 256 kvantiseringsnivåer. b
) 22000 sampels/sekund, 16 kvantiseringsnivåer.
c) 5500 sampels/sekund, 256 kvantiseringsnivåer.
22000sampels 6 s 8 bit 1056000bit.
22000sampels 6 s 4 bit 528000bit.
5500sampels 6 s 8 bit 264000bit.
5Vikningsdistorsion (aliasing)
Inträffar om man inte filtrerar bort frekvenser
som är högre än halva samplingsfrekvensen. Exempe
l En sinuston på 4kHz som samplas med
samplingsfrekvens 4 kilosampels/s viks ned till
en ton på ton på 2kHz.
6Example
What sampling rate is needed for a signal with a
bandwidth of 10,000 Hz (1000 to 11,000 Hz)?
Solution
The sampling rate must be twice the highest
frequency in the signal
Sampling rate 2 x (11,000) 22,000
samples/s
7Samplingsteoremet
- f lt fs/2
- Den högsta frekvens som kan samplas är halva
samplingsfrekvensen. - Om man samplar högre frekvens än fs/2 så byter
signalen frekvens, dvs det uppstår
vikningsdistorsion (aliasing). - För att undvika vikningsdistorsion så har man ett
anti-vikningsfilter innan samplingen, som tar
bort frekvenser över halva samplingsfrekvensen. - Interpolationsfiltret används vid rekonstruktion
av den digitala signalen för att gissa värden
mellan samplen. - Ett ideal interpolationsfilter skulle kunna
återskapa den samplade signalen perfekt om den
uppfyller samplingsteoremet. I verkligheten finns
inga ideala filter. - Följdregel Nyqvists sats säger att max
datahastighet 2B2log M, där M är antal nivåer,
och B är signalens bandbredd, oftast lika med
signalens övre gränsfrekvens.
8Example 2.1
9(No Transcript)
10Example 2.4 PCM coding of speach and music
11Example 2.7Uncompressed video
12Kvantiseringsdistorsion
13 14Signal-to-quantization ratio (SQR)
15Example 2.2 Quantization distorsion
16Kvantiseringsdistorsion (kvantiseringsbrus)
- Avrundningsfelet låter ofta som ett brus.
- Svaga ljud avrundas bort, eller dränks i
kvantiseringsbruset. - Varje extra bit upplösning ger dubbelt så många
spänningsnivåer, vilket ger en halvering av
kvantiseringsdistorsionens spänningsnivå, dvs en
fjärdedels effekt, dvs en minskning med 6 dB. - N bit upplösning ger ett signal-till-kvantiserings
brus-förhållande (SQRSignal to quantization
noise ratio) på i storleksordning N6 dB (det kan
skilja några dB beroende på hur man definierar
max signalnivå.)
17Kompressionsalgoritmer
18Shannons entropi-formel
- Entropi informationsmängd per kodord, dvs
minsta möjliga antal bit per kodord efter
datakompression.
19Språkets entropi.
- Exempel Om det engelska alfabetets 26 bokstäver
vore lika vanliga blir entropin per bokstav - Men, den verkliga entropin i det engelska
språket är 2.62 bit/bokstav. Det går alltså att
komprimera till den nivån, med hjälp av en
variabel-längd-kod, dvs en kod som har olika
antal bit för olika tecken, t.ex. s.k.
Huffmankodning.
20Example 3.1
21(No Transcript)
22(No Transcript)
23Huffman decoding example
24Figure 3.4 Huffman encoding example (a)
codewordgeneration (b) Huffman code tree.
25Figure 3.3 Huffman code tree construction (a)
final tree with codes (b) tree derivation.
26Example 3.2 A series of messages
27(No Transcript)
28(No Transcript)
29(No Transcript)
30Differentiell PCM-kodning av ljud
Det som överförs är skillnaden mellan nuvarande
sampel och och föregående mottagen sampel (inkl
kvantiseringsfel). DPCM möjliggör färre bitar
per sampel än vidvanlig PCM. Vid tillräckligt
högsamplingsfrekvens kanman använda
s.k.enbitsteknik, dvs en bit per sampel.
31Linear predictive coding (LPC) signal encoder
anddecoder schematic.
Användsvid kodning av mänskligt
tal. Exempel GSMs talkodningkomprimerar
PCMs ursprungliga 64 000 bps till 13 000 bps.
32Delbandskodning (Sub-band coding)
En CD-spelare kräver 16 bit per sampel x 44100
sampels per sekund x 2 kanaler 1,4Mbps
(miljoner bit per sekund). I MPEG layer 2
(används vid DVD, DVB och digitalradio)
komprimeras datamängden till mellan 32Kbps och
384kbps (tusen bit per sekund) per ljudkanal.
Man utnyttjar då örats maskeringseffekt, som
gör att starka ljud dränker svaga ljud på
närliggande frekvenser. En filterbank delar upp
signalen i delfrekvensband. Varje delband
kvantiseras för sig. I delband där ljudet är
starkt kan man ha högt kvantiseringsbrus (högt
Vmax och därmed högt q) utan att det hörs.
Spektrum
Hörs ej
Frekvens
33Figure 3.14 JPEG JointPhotographic Experts
Group
34DCT Discrete Cosine Transform 2D computation
35Figure 3.17 Example of DCT quantization.
36Figure 3.18 Vectoring using a zig-zag scan (a)
principle(b) vector for example shown in Figure
3.17.
37Video compression standards
- H.261, H.263, MPEG1 and MPEG2 are all based on
the following techniques - Each frame is divided into blocks.
- Transform coding of each block. (DCT coding, with
quantization, zig-zag scanning and run-length
coding.) - Differential coding of the motion.
- Motion prediction.
38Figure 4.11 Example frame sequences with (a)
I- and P-framesonly (b) I-, P- and B-frames
(c) PB-frames.
I intracoded frame P predicted/intercoded
frame B bidirectional interpolated frame
39Figure 4.20 MPEG-1 example frame structure
I intracoded frame P predicted/intercoded
frame B bidirectional interpolated frame
40Example 4.1 MPEG-1
41(No Transcript)
42Example 4.2
43(No Transcript)
44(No Transcript)