Title: Aquisi
1Aquisição de Dados Multimédia
- Joaquim Macedo
- Departamento de Informática da Universidade do
Minho Faculdade de Engenharia da Universidade
Católica de Angola
2Sumário
- Amostragem de Sinais Áudio
- Amostragem de Imagens 2D
- Filtros Anti-Aliasing
- Digitalização de Sinais Áudio
- Conersão D/A
- Critério de Fidelidade de Áudio
- MIDI versus Áudio Digital
- Digitalização de Imagens
- Medidas de Fidelidade Visual
3Forma de onda dum sinal
Amplitude versus Tempo
4Espectro do mesmo sinal
Amplitude versus frequência
5Um sinal áudio e o seu espectro
6Amostragem
- Amostragem é o processo de fazer medidas à
amplitude do sinal em intervalos discretos do
tempo/espaço
t
t
fs 1 / t
7Transformada de Fourier
- Seja g(t) um sinal áudio arbitrário
- Define-se G(w) como a transformada de Fourier de
g(t) se
8Transformada de Fourier
9Transformada de Fourier
10Transformada de Fourier
11Amostragem Discreta no Tempo
amplitude
tempo
12Amostragem uniforme
- Se o sinal g(t) for amostrado uniformemente a uma
taxa de fs amostras por segundo
13Sub-amostragem
14Sub-amostragem
Sinal original
Amostragem
Sinal reconstruído
15Teorema da Amostragem
- Um sinal contínuo no tempo g(t) pode ser
reconstruído de forma exacta das suas amostras
gs(t) se se cumprirem 2 condições - g(t) deve ser de banda limitada com uma
frequência máxima ?M - A frequência de amostragem ?s de gs(t) deve ser
maior que 2?M, i.e. ?sgt2?M. - A segunda condição é conhecida como Critério de
Nyquist - ?s referenciada como Frequência de Nyquist ,
i.e. a menor frequência de amostragem possível
para recuperar o sinal original a partir das
suas amostras
16Amostragem de banda limitada
Original
Filtro Passa Baixo
Gs(f)
Amostrado
-2fs -fs 0
fs 2 fs
f
(-fs-B) -(fs B) -B B (fs -B) (fs B)
17Amostragem com frequência de Nyquist
18Amostragem de um sinal 1-D
19Reconstrução DirectaFórmula de Interpolação do
domínio do tempo
- Os valores do sinal para instâncias do sinal não
amostradas podem ser calculadas exactamente com
um somatório de todos os valores amostrados - As abordagens usadas para reconstrução do sinal
no domínio da frequência e do tempo são
equivalentes - A função sinc do lado direito da equação é a
resposta de impulso dum filtro passa-baixo ideal
20Exemplo 4.1
- Considere o seguinte sinal áudio com um tom
sinusoidal de 4.5KHz -
- Amostre o sinal a taxa de i) 8000 ii) 10000
amostras/segundo - Reconstrua o sinal passando-o através dum filtro
passa baixo ideal com frequência de corte igual a
metade da frequência de amostragem. Assuma que os
ganhos dos filtros são de i)1/8000 e ii)1/10000.
Determina o sinal reconstruído nos dois casos.
21Caso-1
A frequência de corte do filtro passa baixo é
metdade da frequência da amostragem isto é 4000
Hz. Portanto a função de transferência do filtro
é
22Caso-1 (cont)
Quando o sinal amostrado passa através do filtro
passa-baixo a transformada de Fourier do sinal de
saída vai ser
Portanto o sinal de saída
23Caso-2
A frequência de corte do filtro passa baixo é
metdade da frequência da amostragem isto é 5000
Hz. Portanto a função de transferência do filtro
é
24Caso-2 (cont)
Quando o sinal amostrado passa através do filtro
passa-baixo a transformada de Fourier do sinal de
saída vai ser
Portanto o sinal de saída
25Sinal original e reconstruído Exemplo 4.1
26Sobreposição do Espectro (Aliasing)
- Se a condição de Nyquist não for satisfeita,
acontece a Sobreposição do Espectro (Aliasing)
que impede a perfeita reconstrução do sinal.
Se Wslt2WN, ocorre o aliasing.
27Cálculo das frequências de aliasing
Frequência original (Hz) f1-mFs Frequência do sinal recosntruído Comentário
500 500 Sem aliasing
2500 2500 Sem aliasing
2900 2900 Sem aliasing
3001 3001-16000 2900 Aliasing
3500 3500-16000 2500 Aliasing
10000 10000-26000 2000 Aliasing
20000 20000-36000 2000 Aliasing
1000000 10000-1676000 2000 Aliasing
28O que é uma imagem?
Uma imagem pode ser definida como uma uma função
de intensidade de luz i(x,y,t) onde a amplitude
da função em qualquer coordenada espacial (x,y)
disponibiliza a intensidade (brilho) da imagem
num determinado instante t
29Amostragem de imagem 2D
- Uma imagem digital pode ser obtida por amostragem
dum imagem contínua. - Pode ser usada a seguinte função de amostragem
30Amostragem de imagem 2D
31Amostragem de imagens 2D
- A função de amostragem ideal para uma imagem é
uma matriz de infinita com funções delta de Dirac
situadas numa grelha - A amostra da imagem é definida como
- A Transformada de Fourier da função comb
- A Transformada de Fourier da amostra da imagem é
32Amostragem em 2DFunção de amostragem
33Amostragem em 2DAmostra da imagem
34Resolução espacial da amostragem
35Aumento ou Diminuição da Resolução Espacial
Imagem original
zoomed down
zoomed up para tamanho original
- A resolução espacial pode ser mudada pela
eliminação ou replicação de pixels ou por
interpolação - As técnicas mais comuns de interpolação incluem a
bilinear, bicúbica e do vizinho mais próximo (
nearest neighbor)
36Taxa de Nyquist, Aliasing, and Frequências
Foldover
- Taxas e frequências de Nyquist
- O efeito de aliasing acontece quando
- Frequências Foldover
-
37Imagens de banda limitada
38Teorema da amostragem
- Uma imagem de banda limitada amostrada por uma
grelha rectangular pode ser recuperada desde que
a taxa de amostragem seja superior à taxa de
Nyquist rate. - A imagem pode ser reconstruída pela fórmula de
interpolação
39Exemplo 4.2
- Considere a seguinte grelha para imagem com
frequência horizontal e vertical de 4 e 6
ciclos/grau respectivamente - Amostre a imagem a 10 amostras/grau tanto na
horizontal como vertical. Reconstrua a grelha
pasando-a por um filtro passa baixo 2D com as
seguintes características - Determina a grelha reconstruída
40Espectro de Fourier da Imagem Contínua
41Espectro de Fourier da Imagem Discreta
Transformada de Fourier da imagem amostrada
42Espectro da Imagem Amostrada
Transformada de Fourier do sinal filtrado
43Imagem Aliased
Imagem Original
Imagem Reconstruída
44Taxa de amostragem óptima
- Resolução da imagem
- Parâmetro importante para criar imagem digital
- Expressa em dpi ou dots/cm
- Frequência de amostragem
- Critério de Nyquist
- Limitações do SVH lt 20 ciclos/grau,
- 40 ciclos/grau na amostragem
45Exemplo 4.3
- Vai-se fazer varrimento duma foto 4x6.
Determinar a mínima resolução do varrimento.
46Resolução de varrimento
- Assumindo uma taxa de amostragem de 40
amostras/grau - A imagem digital deve ter 380 e 256 pixels na
direcção hor. and vert. - Como o tamanho da imagem é 4x6, a resolução
mínima é 64 dpi.
47Filtro anti-aliasing
48Filtro Passa Baixo Ideal
A
1.0
Banda Filtrada
Banda Passante
0.0
f
fs/2
fs
49Especificação do desenho de filtros
Considere um sinal áudio com espectro 0-20 KHz. O
sinal vai Ser amostrado a 8 KHZ. Conceba um
filtro anti-aliasing adequado
- A frequência de amostragem é 8 KHz.
- O filtro ideal para anti-aliasing será um
filtro passa baixo com frequência de corte a
4KHz. - Contudo é fisicamente impossível desenhar um
filtro ideal. - Neste exemplo vai-se desenhar um filtro PB com as
seguintes características
- Banda passante é 0-3200 Hz. Ganho na banda
passante, Gp gt -2 dB - Banda de transição é 3200-4000 Hz
- Banda de rejeição é is gt 4000 Hz.O ganho na
banda de rejeição , - Gs lt -20 dB
50Desenho de Filtros com MATLAB
- Filtros passa-baixo contínuos no tempo típicos
são Butterworth, e - Chebyshev-1, e Chebyshev-2.
- Estão disponíveis técnicas normalizadas para
concepção desses filtros.
MATLAB code for designing lowpass
filter Wp3200 Ws4000 Gp-2 Gs-20 Ideal
Filter mag0 ones(1,4001) zeros(1, 4000)
Butterworth Filter n, Wc
buttord(Wp,Ws,-Gp,-Gs,s) num,den
butter(n,Wc,s)
Coeficientes do numerador e denominador da função
de transferência do filtro
51Funções de Transferência
Butterworth
Chebyshev-1
52Características do Filtro
53Exemplos Amostragem Imagens Anti-Aliasing
Filtragem Anti-aliasing
Imagem sub-amostrada
Imagem Original
54Digitalização do Sinal ÁudioAmostragem e
Digitalização
Amplificador
Filtro Anti-Aliasing
Áudio Analógico, Contínuo
Amostra e Sustenta
Gerador de Ruído Aleatório (Dither)
Conversor A/D
Áudio Digital, Discreto
55Digitalização do Sinal ÁudioGravação e
Armazenamento de N canais
Áudio Analógico Canal 1
Amostragem e Digitalização
...
Compressão e Correcção de Erros
Multiplexer
Amostragem e Digitalização
Áudio Analógico Canal N
Meio de Armazenamento
56Gravação e armazenamento áudio Funções dos
diferentes blocos do sistema
Bloco Funções
Amplificador Amplifica o sinal antes da introdução de qualquer ruído (aleatório ou de quantificação)
Gerador de Ruído Adiciona uma pequena quantidade de ruído aleatório, que aumenta a qualidade de percepção
Filtro anti-aliasing Um filtro passa baixo para garantir que o sinal é de banda limitada. Elimina o aliasing
Amostra e Aguenta Aguenta o valor do sinal áudio e amostra-o em cada instância da amostra
Conversor A/D Calcula a representação digital equivalente do sinal analógico
Multiplexador Multiplexa a cadeia de bits dos diferentes canais
Compressão Reduz a redundância e compacta o tamanho do ficheiro áudio mantendo uma qualidade de áudio aceitável
57Conversor Digital-Analógico
- A entrada do conversor DA é um sinal discreto
no tempo cuja amplitude é um número real que pode
requerer um número um número infinito de
bits/dígitos para uma verdadeira representação - Para o processamento digital por computadores, o
sinal em cada instante de tempo tem que ser
convertido para um número para um número com
precisão finita (I.e., 8, 16 or 32 bits). - Isto é feito por um quantificador que estabelece
uma correspondência entre uma variável contínua e
uma variável discreta.
58Quantificador de N-níveis
A saída do quantificador para uma dada entrada
pode ser calculada com o seguinte
procedimento.
onde
Se os nívei de decisão são equidistantes, i.e.,
se é constante para
todo o k, o quantificador é chamado quantificador
uniforme caso contrário é chamado um
quantificador não uniforme.
59Quantificador uniforme
60Quantificador não uniforme
61Exemplo 4.5
- Considere um sistema de gravação áudio onde o
microfone gera uma voltagem contínua no intervalo
-1,1 volts. Calcule os níveis de decisão e
reconstrução para um quantificador de 8 níveis.
62Exemplo (cont.)
Os níveis de decisão e reconstrução podem ser
calculados a partir das seguintes equações
63Níveis de decisão e reconstrução Quantificador
do exemplo 4.5
K Níveis de Decisão Níveis de Reconstrução
0 -1.0 -0.875
1 -0.75 -0.625
2 -0.50 -0.375
3 -0.25 -0.125
4 0.00 0.125
5 0.25 0.375
6 0.50 0.625
7 0.75 0.875
8 1.0
64Sinais originais e quantificados
65Erro de quantificação
O erro de quantificação (também conhecido como
ruído de quantificação) é a diferença entre o
valor actual do sinal analógico e o seu valor
quantificado..
Amplitude Original Amplitude
Quantificada
66Taxa de bits do sinal áudio
Para canal mono
Frequência amostragem
Para cana stéreo
67Representação PCM da saída
Como se representam as saídas do quantificador?
As saídas quantificadas a N-níveis são
representadas com B bits onde
Por exemplo, a saída do quantificador de 8 níveis
pode ser representado usando 3 bits.
8 bits ? 256 Níveis 16 bits ? 65536 Níveis 32
bits ? 4.3x109 Níveis
Níveis Representação PCM
0 000
1 001
.
6 110
7 111
68Taxa de bits Vs. Qualidade
Máximo erro de quantificação 0.5Intervalo_Decis
ão A qualidade do sinal quantificado será
superior se o ruúdo de quantificação for pequeno?
Intervalo de deecisão é pequeno ? N é grande ?B é
grande. Se B é grande ? Aumenta a taxa de bits.
Portanto, há que estabelecer um comprimisso
entre a taxa de bits e a qualidade do sinal áudio
digitalizado. Taxa de bits alta ? Ruído de
quantificação baixo Melhor qualidade subjectiva
69Critérios de Fidelidade Áudio
- A amostragem e a quantificação
- Degradam a qualidade do sinal
- São usadas diversas métricas para avaliar a
quaildade do sinal quantificado - Medidas de Distorção
- Relação Sinal-Ruído e Erro Quadrático Médio
- Crítérios objectivos
- Audibilidade da distorção do sinal
- Critérios subjectivos
70Critério de Fidelidade ÁudioAudibilidade da
distorção do sinal
Muito incómodo 1
Incómodo 2
Ligeiramente Incómodo 3
Perceptível mas não incómodo 4
Imperceptível 5
71Critério de Fidelidade Áudio
- Os testes de qualidade subjectiva são geralmente
superiores - Mas são um processo complicado envolvendo uma
série de pessoas - As medidas são influenciadas pela escolha das
pessoas e pelo estabelecimento do cenário
experimental - Por esse facto, são usadas geralmente medidas
objectivas para avaliação
72Medidas de DistorçãoRelação Sinal-Ruído e Erro
Quadrático Médio
73Relação Sinal-Ruído
- A relação sinal-ruído (SNR) é a medida de erro
mais popular em engenharia electrotécnica. - Disponibiliza informação útil na maior parte dos
casos e é matematicamente tratável. Por esta
razão é também bastante usada na codificação de
áudio e imagens. - Infelizmente os valores SNR não se
correlacionam bem com medidas subjectivas,
especialmente com altas taxas de compressão. - Foi proposta uma série de novas medidas de
distorção para melhor adaptação ao sistema de
audição humano.
74Medida de qualidade objectiva
Pressuposto
- Ruído de quantificação com gama de variação
dinâmica de 1 istó é -
- O erro e(nT) é suposto ser estatisticamente
independente e uniformemente distribuído no
intervalo Q/2 e Q/2 -
Erro médio quadrado do erro de quantificação
onde
75SNR versus Bits/amostra
Cada bit adicional/amostra reduz o ruído de
aproxiamadamente 6 dB, aumentando assim a SNR da
mesma quantidade.
Regra
8 bits audio ? 48 dB SNR 12 bits audio ? 72 dB
SNR 16 bits audio ? 96 dB SNR
CD audio ? 96 dB. Tipicamente, um sinal de áudio
com uma relação sinal-ruído (SNR) de mais de 90
dB SNR é considerado de excelente qualidade.
76Exemplo
Considere o sinal áudio stéreo chord
digitalizado com uma frequência de amostragem de
22.050 KHz, com uma precisão de 16 bits/amostra.
Chord.wav
Duração do sinal 1.1 sec Total de amostras
24231 Estime a SNRs do sinal de for quantificado
com 5-12 bits/amostra.
77Erro de quantificação
Considere que o sinal original é um sinal áudio
de 16-bit, podemos quantificá-lo para b bits
usando
Erro de quantificação a 8 bits/amostra
pdf do erro de quantificação (8
bits/amostra)
78SNR versus Taxa de bits
SNR versus bits/amostra
79Áudio DigitalVárias taxas de amostragem e
resoluções
Qualidade Taxa de amostragem (em KHz) Bits/ Amostra Mono/ Stereo Taxa de Dados (se não compactado) Banda Frequência (em Hz)
Telefone 8 8 Mono 8 Kb/seg 200-3,4 K
Rádio AM 11,025 8 Mono 11Kb/seg
Rádio FM 22,050 16 Stereo 88.2 Kb/seg
CD 44.1 16,linear PCM Stereo 176.4 Kb/seg 20-20k
DAT 48 16 Stereo 192.0 Kb/seg 20-20K
Áudio DVD 192 24 Stereo 1152.0 Kb/seg 20-20K
80Digitalização de Imagens
- Pixels -- picture elements nas imagens digitais
- Resolução da Imagem número de pixels numa
imagem digital - (Uma resolução mais alta conduz a mior
qualidade da imagem.) - Bit-Map uma representação para os dados da
imagem/gráfico da mesma forma que é armazenada na
memória vídeo.
81Imagem Monocromática
- Cada pixel é armazenado como um único bit (0 ou
1) - Uma imagem monocromática de 640 x 480 pixels
requer 37.5 KB de armazenamento. - Dithering é usado muitas vezes para mostrar
imagens monocromáticas
82Imagens com níveis de cinzento
Cada pixel é armazenado normalmente num byte
(valor de 0 a 255) Uma imagem com níveis de
cinzento com 640 x 480 precisa de mais de 300 KB
para armazenamento.
83Imagens a cores
Cada pixel é representado com 3 bytes (e.g., RGB)
Suporta 256 x 256 x 256 cores possíveis
(16,777,216) para 24 bit res. Uma imagem a cores
640 x 480 24-bit precisa de 921.6 KB para
armazenamento
84Tipos de imagens
Monocromática
Cor 24 bits
Níveis de cinzento
- 1 Byte/pixel
- 256 níveis cinzento
- 640x480 imagem
- 307 KB
- 3 Bytes/pixel
- 16 Milhões cores
- 640x480 imagem
- 921 KB
- 1 Bit/pixel
- 2 (0,1) níveis
- 640x480 imagem
- 307 Kbit
85Medidas de Distorção da ImagemRelação
Sinal-Ruído e Erro Quadrático Médio
86Imagens em níveis de cinzento com nº diferentes
de bits/amostra