La compression MPEG

About This Presentation

Title:

La compression MPEG

Description:

La compression par ondelettes R duction de la r solution de l image par d cimation S paration des d tails horizontaux, verticaux, ... – PowerPoint PPT presentation

Number of Views:134

Avg rating:3.0/5.0

Slides: 84

Provided by: quid150

Category:

more less

Transcript and Presenter's Notes

Title: La compression MPEG

1
La compression MPEG

A. Quidelleur
SRC2 Meaux 2008-2009
Culture Scientifique et Traitement de
lInformation
Numérisation des systèmes audio et vidéo

2
Plan

Rappels sur la vidéo numérique
Enjeux et principes de la compression vidéo
Principes de la compression des images basée sur
la DCT - Compression JPEG (rappels)
La compression MJPEG
La compression vidéo MPEG1 - 2
Etapes de la compression
Caractéristiques de MPEG1 et MPEG2
La compression audio MPEG1 - 2
La compression MPEG4

3
Rappels sur la vidéo numérique
4
Définition spatiale de la TV
Application Définition (lignes lignes affichables)
SDTV 720 pixels 576 lignes
HDTV 1920 pixels 1080 lignes

Entrelacement les images sont constituées de 2
trames, affichées successivement à lécran.

5
Les structures déchantillonnage

Exploitent la plus grande sensibilité de lœil à
la luminance quà la chrominance

Mesure de Y, Cr et Cb
Mesure de Y uniquement
6
Les autres formats
Format Structure de base Définition temporelle Définition spatiale (en pixels ? lignes affichables)
SIF 422 25 im/s 360288
CIF 422 29,97 im/s 360288
QCIF 422 29,97 im/s 180144
7
Profondeur de codage
Quantification de la luminance (TV num)
Diffusion 8 bits / échantillon
Production 10 bits / échantillon
Quantification de la chrominance (TV num)
8
Multiplexage du flux vidéo
9
Enjeux et principes de la compression vidéo
10
Enjeux

Occupation spectrale dun signal numérique gtgt
signal analogique ? problèmes pour
Le stockage
La transmission
Le temps de traitement
Ex. 1h vidéo non compressée 1Go, 1h TVHD non
compressée 800 Go
Or linformation numérique est représentée par
une succession de signes . Tous ces signes
sont-ils indispensables ?
La théorie de linformation tente dextraire les
signes pertinents de linformation et
dabandonner la redondance pour réduire le débit
ou la capacité de stockage dun signal.

11
Stratégie

Deux stratégies de réduction de débit
Sans perte linformation compressée est intègre
? données informatiques
Avec perte après compression, on ne peut
reconstituer intégralement linformation
originale ? suffisant pour laudio et la vidéo.
Meilleure réduction de volume en général.
La compression avec pertes fragilise
linformation transmise.
? La redondance peut servir à retrouver
linformation malgré les erreurs. Ex répétition
du même signe 10 fois ? 9 pertes de signes
tolérées.
Après compression, les échantillons successifs ne
sont plus liés, pas dinterpolation possible ?
Besoin un code correcteur derreurs.
Cependant, le gain obtenu par compression est
toujours supérieur à la redondance introduite par
le code correcteur derreurs.

12
Rapport de compression (ou taux de compression)

Noté ?1, ce qui signifie réduction dun facteur
?.

13
Application à laudio et la vidéo

Beaucoup de redondance dans les phénomènes
naturels (sons et images non synthétisés).
Vidéo son image
Dans une vidéo, où se trouve la redondance ?
Dans le son, redondance temporelle.
Dans limage, redondance
spatiale (deux pixels voisins sont généralement
assez semblables)
temporelle (peu de différence entre limage N et
limage N1)
fréquentielle lénergie dune image est
concentrée essentiellement dans les basses
fréquences, tandis que les hautes fréquences
participent peu au sens.

14
Application à laudio et la vidéo

Comment compresser une vidéo ?
En exploitant la redondance de limage TV
En utilisant des codages plus adaptés, utilisant
moins de bits
Où compresser ?
En environnement studio pour lenregistrement
et le stockage uniquement. Inutile pour les
liaisons entre équipements (dautant que
compressions avec perte/décompression successives
dégradent la qualité du signal).
En transmission et en diffusion.

15
Comment compresser une vidéo ?

Corrélation spatiale Dans une image, il y a
beaucoup de plages uniformes ? exploité par la
Transformée en Cosinus Discrète.
Corrélation temporelle Dune image à la
suivante, il y a peu de changements on transmet
uniquement la différence entre images ?
Compensation de mouvement.
Redondance subjective On tient compte de
lacuité visuelle. Les détails fins nont pas
besoin dêtre codés avec autant de précision que
les parties essentielles ? Quantification.
Redondance statistique Certains mots reviennent
plus fréquemment que dautres ? Codage
entropique.

16
Principes de la compression des images basée sur
la DCT Compression JPEG (rappels)
17
La compression JPEG

Voir matière Les images informatiques et leurs
traitements
JPEG (Joint Photographic Expert Group) est une
norme ISO de compression dimages fixes avec
pertes, standardisée en 1992.
JPEG prend en compte les failles du systèmes de
perception humaine, de manière à réduire la
quantité dinformation de limage qui sera codée.
Lalgorithme de compression repose sur
Une transformation mathématique de limage la
DCT (Discrete Cosine Transform)
Un codage à longueur variable le codage de
Huffman
Formats source
R, V, B en 444
Y, R-Y et B-Y en 422

18
La notion de fréquences dans une image

Une image peut présenter une fréquence spatiale
horizontale et une fréquence spatiale verticale.
Pour les signaux temporels, on utilise la
transformée de Fourier pour passer dans le
domaine des fréquences.
Pour les images, on peut, entre autres, passer
dans le domaine des fréquences par la Transformée
en Cosinus Discrète (TCD, ou DCT Discrete Cosin
Transform)

19
La Transformée en Cosinus Discrète dans la norme
JPEG

La DCT porte sur des blocs de 8?8 pixels.

Image INA Formation
20
La Transformée en Cosinus Discrète dans la norme
JPEG

La DCT fournit une représentation spectrale
bidimensionnelle ( H et V) du bloc.
Le bloc est décomposé en une combinaison linéaire
de fonctions images de base, de la même
manière que la transformée de Fourier décompose
un signal temporel en une somme de fonctions
sinus et cosinus.

DCT
64 coefficients transformés représentant les
différentes composantes fréquentielles présentes
dans le bloc 8?8
DCT-1
Bloc de 64 pixels représentant les échantillons
damplitude
21
La Transformée en Cosinus Discrète dans la norme
JPEG

Les fonctions de base de la DCT sont
représentées dans le tableau ci-dessous (ici pour
la composante de luminance si le format dentrée
est YCrCb).
Chaque coefficient de la DCT représente la
contribution de limage située à la même place
dans la matrice dans la construction de limage.

Exemple Un extrait de la matrice des
coefficients DCT dun bloc de pixel est le
suivant (0 dans toutes les autres cases)
2 1
3

Cela signifie quil faut superposer 2 images
I0,0, 1 image I1,0 et 3 images I1,0 pour créer le
bloc.
Fonctions de base
22
Calcul des coefficients DCT (à titre indicatif)

DCT
DCT-1

Où la fonction C() est définie par
23
Calcul des coefficients DCT un exemple simple

Pour lexemple, bloc de taille 4?4.
Calcul sur la luminance Y

Coefficients Y de luminance du bloc
Coefficients DCT correspondants
0
1
2
3
y
v
0
0
10 5 0 0
0 2 1 0
4 0 0 0
0 0 0 0

1
1
?
2
2
3
3
x
u
24
Calcul des coefficients DCT un exemple simple

Calcul du premier coefficient DCT

5,5
25
Calcul des coefficients DCT un exemple simple

En répétant la formule pour tous les coefficients
DCT, on obtient
En pratique, le calcul est toujours fait par
ordinateur ou par un circuit électronique dédié
!!!

v
0
1
2
3
0
5,5 5,38 1,5 -0,07
4,76 4,52 0,69 -0,84
2 2,50 1 -0,49
2,35 3,66 2,96 0,98
1
2
3
u
26
Propriétés de la DCT

On constate que les coefficients hautes
fréquences portent les informations de détails de
limage.
Ainsi, les blocs des zones homogènes dune image
ont des coefficients non négligeables en BF, et
négligeables en HF (exemple 1)
Seuls les blocs des zones très hétérogènes ont
des coefficients importants en HF (exemple 2)

Exemple 1
Exemple 2
27
Application à la compression

Puisque les hautes fréquences portent
linformation de détail de limage, on va
diminuer leur valeur, voire lannuler. Cest
lopération de quantification.
Limage va être dégradée, mais compte-tenu de
limperfection de lœil humain, cette dégradation
sera peu ou pas perceptible (tout dépendra de la
sévérité de la quantification).

Images INA Formation
28
La quantification

La norme JPEG fournit des tables, qui permettent
de retoucher la valeur des coefficients DCT de
manière à diminuer la valeur de ceux qui
contribuent le moins au sens de limage.
Les coefficients de haute fréquence sont les plus
réduits. Le rapport de compression dépend
directement de la table utilisée.

29
Quantification
Image INA Formation

Des tables de quantification sont définies pour
chaque composante (Y, Cr et Cb).
La quantification est moins sévère pour la
luminance car lœil y est plus sensible.

30
Illustration de leffet de la quantification
Images INA Formation
31
Illustration de leffet de la quantification
Images INA Formation
32
Illustration de leffet de la quantification
Conservation dun unique coefficient la
composante continue (DC)
Image INA Formation

A retenir Un codeur peut travailler
À taux de réduction constant (au détriment de la
qualité)
A qualité constante la performance du codeur en
matière de taux de réduction risque dêtre
médiocre.
Ne pas oublier que la nature de limage
intervient sur lefficacité de la compression !
Une image simple peut être de bonne qualité avec
un fort taux de réduction. Pour ce même taux, une
image complexe sera certainement de piètre
qualité

33
Le codage

Les coefficients de la DCT sont balayés en
zig-zag, des basses fréquences vers les hautes
fréquences.
Les suites de 0 sont transmises sous forme
condensée couple (nb de 0 précédant le
coeff non nul, coeff).
Dans lexemple 0 60 0 29 0 16 0 41 0 26 0 23 4
10 2 7 0 15
Puis codage à longueur variable les valeurs les
plus courantes sont codées par un mot court, les
valeur les plus rares sont codées par un code
long. (Principe du code Morse, ex. e . et
q --.-).
Cest le code de Huffman qui est employé

34
Pour résumer algorithme de compression JPEG

Décomposition en blocs de 8?8 pixels par
composante.
Passage du domaine spatial au domaine fréquentiel
par DCT.
Quantification et seuillage des coefficients DCT.
Balayage en zig-zag.
Codage entropique

35
Synoptiques fonctionnels dun codeur et dun
décodeur JPEG
36
La compression MJPEG
37
MJEPG

Moving JPEG (MJPEG) nest pas une norme !! Cest
un algorithme propriétaire, donc inadaptable dun
appareil à lautre.
MJPEG permet de compresser les images successives
dune vidéo comme si celles-ci étaient chacune
une photo.
Origine Le montage dimages compressées
dépendantes les unes des autres est difficile car
il y a rupture de la séquence. Les monteurs ont
appliqué la compression JPEG individuellement aux
photogrammes constituant une vidéo ? MJPEG .

38
Fonctionnalités dun codeur MJPEG

Afin de garder un débit constant, le signal est
stocké dans une mémoire tampon.
Lorsque la mémoire déborde (par exemple, car
images complexes donc DCT large) on
sous-quantifie les prochaines images en changeant
de table de quantification, voire on supprime
certaines images.
Les tables utilisées sont celles normalisées dans
MPEG.

39
La compression vidéo MPEG 1-2

Etapes de la compression
Spécificités des normes MPEG1 et MPEG2

40
Principe de la compression MPEG

La compression repose sur la transformation DCT
de limage, comme dans JPEG.
Lalgorithme part du principe que deux images
successives dans une vidéo se ressemblent ? on
peut alors transmettre uniquement les
informations qui ont changé entre les deux
images.
Ainsi, les images dune vidéo peuvent être codées
de deux manières
En intra cest-à-dire, comme une photographie
indépendante des autres images de la vidéo, selon
un algorithme identique à celui de JPEG.
En prédiction on ne transmet que les
différences (compressées) entre limage courante
et limage intra la précédant (ou la suivant).

41
La compression MPEG

Mesure de la différence entre deux images
successives
Image S1 codée en intra.
Calcul pour chaque bloc de 8?8 pixels lerreur ?
S2-S1. ? est une matrice de 8?8 valeurs.
Si les deux images se ressemblent, les
coefficients de la matrice sont proches.
Calcul de la DCT de la matrice ?.
Si les deux images se ressemblent, les
coefficients basse fréquence de la matrice ? sont
plus importants que les coefficients haute
fréquence.
Donc on peut les quantifier efficacement (i.e.
sans perdre trop dinformation).
Au lieu de transmettre limage S2, on transmet la
matrice des coefficients DCT de ? quantifiés, qui
est bien moins volumineuse.

42
La compression MPEG

Estimation du mouvement subi par les blocs
Compensation de mouvement
Si beaucoup de mouvement,
S2 est très différente de S1
Les coefficients de la matrice ? sont très
différentes
Les coefficients DCT haute fréquence de ? sont
non négligeables on ne peut pas les quantifier
sans dégradation importante.
? Le codeur va estimer le déplacement du bloc
dans limage.
Le codeur ouvre une fenêtre de recherche dans S1
autour du bloc de référence.
Il balaie la fenêtre et calcule ? pour chaque
bloc rencontré dans la fenêtre lerreur
(opération de block matching).
Le bloc de S1 qui minimise lerreur est retenu.
Le codeur transmet
Les coefficients DCT quantifiés de la matrice
derreur
Le vecteur de mouvement du bloc.

43
Illustration de la Forward Prediction
Image INA Formation
44
Illustration de la compensation de mouvement
En réalité, on ne transmet pas un vecteur de
mouvement pour chaque bloc, mais pour chaque
macro-bloc 4 blocs adjacents.
45
Les types dimages dune séquence codée en MPEG

Dans une même séquence vidéo, trois types de
codage des images
Image I en Intra
Image P (prédite, forward prediction ) par
rapport à une image passée
Image B (bidirectionnelle, forward prediction et
backward prediction) par rapport à une image
passée et une image future. Le codeur transmet la
moyenne des erreurs et transmet les 2 vecteurs.
Le codeur choisit le mode de prédiction le plus
rentable.
A lintérieur dune image P macroblocs I ou P.
A lintérieur dune image B macroblocs I, P ou
B.
En moyenne, pour un même contenu,
volume(P) volume(I) / 2
volume(B) volume(I) / 4
Mais dépend de lalgorithme utilisé par le
constructeur.

46
Le GOP

Le GOP (Group Of Picture) définit lenchaînement
des images I, P et B dans le flux vidéo.
Le GOP commence toujours par une image I.
On note GOP(M,N), où M est la distance entre deux
images P et N la distance entre deux images I.
Question Un monteur peut-il travailler sur des
vidéos dont les GOP sont représentés ci-dessous ?

47
Réarrangement du GOP

Si lenchaînement des images contient des images
B, le codage et décodage ne peuvent être
effectués dans lordre darrivée de la séquence
réarrangement préalable des images.

48
Synoptique du codeur MPEG
49
La compression vidéo MPEG 1-2

Etapes de la compression
Spécificités des normes MPEG1 et MPEG2

50
Paramètres des normes MPEG

Structure déchantillonnage
En théorie, un algorithme de compression MPEG
accepte nimporte quel format en entrée (422,
420, SIF, SDTV, HDTV, ).
La restriction se fait au niveau des profils
(recommandations) décrits dans les normes.

51
Paramètres des normes MPEG
Codage en mode image

Gestion de lentrelacement
Dans un signal vidéo entrelacé, on peut créer les
macroblocs en mode image ou en mode trame.
? Image avec mouvement Mode trame préférable
car les trames sont peu cohérentes entre elles
? Image sans mouvement Mode image plus efficace
car les trames sont fortement corrélées

Codage en mode trame
52
La norme MPEG1

Application lenregistrement
CD-ROM, disques optiques
VCD (magnétoscope numérique en Chine)
Utilisée par la TV numérique aux USA en attendant
la mise au point du MPEG2
Débit
Comprime des images animées son stéréo avec un
débit de 1.5Mbit/s
Format dentrée en général, format SIF
Performances réduites pour un signal entrelacé
(ex. signal TV)
MPEG1 définit
3 types dimages I, P, B
2 paramètres GOP(M, N)

53
La norme MPEG2

Le norme MPEG2 a été mise au point pour le
stockage et la diffusion de la vidéo numérique.
Cest la norme de compression utilisée dans la
télévision numérique terrestre (TNT ou DVB-T).
A amélioré MPEG1
En tenant compte de lentrelacement
En rajoutant des outils de gestion des erreurs de
transmission
Formats dentrée acceptés
422, 420, 444
EDTV, HDTV, futurs formats super HDTV
RVB et composantes
Formats informatiques
Balayage entrelacé ou progressif à lintérieur
dune même image, le codeur peut choisir de
traiter des blocs trame à trame ou en
désentrelacé.

54
La norme MPEG2

Sadapte à diverses qualités dimages en
télévision
2Mbit/s qualité comparable au VHS
3 à 5 Mbit/s qualité comparable au PAL
8 à 10 Mbit/s qualité comparable au 422
Définit
4 niveaux (définition des paramètres utilisés)
6 profils (applications dédiées)
3 types dimages I, P, B
2 paramètres M et N
La donnée dun couple profil/niveau garantit
linteropérabilité des équipements.

55
Profils et niveaux de la norme MPEG2
Difficulté technique croissante
CODEC bas coût
TV numérique
Studio
Qualité croissante
56
Scalabilité de la norme MPEG2

La qualité et la résolution sont adaptables au
mode de transmission vidéo. Entre autres
Scalabilité SNR (Signal to Noise Ratio)
Si le support de transmission est peu robuste, on
peut dégrader la qualité de la vidéo et augmenter
sa résistance au bruit (en gardant le même
débit).
Scalabilité spatiale
En attendant la migration des postes de TV de la
SDTV à la HDTV, transmission simultanée des 2
qualités
? MPEG2 exploite la redondance entre le signal
basse définition et le signal haute définition
pour réduire la quantité dinformation transmise.

57
Application La chaîne de diffusion de la
télévision numérique
58
La compression audio MPEG1 - 2

Propriétés psycho-acoustiques exploitables pour
la compression
Les compressions audio MPEG 1 et 2

59
Le codage perceptuel

Comme la compression vidéo MPEG utilise les
failles de la vision humaine, la compression
audio MPEG exploite les propriétés de laudition
humaine.
Compression de limage ne coder que
linformation indispensable, dans la mesure où
lœil est un capteur imparfait.
? Compression du son ne coder que
linformation indispensable, dans la mesure où
loreille est un capteur imparfait.

60
Courbe de sensibilité de loreille humaine

A une fréquence donnée, notre oreille ne peut
percevoir un son quà condition que son niveau de
pression acoustique soit supérieur à un seuil. Le
seuil est différent pour chaque fréquence de la
bande audible.

Courbe de sensibilité de loreille dans un
environnement calme

seuil
61
Le masquage fréquentiel

Sous leffet dune excitation, le seuil
daudibilité minimum est amplifié au voisinage de
la fréquence du son.
Par conséquence, un autre son de fréquence
proche, émis en même temps, peut être inaudible.

80
Pression acoustique (dB)
60
Son masqueur
40
Son masqué
20
Seuil en environnement calme
Déformation de la courbe seuil de masquage
0
f(Hz)
20
200
2000
20000
1000
5000
500
100
50
10000
62
Exploitation du masquage en fréquence pour la
compression

On ne code pas les sons masqués (inaudibles)
On adapte la profondeur de codage nombre de
bits minimal pour que N lt seuil daudibilité.

63
Exploitation du masquage fréquentiel par les
normes MPEG1 et 2

Le spectre audible est divisé en 32 sous-bandes.
Pour chaque sous-bande, on détermine la fréquence
dominante et on en déduit la nouvelle courbe de
seuil daudibilité (à laide de modèles
psycho-acoustiques).
Ces modèles sont sauvegardés dans la ROM des
codeurs.
Dans chaque sous-bande, le codeur choisit le pas
de quantification adapté au niveau du seuil
daudibilité.
Le flux numérique contient les valeurs du pas de
quantification de chaque sous-bande pour que le
décodage soit possible.

64
Le masquage temporel

Loreille nentend pas un son sil est produit
dans un court délai avant ou après un son de même
fréquence de plus grande amplitude.
? On ne code pas les sons masqués temporellement.

65
Le masquage de canal

Loreille humaine est incapable de détecter la
provenance dun son sil a une fréquence trop
basse.
? Coder en mono les sons basse fréquence.

66
La compression audio MPEG

Propriétés psycho-acoustiques exploitables pour
la compression
Les compressions audio MPEG 1 et 2

67
La compression audio MPEG1

Fréquences déchantillonnage 32 à 48 kHz
Débits 32 à 384 kbit/s
Trois niveaux (layers) sont définis

Niveau Technique Utilisation - Performances
Niveau 1 Masquage fréquentiel Qualité CD
Niveau 2 Masquage fréquentiel Masquage temporel Qualité CD Utilisé dans le DVB-S
Niveau 3 Masquage fréquentiel avec largeur des sous-bandes adaptée Masquage temporel Codage entropique Exploitation de la cohérence entre les voies stéréo MP3
68
La compression audio MPEG2

Fréquences déchantillonnage 16 à 48 kHz
Débits 8 à 384 kbit/s
Elle reprend lessentiel de la norme MPEG1 audio.
Gère les signaux multicanaux jusquà 5 voies

69
La compression MPEG4

Lapproche objet
Le codage de la vidéo
Lintégration de la 3D
Le codage des images de synthèse
La norme MPEG4 audio
La description de scène
Profils et niveaux

70
Lapproche objet

Nouveauté majeure découpe des scènes en
objets
Intérêt MPEG4 se veut une norme de compression
pour les applications multimédia,
supportée sur nimporte quel type de support (?
émergence récente de la mobilité)
et gérant linteractivité (possibilité de
modifier la composition dune scène et les objets
dans le flux numérique sans avoir à les décoder)

71
Codage de la vidéo le plan alpha

Un objet est décrit par
Ses composantes Y, Cr, Cb codées comme en MPEG
1 et 2 (sauf images fixes, cf. supra)
Un plan alpha
Codé en binaire 1 à lintérieur de lobjet, 0
ailleurs
Ou codé sur 8 bits définit en plus des niveaux
de transparence

72
Codage de la vidéo le plan alpha

Codage dun plan alpha binaire technique du
codage de contour
Lobjet est découpé en blocs 16?16 pixels
Plusieurs (7) types de BAB (Bloc Alpha Binaire)
sont définis par la norme, en fonction du
mouvement et de la déformation subis dans la
scène
Le codage de chaque type de BAB est défini par la
norme Intra, ou Inter avec compensation de
mouvement
Chaque bloc de lobjet est donc codé suivant son
BAB
Codage dun plan alpha sur 8 bits
Composante binaire par technique de codage de
contour
Les niveau de gris des blocs intérieurs (
niveaux de transparence) sont ensuite codés par
DCT.

73
Codage dune vidéo les sprites

Sprite une grande image composée de tous les
pixels dun objet donné visibles à un moment ou
un autre de la séquence
Ex. un sprite dobjet fond une vue
panoramique dun paysage sans les personnages
passant au premier plan
Cest une image fixe elle est codée par DCT en
Intra et émise au début du flux MPEG.
Intérêt
Economie de bits
Manipulations intéressantes sur la vidéo

74
Lintégration de la 3D

Pour habillage des structures 3D par des images
naturelles (fixes), MPEG4 utilise la technique de
compression par ondelettes, plus efficace que la
DCT.
La compression par ondelettes consiste en une
analyse multi-résolution de limage.

75
La compression par ondelettes

Réduction de la résolution de limage par
décimation
Séparation des détails horizontaux, verticaux, et
bidimensionnels par filtrage

Image originale décimée (smooth) 1 point sur 4
Transformée par ondelettes
Hautes fréquences horizontales
Hautes fréquences verticales
Hautes fréquences bidimensionnelles
Image originale
4 petites images (dimension/2) Les 3 images de
détail contiennent les informations perdues par
la décimation
A ce niveau, pas de pertes
76
La compression par ondelettes

On peut réitérer lopération sur limage décimée
(smooth) plusieurs fois analyse
multicouches .
Limage smooth est plus petite à chaque couche
moins dinformations à coder
On peut quantifier les images de détails et leur
appliquer un codage entropique.

Intérêt pour la 3D le multicouche permet
dadapter le rendu des détails à la distance de
visualisation (position de lutilisateur dans
lenvironnement 3D).

77
Le codage des images de synthèse

La norme inclut des algorithmes permettant la
description des visage et leur animation.
Elle permet aussi la construction dobjets par
treillis actifs
Les objets sont décrits par un treillis
triangulaire
Le décodeur calcule lévolution de la texture
dune scène à lautre pour chaque triangle par
interpolation

Un treillis
78
La norme MPEG4 audio

Codage des sons naturels
Débits de 2 à 64 kbit/s
La norme na pas pu proposer 1 seul algorithme
pour tous les types de sons (musique, parole,
etc. )
? Elle inclut plusieurs standards de codage,
adapté à chaque type de signal sonore
Les algorithmes proposés dans la norme MPEG2
audio sont notamment repris.
Synthèse de sons la norme inclut plusieurs
algorithmes de génération de sons (pluie, bruits
de pas, instruments de musique).

79
Description de scènes

Les scènes sont organisées sous forme dune
structure hiérarchique dobjets.
La norme inclut un standard de description de la
scène en flux binaire BIFS (Binary Format for
Scene Description).
Elle permet lutilisation du VRML (langage de
modélisation de la réalité virtuelle) pour
permettre linterface de la 3D et de la vidéo.

80
Description de scène un exemple
81
Profils et niveaux MPEG4

5 profils
Profils visuels codage visuel des données
naturelles, synthétiques ou hybrides
Profils audio nombre doutils implémentés et le
débit visé
Profils graphiques éléments graphiques et
textuels utilisables dans une scène
Profils de descripteurs de scène types
dinformations pouvant constituer une scène MPEG4
(audio, 2D, 3D)
Profils de descripteurs dobjets outils
disponibles pour décrire un objet (descripteur
dobjet, synchronisation, information sur le
contenu des objets)

82
Profils et niveaux MPEG4
83
Bibliographie

Compression Numérique JPEG, DV, MPEG ,
support de cours, INA Formation, mars 2003
Compression MPEG-1 à MPEG-4 , E. Fert, S.
Jeannin, Techniques de lIngénieur - Traité
Télécommunications
Compression des images nouveaux besoins,
nouvelles technologies , support de cours, J.
Weiss, Supelec, 2000

Write a Comment

User Comments (0)