 |
Explications
MP3 |
 |
C'est
quoi le MP3 ?
1.Introduction
2.Avantages
3.Fonctionnement
|
Introduction
(fournie
par MP3 France)
|
- Longtemps
plébiscité par les professionnels du son, le MP3 arrive
maintenant sur l'ordinateur de l'internaute branché.
- N'avez
vous jamais rêvé de faire des compilations de plus de
150 titres tenant sur un seul Cd ou bien de stocker
l'équivalent de 12 albums sur ce même Cd? Et bien c'est
possible grâce au format MP3.
- Le
MP3 (MPeg Audio Layer 3) est un format de fichier
son compressé obtenu par suppression de données. Il
est recommandé par le MPEG
(Moving Pictures Experts Group).
- Ce
format est proche du format utilisé par Sony avec ses
lecteurs/enregistreurs de MiniDisc. Contrairement au
DAT, le MP3, le MiniDisc et le DCC opèrent par suppression
de données. Saviez vous que vos radios préférées utilisent
ce format.? Tous vos tubes sont stockés sur un serveur.
La programmation des morceaux à passer à l'antenne se
fait sur ordinateur . Puis, l'ordinateur va chercher
les fichiers sons MP3 sur le serveur et une carte de
décompression (gain de rapidité) les transforme en fichiers
sons classiques de qualité CD qui seront transmis sur
les ondes. Où est le bon vieux temps où il fallait aller
chercher les disques vinyles a la cave?
- Le
codage Mpeg Layer-3 permet de diminuer d'environ
12 fois la taille d'un fichier audio habituel.
Le principal intérêt de ce format est d'atteindre un
taux de compression très important sans perte de
qualité sonore .
- Ceci
est obtenu par suppression de zones dans la bande passante
dont les fréquences sont inaudibles par l'oreille humaine.
L'oreille ne fait aucune différence entre le son original
d'un CD et le son de ce même CD après codage MP3.
- L'avantage
est donc le gain de taille. Avec une un ratio de compression
de 1:12, les fichiers deviennent de taille "humaine"
(4Mo pour 3 minutes de son ) et plus adaptés à des transferts
sur le Net. Prenons un exemple : avec un enregistrement
audio de 4 minutes en qualité CD (Stéréo, 44.1 KHz,
16 bits), on atteint facilement les 50 Mo pour le fichier
Wave. Après encodage MP3, le fichier ne dépassera pas
les 4 Mo sans dégradation sonore.
- La
lecture de tels fichiers se fait via l'intermédiaire
de softs
dédiés qui
permettent le décodage (décompression) de ceux-ci.
- Mais
pour en bénéficier, il faut cependant une configuration
suffisamment puissante (type Pentium) pour pouvoir effectuer
le décodage de ce type de fichier en temps réel .
- Que
signifie MPEG Audio Layer 3?
- MPEG
est un groupe de travail dans un sous comité de l' ISO
(International Standards Organisation) et de l'IEC (International
Electrotechnical Commission) qui génère des standards
pour les compressions audio et video.
- Les
algorithmes ne sont pas définis par MPEG. MPEG décrit
des méthodes pour tester les données compressées et
les décodeurs associés au standard. MPEG publie
aussi tous les rapports techniques.
- Le
format MP3 fait partie intégrante du format vidéo MPEG-1
(le format MPEG-1 était utilisé par les CDI Philips).
- MPEG-1
a presque complètement disparu aujourd'hui et remplacé
par le MPEG-2 (DVD). Le format audio MP3 est toujours
présent mais sous une forme améliorée. MPEG-3 et MPEG-4
seront les futurs standards le la télé haute définition.
- Le
format MP3 a été developpé par l'institut Fraunhofer
en Allemagne. Les premiers developpements ont commencé
en 1987 et les premiers logiciels exploitant uniquement
se format ont vu le jour il y a 3 ans.
- Il
y a trois sous couches de codage audio dans les formats
MPEG-1 et MPEG-2 --> Layer-1, Layer-2 et Layer-3.
- Est
ce que MPEG-3 est la même chose que Layer-3? : NON,
Layer-3 est uniquement la partie codage audio des standards
MPEG.
- De
Layer-1 à Layer-3, les méthodes de codage et les performances
(qualité / taille) augmentent. Layer-3 est la dernière
évolution du codage audio. Les trois couches Layer-1,2,3
gardent une compatibilité ascendante.
|
|
Avantages
(fournie
par MP3 France)
|
- Avant
compression les données audios digitales haute qualité
prennent énormément de place à stocker, voici pourquoi
: Essayez de stocker 1 minute de votre morceau favori
sur votre disque dur. En qualité CD stéréo, sa fréquence
est de 44,1 kHz en 16 bits. 44,1 kHz signifie que vous
avez 44100 données par seconde provenant de se fichier
(44100 bytes ou octets/s). Vous multipliez par 2 car
vous êtes sur 2 canaux et encore par 2 parce que le
fichier est codé sur 16 bits.
- Le
fichier aura une taille de :
44100 (octets /s) * 2 canaux * 2 (2 octets pour 16 bits)
* 60 (s/min) = 10 Mo
- Le
téléchargement dun tel fichier par Internet avec
un modem 28.8 prend environ 45 minutes !
- Prenons
un autre exemple : avec un enregistrement audio de 4
minutes en qualité CD (Stéréo, 44.1 KHz, 16 bits), on
atteint facilement les 50 Mo pour le fichier Wave. Âpres
compression MP3, le fichier ne dépassera pas les 4 Mo
sans dégradation sonore.
- La
compression digitale audio permet donc de minimiser
la taille de stockage de tels fichiers. Les nouvelles
techniques de codage audio (comme MPEG Layer 3) exploitent
les propriétés de loreille humaine (perception
du son) pour réduire dun facteur 12 cette taille
sans perte perceptible de qualité. Cette technique est
une clef dans divers domaines de linformatique
(stockage de bandes sons haute qualité sur CD-ROM pour
les applications multimédia ou transferts de tels sons
via Internet).
- Un
autre avantage de ce format est que le taux de compression
est paramètrable ainsi que diverses options de compression
(algorithmes adapté aux voix, à la musique ou corrélation
entre les canaux).
|
|
Fonctionnement
(fournie
par MP3 France)
|
- Il
y a souvent confusion entre les termes compression audio
et codage audio. Cette section vous donne un aperçu
du fonctionnement du codage audio.
- La
compression audio est constituée de 2 parties. La première
partie est le codage qui transforme les données reçues
(fichier WAVE) en données hautement compressées (appelé
bitstream) à l'aide d'un encodeur audio.
- Pour
lire ces formes de données compressées, il vous faut
un décodeur audio, c'est la seconde partie de la compression.
- A
l'écoute, les 2 fichiers seront plus ou moins identiques.
Je dis bien plus ou moins car cela dépend bien sûr du
taux de compression que vous avez appliqué. Plus ce
taux est faible, meilleure est la qualité des MP3 obtenue
et vice versa. Un taux de 1:12 représente un bon compromis.
- Ce
taux n'est pas mesurable, c'est pour cela que l'on parle
de bitrate de la compression. Le bitrate est
le nombre de bits qu'une seconde de données occupe dans
le fichier compressé. L'unité est le kBits/s. Pour trouver
le nombre d'octets, divisez simplement par 8.
- Voici
un tableau donnant le bitrate pour différentes qualités
audios:
|
Bitrate
|
Bande
passante
|
Qualité
|
|
8
kBps
|
2.5
kHz
|
Téléphone
|
|
16
kBps
|
4.5
kHz
|
Radio
ondes courtes
|
|
32
kBps
|
7.5
kHz
|
Radio
AM
|
|
64
kBps
|
11
kHz
|
Radio
FM
|
|
128
kBps
|
15
kHz
|
CD
|
- Codage
stéréo :
- Si
l'encodage se fait en stéréo, le bitrate est lié au
mode stéréo. Certains logiciels de compression permettent
de spécifier l'encodage stéréo à utiliser. Voici les
différents modes:
|
Bitrate
|
Stéréo
mode
|
|
8000-18000
|
Mono
|
|
18000-96000
|
MS/IS Stéréo
|
|
96000-192000
|
MS Stéréo
|
|
192000-256000
|
Stéréo
|
- Dual
channels (dual mono) :
Les canaux sont traités comme des entités indépendantes.
A utiliser si vous avez 2 canaux avec des voix différentes
par exemple.
- Stéréo
: Dans ce mode, l'encodeur
ne fait pas de corrélation entre les canaux. Néanmoins
il négocie la demande de bits des 2 canaux. Par exemple
en donnant à un canal plus de place si l'autre ne contient
que des silences.
- MS
Stéréo : Il y a une corrélation
entre les canaux ce qui augmente la qualité de compression.
Ce mode ne détruit pas les informations de phase (IS
stéréo) utilisées par le format DOLBY ProLogic. Pour
les signaux quasi-mono cela donne un gain de qualité.
- MS/IS Stéréo
: Dans ce mode, les hautes
fréquences sont décomposées en signal mono avec une
indication de direction. Ne pas utiliser ce mode avec
les signaux ProLogic (perte de l'info de phase) ni pour
des hautes qualités de codage.
- Les
4 étapes de la compression Audio :
- L'oreille
humaine permet de distinguer des sons dont les fréquences
sont comprises entre 100Hz et +ou- 16kHz. Elle est plus
sensible entre 2 et 4 kHz. La voix a une bande passante
comprise entre 500Hz et 2 kHz.
- Les
sons graves ont une majorité de basses fréquences et
les sons aiguës une majorité de fréquences élevées.
- La
courbe suivante vous donne le seuil de perception d'un
son par l'oreille en fonction de la fréquence de celui-ci.
- En
partant de 3kHz, on remarque que plus on monte en fréquence,
plus le volume (dB) doit être élevé et c'est la même
chose lorsque l'on descend en fréquences. (Pour entendre
un son de 14kHz, le volume doit être très élevé).
- Le
principe du masquage de fréquences :
- L'oreille
humaine est sensible à un large spectre de fréquences.
Mais, quand une grande quantité dénergie est présente
sur une fréquence (on parle de pic), l'oreille ne peut
pas distinguer de plus basses énergies présentes aux
fréquences voisines. On dit que les fortes énergies
masquent les petites. Ces fortes énergies sont appelées
les masqueurs.
- Sub
Band Coding :
- Le
principe de Sub Band Coding (SBC) dépend du principe
de masquage des fréquences.
- L'idée
est de sauvegarder la bande passante en supprimant les
informations des fréquences masquées. Le résultat ne
sera pas le même que le signal original (au point de
vue de la bande passante), mais si le calcul est bien
fait, l'oreille ne verra pas la différence.
- Voici
les 4 étapes de la compression audio :
- Décomposition
du signal source en sous-bandes (transformée de Fourier...).
- Le
modèle psychoacoustique étudie ces sous-bandes et détermine
les seuils de masquage en utilisant les informations
psychoacoustiques.
- Ces
seuils sont utilisés pour quantifier ces sous-bandes.
- L'étape
finale consiste à assembler ces sous-bandes en frames
pour que le décodeur puisse les utiliser.
|
|