Question : Format de fichier WAV et AIFF : quelle est la différence ?

Quel est le meilleur pour l’audio ? Le Mp3 et le Mp4 ainsi que le FLAC et d’autres formats moins courants constituent une petite partie des fichiers audio qui existent aussi… mais quel est le meilleur WAV ou AIFF ?

Réponse : AIFF et WAV sont exactement la même qualité

WAV est surtout utilisé pour les PC et AIFF étant surtout utilisé pour MAC, mais l’un ou l’autre peut être lu sur pratiquement tous les types d’ordinateurs et d’appareils. Les deux utilisent le même type d’encodage qui résulte en une taille de fichier relativement grande, mais un maintien d’un son de meilleure qualité que le mp3 m4a ou d’autres fichiers plus petits.

Alors, quand devriez-vous utiliser WAV / AIFF et quand devriez-vous utiliser MP3 / M4A etc…

Lorsque vous êtes concerné par la vitesse et la petite taille du fichier, utilisez le mp3. Par exemple, sur internet, ou dans un courriel. Personne ne veut télécharger un fichier de 50mB pour écouter une chanson sur son téléphone, ou envoyer un morceau rapide à un ami. Si vous écoutez un morceau en streaming sur un site web ou sur YouTube, il est probable qu’il s’agisse d’un format de fichier avec perte similaire au mp3. En fait, le mp3 est juste un fichier vidéo, sans la partie vidéo.

Comment le sous-échantillonnage affecte la qualité audio

À des fins d’illustration, imaginez que l’image du haut est votre fichier audio de pleine qualité, et que le bas est votre mp3 sous-échantillonné. L’image du bas manque de clarté perçue et de profondeur de champ de l’image. C’est un concept visuel similaire à la façon dont les mp3 et autres formats avec perte sont capables d’obtenir une image assez proche du fichier original, mais il manque les données pour représenter pleinement la forme d’onde complète.

Image avant le sous-échantillonnage des données

Image après le sous-échantillonnage des données (compression des données avec perte)

Cette image montre comment une image sous-échantillonnée peut être de qualité inférieure à l’original pour gagner de l’espace. En général, l’apparence est à peu près la même, mais une inspection plus attentive montre une perte de détails. Tout comme un JPEG pixellisé, les fichiers audio qui ont subi une compression avec perte trop importante peuvent être ternes et donner l’impression de manquer de détails par rapport à un fichier WAV ou AIFF. L’image du haut représenterait un WAV ou AIFF, et l’image du bas représenterait un MP3 ou Mp4, bien que l’image ne soit pas une représentation réelle, mais pour illustrer comment la compression affecte la qualité.

Qu’est-ce qu’un fichier WAV et comment puis-je le lire ?

Presque tous les téléphones et ordinateurs (y compris les Mac et les utilisateurs de Windows) peuvent lire un fichier WAV. Généralement, le format AIFF peut être lu sur un produit Apple comme l’iphone ordinateur basé sur Mac OS, mais presque n’importe quel lecteur multimédia comme VLC ou iTunes peut lire les deux. Développés à l’origine par IBM et Microsoft, les fichiers Wave sont un format audio brut datant d’avant l’arrivée de l’internet. Bien qu’il soit très ancien, le format est très basique, et est essentiellement une fonction mathématique pour décrire une onde sonore.

Le WAV et l’AIFF utilisent la même méthode d’encodage!

L’AIFF et le WAV sont tous deux basés sur le même IFF* (Interchange File Format) L’AVI, l’ANI et le WAV utilisent tous le RIFF(Resource Interchange File Format) une saveur de l’IFF*, qui est basée sur des morceaux de données qui sont appelés chunks. Il y a le chunk de données principal, ainsi que le chunk de nom, le chunk d’artiste, le chunk de copyright, etc, où des données supplémentaires peuvent être ajoutées pour ces catégories. En outre, les fichiers WAV et AIFF peuvent avoir plusieurs canaux, tels que d’un seul canal mono, à deux canaux stéréo, 5.1 (six canaux), 8 canaux ou plus.

*David a noté « …, AIFF n’est pas dérivé de RIFF. AIFF et RIFF sont tous deux dérivés de IFF, publié par Electronic Arts en 1985. De plus, AIFF a précédé RIFF de 3 ans. Il ne peut pas être basé sur RIFF. Ils sont très similaires. »
*Merci pour la correction David ! Donc, AIFF est dérivé de IFF, WAV utilise RIFF qui est également dirrigé de IFF ( Merci pour la clarification !)

L’encodage WAV et AIFF expliqué plus en détail

AIFF et WAV sont tous deux des formats de fichiers sans perte, c’est-à-dire qu’il n’y a pas de perte de données. Le format de fichier diffère légèrement, mais les informations numériques sont stockées sous la forme d’une représentation mathématique exacte de la forme d’onde. Les formats WAV et AIFF utilisent tous deux la modulation par impulsions codées (MIC) pour coder les données de manière à minimiser la perte de qualité. Les formats WAV et AIFF sont tous deux de qualité CD ou « qualité studio », le CD étant de 16 bits et la « qualité studio » étant généralement de 24 bits ou plus. En règle générale, si vous enregistrez en 16 bits, rendez les fichiers en 16 bits. Si vous enregistrez en 24 bits, rendez vos mixages en 24 bits. Les fichiers peuvent toujours être sous-échantillonnés à un débit binaire inférieur. Par exemple, 24 bits peuvent facilement être sous-échantillonnés à 16, mais une fois que vous êtes à 16, revenir à 24 bits est plutôt inutile.

Puisque les fichiers WAV ou AIFF sont Lossless, ils peuvent prendre BEAUCOUP de S P A C E !

Les WAV et les AIFF peuvent être encodés avec des timestamps, des informations de tempo, et d’autres types d’informations comme des marqueurs. Pro Tools ou Logic peuvent créer des WAV ou des AIFF. Selon des « sources » Internet, la différence réside dans l’ordre des octets. Les AIFF étant optimisés pour le processeur motorola, et les fichiers WAV optimisés pour les microprocesseurs basés sur Intel, mais en réalité il n’y a pas de différence de performance.

Le monde passionnant de la modulation par code d’impulsion

La modulation par code d’impulsion est une façon mathématique de représenter numériquement des signaux analogiques. Elle est utilisée dans les appareils audio numériques. L’amplitude (autrement connue comme le niveau d’énergie ou l’intensité sonore d’un son) est mesurée en différents points. Le nombre de fois que l’amplitude est mesurée par seconde s’appelle la fréquence d’échantillonnage. Par exemple, une fréquence d’échantillonnage de 44,1k signifie que 44 100 échantillons par seconde sont capturés. Pour 96k, 96 000 fois par seconde, le son est mesuré.

Le débit binaire est le nombre de pas sur la « canne à mesurer » qui mesure l’amplitude. 16 bits et 24 bits sont les plus courants, mais l’idée générale est qu’un débit binaire plus élevé est plus précis. 24 bits a une gamme dynamique plus élevée que 16 bits , ou une mesure plus précise parce qu’il a 24 unités de données à mesurer, contre seulement 16 bits, qui a 6 étapes de moins sur l’échelle.

Bien que cela puisse être une légère simplification excessive, vous obtenez l’idée. Plus de bits, c’est mieux. Un taux d’échantillonnage plus élevé est plus exact.

Certains taux d’échantillonnage courants seraient :

  • 44,1 16 bits (qualité CD)
  • 48k 16 bits (qualité DVD-Vidéo)
  • 96k 24 bits qualité DVD-Audio (DVD-A)

En studio, 48k 24 bits ou 96k 24 bits sont souvent utilisés comme « qualité studio » et sont ensuite sous-échantillonnés plus tard. La plupart des gens ne veulent pas de fichiers WAV 96k. C’est tout simplement trop gros, et de toute façon, qui écoute « une qualité supérieure à celle du CD » de nos jours ? Peut-être les audiophiles et les gens de studio, mais beaucoup écoutent aussi des versions mp3 ou lossy. Il faut que vos chansons sonnent bien dans tous les formats, et se laisser entraîner dans toutes les versions différentes peut être un terrier dans lequel vous ne voulez pas descendre. Beaucoup de matériel génial a été enregistré à 44,1k, beaucoup de matériel terrible a été enregistré à 192k (ou même plus !) mais cela ne le fait pas sonner mieux dès le départ.

Analyse de qualité via le théorème d’échantillonnage de Nyqust- Shannon

Le théorème de Nyqust ou théorème d’échantillonnage de Shannon est une formule mathématique pour déterminer quelle est la fréquence maximale théorique que vous pouvez reproduire en utilisant différents taux d’échantillonnage. Le théorème de Nyquist stipule que les fréquences inférieures à la moitié de la fréquence d’échantillonnage en kilohertz peuvent être reconstruites. La gamme de l’audition humaine peut être estimée à 20hz-20khz. Donc, en utilisant cette formule, 44,1k devrait être capable de bien reproduire jusqu’à la limite de 20k (cela étant dit, 20k est à peine perceptible, et avec 2,5k à 5k s’enregistrant toujours dans les zones de « hauteur supérieure », 10k et 12k étant perçant, 20k n’est pas si utile d’une fréquence quand il s’agit de mixage audio).

Débat et conclusion

D’après mon expérience, le débit binaire (16 bits vs 24 bits) fait souvent plus de différence pour l’audio que le taux d’échantillonnage (par exemple 44,1k vs 48k)

Pour certains matériaux, 96k peut ou 192k peut sonner un peu mieux, mais la taille énorme du fichier n’en vaut pas la peine. Le matériel sera éventuellement sous-échantillonné en mp3, et il y a d’autres choses comme la mise en scène du gain final qui comptent plus. Vérifiez le gain de sortie de votre fichier avec un compteur et assurez-vous que vous n’écrasez pas, et que vous laissez un peu de marge pour les convertisseurs et le sous-échantillonnage.

Alors pourquoi utiliser 96k du tout ? En s’assurant que les fréquences jusqu’à 40k sont couvertes, nous avons une version très précise du son qui peut être utilisée pour mixer vers le bas à 44,1k ou quelque chose de plus raisonnable. La plupart des plugins peuvent utiliser du 96k, et la plupart des tests d’écoute montrent une différence de qualité entre 44.1k et 96k. 192k peut être utilisé ou même plus, mais cela pourrait être débattu dans la mesure où la qualité perceptible vs la taille du fichier. Essayez par vous-même.

Il y a littéralement des centaines de facteurs qui entrent dans le son de l’enregistrement. Le choix et le placement du microphone, les préamplis, la qualité du convertisseur et l’anticrénelage, l’horloge, ainsi que l’environnement physique jouent tous un rôle en apportant des changements beaucoup plus importants au son que 48k vs 96k ou 44,1 vs 48k. Donc, ne vous en faites pas trop.

So AIFF vs WAV ? Lequel est le meilleur ? Conclusion finale : il n’y a absolument aucune différence de qualité. Utilisez l’un ou l’autre. Je dirais que le WAV est légèrement plus courant.

.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.