- Vraag: WAV en AIFF bestandsformaat: wat is het verschil?
- Antwoord: AIFF en WAV zijn precies dezelfde kwaliteit
- Dus wanneer moet je WAV / AIFF gebruiken en wanneer moet je MP3 / M4A etc?
- How Downsampling Affects Audio Quality
- Wat is een WAV-bestand en hoe kan ik het afspelen?
- Zowel WAV als AIFF gebruiken dezelfde coderingsmethode!
- WAV en AIFF codering nader toegelicht
- Omdat WAV of AIFF bestanden Lossless zijn, kunnen ze veel S P A C E !
- De spannende wereld van Pulse Code Modulation
- Enkele gangbare sample rates zouden zijn:
- Kwaliteitsanalyse via Nyqust- Shannon Sampling Theorem
- Debat en Conclusie
- Zo AIFF vs WAV? Wat is beter? Eindconclusie: er is absoluut geen verschil in kwaliteit. Gebruik ze allebei. Ik zou zeggen dat WAV iets gangbaarder is.
Vraag: WAV en AIFF bestandsformaat: wat is het verschil?
Welke is het beste voor audio? Mp3 en Mp4 evenals FLAC en andere minder gebruikelijke formaten maken een klein deel van de audio-bestanden die er ook … maar Wat is het beste WAV of AIFF?
Antwoord: AIFF en WAV zijn precies dezelfde kwaliteit
WAV wordt meestal gebruikt voor pc’s en AIFF wordt meestal gebruikt voor MAC, maar beide kunnen worden afgespeeld op vrijwel alle soorten computers en apparaten. Beide gebruiken hetzelfde type codering dat resulteert in een relatief grote bestandsgrootte, maar een behoud van een hogere geluidskwaliteit dan mp3 m4a of andere kleinere bestanden.
Dus wanneer moet je WAV / AIFF gebruiken en wanneer moet je MP3 / M4A etc?
Wanneer u bezorgd bent over snelheid en kleine bestandsgrootte, gebruikt u mp3. Bijvoorbeeld op het internet, of in een e-mail. Niemand wil een bestand van 50 MB downloaden om een liedje op zijn telefoon te beluisteren, of een snel deuntje naar een vriend te sturen. Als je streamt op een website, of op youtube, dan is dat waarschijnlijk een lossy bestandsformaat vergelijkbaar met mp3. In feite is mp3 gewoon een videobestand, zonder het videogedeelte.
How Downsampling Affects Audio Quality
Voor illustratieve doeleinden, stel je voor dat de bovenste afbeelding je audiobestand van volledige kwaliteit is, en de onderste is je gedownsamplede mp3. Het onderste beeld mist de waargenomen helderheid en scherptediepte van het beeld. Dit is een soortgelijk visueel concept als hoe mp3’s en andere verlieslatende formaten in staat zijn om het originele bestand vrij dicht te benaderen, maar de gegevens missen om de volledige golfvorm volledig weer te geven.
Beeld vóór downsampling van gegevens
Beeld na downsampling van gegevens (Lossy Data Compression)
Deze afbeelding laat zien hoe een gedownsampled beeld van lagere kwaliteit kan zijn dan het origineel om ruimte te besparen. In het algemeen ziet het er ongeveer hetzelfde uit, maar nadere inspectie toont verlies van detail. Net zoals een gepixelde JPEG, kunnen audiobestanden die te veel lossy compressie hebben, flets zijn, en klinken alsof ze de details missen van een WAV of AIFF bestand. De bovenste afbeelding zou een WAV of AIFF vertegenwoordigen, en de onderste afbeelding zou een MP3 of Mp4 vertegenwoordigen, hoewel de afbeelding geen werkelijke weergave is, maar om te illustreren hoe compressie de kwaliteit beïnvloedt.
Wat is een WAV-bestand en hoe kan ik het afspelen?
Alle telefoons en computers (inclusief Macs en Windows-gebruikers) kunnen een WAV-bestand afspelen. Over het algemeen kan AIFF worden afgespeeld op een Apple-product zoals de Mac OS-gebaseerde iPhone-computer, maar bijna elke mediaspeler zoals VLC of iTunes zal beide afspelen. Wave-bestanden zijn oorspronkelijk ontwikkeld door IBM en Microsoft, en zijn een ruw audioformaat van voordat mensen het internet hadden. Hoewel het zeer oud is, is het formaat zeer eenvoudig, en is in wezen een wiskundige functie voor het beschrijven van een geluidsgolf.
Zowel WAV als AIFF gebruiken dezelfde coderingsmethode!
Zowel AIFF als WAV zijn gebaseerd op hetzelfde IFF* (Interchange File Format) AVI, ANI, en WAV gebruiken allemaal RIFF(Resource Interchange File Format) een smaak van IFF*, die is gebaseerd op stukjes gegevens die worden aangeduid als chunks. Er is de hoofddatabunker, maar ook de naambunker, artiestbunker, auteursrechtbunker, enz., waaraan extra gegevens kunnen worden toegevoegd voor die categorieën. Bovendien kunnen WAV- en AIFF-bestanden meerdere kanalen hebben, van slechts één monokanaal, tot twee stereokanalen, 5.1 (zes kanalen), 8 kanalen of meer.
*David merkte op “…, AIFF is niet afgeleid van RIFF. Zowel AIFF als RIFF zijn afgeleid van IFF, uitgebracht door Electronic Arts in 1985. Bovendien was AIFF 3 jaar eerder dan RIFF. Het kan niet gebaseerd zijn op RIFF. Ze lijken erg op elkaar.”
*Dank voor de correctie David! Dus, AIFF is afgeleid van IFF, WAV gebruikt RIFF dat ook is afgeleid van IFF ( Bedankt voor de verduidelijking!)
WAV en AIFF codering nader toegelicht
Zowel AIFF als WAV zijn lossless bestandsformaten, met andere woorden, er is geen verlies van data. Het bestandsformaat verschilt enigszins, maar de digitale informatie wordt opgeslagen als een exacte wiskundige weergave van de golfvorm. WAV en AIFF gebruiken beide PCM (Pulse Code Modulation) om de gegevens te coderen op een manier die het kwaliteitsverlies minimaliseert. WAV of AIFF zijn beide CD-kwaliteit of “studiokwaliteit”, waarbij CD 16 bit is en “studiokwaliteit” meestal 24 bit of hoger. De algemene vuistregel is: als u opneemt in 16 bit, render de bestanden dan in 16 bit. Als je opneemt in 24 bit, render je de mixen in 24 bit. Bestanden kunnen altijd gedownsampled worden naar een lagere bitrate. Bijvoorbeeld 24 bit kan gemakkelijk worden gedownsampled naar 16 bit, maar als je eenmaal op 16 bit zit, is teruggaan naar 24 bit vrij zinloos.
Omdat WAV of AIFF bestanden Lossless zijn, kunnen ze veel S P A C E !
Zowel WAV als AIFF kunnen worden gecodeerd met timestamps, tempo informatie, en andere soorten informatie zoals markers. Pro Tools of Logic kunnen WAV of AIFF’s maken. Volgens internet “bronnen” is het verschil de byte volgorde. AIFF is geoptimaliseerd voor een Motorola processor, en WAV bestanden zijn geoptimaliseerd voor Intel gebaseerde microprocessoren, maar eigenlijk is er geen verschil in prestatie.
De spannende wereld van Pulse Code Modulation
Pulse code modulation is een mathematische manier om analoge signalen digitaal weer te geven. Het wordt gebruikt in digitale audioapparatuur. De amplitude (ook bekend als het energieniveau of de luidheid van een geluid) wordt op verschillende punten gemeten. Het aantal malen dat de amplitude per seconde wordt gemeten, wordt de bemonsteringsfrequentie genoemd. Bijvoorbeeld, 44.1k sample rate, betekent dat 44.100 samples per seconde worden vastgelegd. Bij 96k wordt 96.000 keer per seconde het geluid gemeten.
Bit rate is het aantal stappen op het ‘meetstokje’ dat de amplitude meet. 16 bit en 24 bit zijn het meest gangbaar, maar het algemene idee is dat een hogere bitsnelheid nauwkeuriger is. 24 bits heeft een groter dynamisch bereik dan 16 bits, of nauwkeuriger meting omdat het 24 eenheden van gegevens om te meten, tegenover slechts 16 bits, die 6 minder stappen op de schaal heeft.
Hoewel dit een lichte oversimplificatie kan zijn, krijg je het idee. Meer bits is beter. Een hogere sample rate is preciezer.
Enkele gangbare sample rates zouden zijn:
- 44.1 16 Bit (CD Kwaliteit)
- 48k 16bit (DVD-Video Kwaliteit)
- 96k 24 bit DVD-Audio Kwaliteit (DVD-A)
In de studio wordt vaak 48k 24bit of 96k 24bit gebruikt als “studio kwaliteit” en dan later gedownsampled. De meeste mensen willen geen 96k WAV bestanden. Het is gewoon te groot, en wie luistert er tegenwoordig nog naar “beter dan CD kwaliteit”. Misschien audiofielen en studiomensen, maar velen luisteren ook naar mp3 of lossy versies. Je moet je nummers in alle formaten goed laten klinken, en verstrikt raken in al die verschillende versies kan een konijnenhol zijn waar je niet in wilt gaan. Veel goed materiaal is opgenomen op 44.1k, veel verschrikkelijk materiaal is opgenomen op 192k (of zelfs hoger!) maar het klinkt niet beter vanaf het begin.
Kwaliteitsanalyse via Nyqust- Shannon Sampling Theorem
Nyqust Theorem of Shannon Sampling theorem is een wiskundige formule voor het bepalen van wat de theoretische maximale frequentie is die je kunt reproduceren met behulp van verschillende sample rates. Het nyquist theorema stelt dat frequenties beneden de helft van de bemonsteringsfrequentie in kilohertz kunnen worden gereconstrueerd. Het bereik van het menselijk gehoor kan worden geschat op 20hz-20khz. Dus met die formule zou 44.1k in staat moeten zijn om tot de 20k grens goed te reproduceren (dat gezegd hebbende, 20k is nauwelijks waarneembaar, en met 2.5k tot 5k nog steeds registraties in de “hogere toonhoogte” gebieden, 10k en 12k die doordringend hoog zijn, is 20k niet zo’n nuttige frequentie als het gaat om het mixen van audio).
Debat en Conclusie
In mijn ervaring maakt de bit rate (16 bit vs 24 bit) vaak meer verschil voor de audio dan de sample rate (b.v. 44.1k vs 48k)
Voor bepaald materiaal kan 96k of 192k wel wat beter klinken, maar de enorme bestandsgrootte is het niet waard. Materiaal zal uiteindelijk gedownsampled worden naar mp3, en er zijn andere dingen zoals finale gain staging die er meer toe doen. Controleer de gain van de output van je bestand met een meter en zorg ervoor dat je niet clipt, en een beetje headroom overlaat voor de converters en downsampling.
Waarom dan 96k gebruiken? Door ervoor te zorgen dat frequenties tot 40k worden gedekt, hebben we een zeer nauwkeurige versie van het geluid die kan worden gebruikt om te mixen naar 44.1k of iets redelijker. De meeste plugins kunnen 96k gebruiken, en de meeste luistertests laten kwaliteitsverschillen horen tussen 44.1k en 96k. 192k kan worden gebruikt of zelfs hoger, maar dat kan worden betwist voor wat betreft waarneembare kwaliteit versus bestandsgrootte. Probeer het zelf maar eens uit.
Er zijn letterlijk honderden factoren die een rol spelen bij het geluid van een opname. Microfoon keuze en plaatsing, voorversterkers, converter kwaliteit en anti-aliasing, klokken, evenals fysieke omgeving spelen allemaal een rol die veel grotere veranderingen in het geluid dan 48k vs 96k of 44.1 vs 48k. Maak u dus niet al te druk.