- Spørgsmål: WAV- og AIFF-filformat: Hvad er forskellen?
- Svar: Hvad er bedst WAV eller AIFF? AIFF og WAV er nøjagtig samme kvalitet
- Så hvornår skal du bruge WAV / AIFF og hvornår skal du bruge MP3 / M4A osv?
- Hvordan downsampling påvirker lydkvaliteten
- Hvad er en WAV-fil, og hvordan afspiller jeg den?
- Både WAV og AIFF bruger den samme kodningsmetode!
- WAV og AIFF Encoding Explained Further
- Da WAV- eller AIFF-filer er Lossless-filer, kan de fylde MEGET S P A C E !
- Den spændende verden af Pulse Code Modulation
- Nogle almindelige samplingfrekvenser ville være:
- Kvalitetsanalyse via Nyqust- Shannon Sampling Theorem
- Debat og konklusion
- Så AIFF vs WAV? Hvilket er bedst? Endelig konklusion: Der er absolut ingen forskel på kvaliteten. Brug enten. Jeg vil sige, at WAV er lidt mere almindeligt.
Spørgsmål: WAV- og AIFF-filformat: Hvad er forskellen?
Hvilket er bedst til lyd? Mp3 og Mp4 samt FLAC og andre mindre almindelige formater udgør også en lille del af de lydfiler derude… men Hvad er bedst WAV eller AIFF?
Svar: Hvad er bedst WAV eller AIFF? AIFF og WAV er nøjagtig samme kvalitet
WAV bruges mest til pc’er og AIFF bliver mest brugt til MAC, men begge dele kan afspilles på stort set alle typer computere og enheder. Begge bruger den samme type kodning, der resulterer i en relativt stor filstørrelse, men en opretholdelse af en højere lydkvalitet end mp3 m4a eller andre mindre filer.
Så hvornår skal du bruge WAV / AIFF og hvornår skal du bruge MP3 / M4A osv?
Når du er optaget af hastighed og lille filstørrelse, skal du bruge mp3. For eksempel på internettet eller i en e-mail. Ingen ønsker at downloade en fil på 50mB for at lytte til en sang på deres telefon eller sende en hurtig melodi til en ven. Hvis du streamer på et websted eller youtube, streamer du sandsynligvis et filformat med tabsgivende filer, der ligner mp3. Faktisk er mp3 bare en videofil, uden videodelen.
Hvordan downsampling påvirker lydkvaliteten
Til illustration forestiller du dig, at det øverste billede er din lydfil i fuld kvalitet, og det nederste er din downsamplede mp3. Det nederste billede mangler den opfattede klarhed og dybdeskarphed i billedet. Dette er et lignende visuelt koncept som den måde, mp3’er og andre tabsgivende formater er i stand til at få et ret tæt på den originale fil, men mangler dataene til fuldt ud at repræsentere den fulde bølgeform.
Billede før downsampling af data
Billede efter downsampling af data (Lossy Data Compression)
Dette billede viser, hvordan et downsamplet billede kan være af lavere kvalitet end det originale for at spare plads. Generelt ser det nogenlunde det samme ud, men en nærmere undersøgelse viser tab af detaljer. Ligesom et pixeleret JPEG kan lydfiler, der har for meget tabsgivende komprimering, være glansløse og lyde som om, de mangler detaljerne i en WAV- eller AIFF-fil. Det øverste billede ville repræsentere en WAV- eller AIFF-fil, og det nederste billede ville repræsentere en MP3- eller Mp4-fil, selv om billedet ikke er en egentlig repræsentation, men for at illustrere, hvordan komprimering påvirker kvaliteten.
Hvad er en WAV-fil, og hvordan afspiller jeg den?
Næsten alle telefoner og computere (herunder Mac- og Windows-brugere) kan afspille en WAV-fil. Generelt kan AIFF afspilles på et Apple-produkt som iphone Mac OS-baseret computer, men næsten enhver medieafspiller som VLC eller iTunes kan afspille begge dele. Wave-filer, der oprindeligt blev udviklet af IBM og Microsoft, er et rå lydformat fra før folk havde internettet. Selv om det er meget gammelt, er formatet meget grundlæggende og er i det væsentlige en matematisk funktion til at beskrive en lydbølge.
Både WAV og AIFF bruger den samme kodningsmetode!
Både AIFF og WAV er baseret på det samme IFF* (Interchange File Format) AVI, ANI og WAV bruger alle RIFF(Resource Interchange File Format) en variant af IFF*, som er baseret på stykker af data, der kaldes chunks. Der er en hoveddataklump samt en navneklump, en kunstnerklump, en copyright-klump osv., hvor der kan tilføjes yderligere data for disse kategorier. Desuden kan WAV- og AIFF-filer have flere kanaler, f.eks. fra blot én monokanal, til to stereokanaler, 5.1 (seks kanaler), 8 kanaler eller mere.
*David bemærkede “…, AIFF er ikke afledt af RIFF. Både AIFF og RIFF er afledt af IFF, der blev udgivet af Electronic Arts i 1985. Desuden gik AIFF 3 år forud for RIFF. Det kan ikke være baseret på RIFF. De ligner hinanden meget.”
*Tak for rettelsen, David! Så AIFF er afledt af IFF, WAV bruger RIFF, som også er afledt af IFF ( Tak for opklaringen!)
WAV og AIFF Encoding Explained Further
Både AIFF og WAV er tabsfrie filformater, med andre ord, der er intet tab af data. Filformatet er lidt forskelligt, men den digitale information gemmes som en nøjagtig matematisk repræsentation af bølgeformen. WAV og AIFF bruger begge PCM (Pulse Code Modulation) til at kode dataene på en sådan måde, at tab af kvalitet minimeres. WAV og AIFF er begge af CD-kvalitet eller “studiekvalitet”, hvor CD er 16 bit og normalt er “studiekvalitet” 24 bit eller højere. Den generelle tommelfingerregel er, at hvis du optager med 16 bit, skal du rendere filerne med 16 bit. Hvis du optager med 24 bit, skal du rendere dine mixes med 24 bit. Filer kan altid downsamples til en lavere bitrate. For eksempel kan 24 bit nemt downsamples til 16, men når du først er på 16, er det temmelig nytteløst at gå tilbage til 24 bit.
Da WAV- eller AIFF-filer er Lossless-filer, kan de fylde MEGET S P A C E !
Både WAV og AIFF kan være kodet med timestamps, tempooplysninger og andre typer oplysninger som f.eks. markører. Pro Tools eller Logic kan oprette WAV- eller AIFF-filer. Ifølge internet-“kilder” er forskellen byte-rækkefølgen. Med AIFF er optimeret til motorola-processor, og WAV-filer optimeret til Intel-baserede mikroprocessorer, men reelt er der ingen forskel i ydeevne.
Den spændende verden af Pulse Code Modulation
Pulskodemodulation er en matematisk måde at repræsentere analoge signaler digitalt på. Den anvendes i digitale lydenheder. Amplituden (også kendt som energiniveauet eller lydstyrken af en lyd) måles på forskellige punkter. Antallet af gange, amplituden måles i sekundet, kaldes samplefrekvensen. F.eks. betyder 44,1k sample rate, at der optages 44 100 samples pr. sekund. For 96k betyder det, at lyden måles 96.000 gange i sekundet.
Bitfrekvens er antallet af trin på den “målepind”, der måler amplituden. 16 bit og 24 bit er de mest almindelige, men den generelle idé er, at en højere bitrate er mere præcis. 24 bit har et højere dynamisk område end 16 bit , eller en mere præcis måling, fordi der er 24 dataenheder at måle, i forhold til kun 16 bit, som har 6 trin mindre på skalaen.
Selv om dette måske er en let overforenkling, får du ideen. Flere Bits er bedre. En højere samplingfrekvens er mere præcis.
Nogle almindelige samplingfrekvenser ville være:
- 44.1 16 Bit (CD-kvalitet)
- 48k 16bit (DVD-videokvalitet)
- 96k 24 bit DVD-Audio Quality (DVD-A)
I studiet bruges 48k 24bit eller 96k 24bit ofte som “studiekvalitet” og downsamples så senere. De fleste mennesker ønsker ikke 96k WAV-filer. Det er bare for stort, og hvem lytter alligevel til “bedre end cd-kvalitet” i dag. Måske audiofile og studiefolk, men mange lytter også til mp3- eller lossy-versioner. Du skal have dine sange til at lyde godt i alle formater, og at blive fanget i alle de forskellige versioner kan være et kaninhul, som du ikke ønsker at gå ned i. Masser af godt materiale er blevet indspillet ved 44,1k, masser af forfærdeligt materiale er blevet indspillet ved 192k (eller endnu højere!), men det får det ikke til at lyde bedre, hvis det ikke er godt fra starten.
Kvalitetsanalyse via Nyqust- Shannon Sampling Theorem
Nyqust Theorem eller Shannon Sampling Theorem er en matematisk formel til at bestemme, hvad den teoretiske maksimale frekvens du kan gengive ved hjælp af forskellige samplingfrekvenser. Nyquist-teoremet fastslår, at frekvenser under halvdelen af samplingfrekvensen i kilohertz kan rekonstrueres. Det menneskelige høreområde kan anslås til at være 20hz-20khz. Så ved hjælp af denne formel burde 44,1k være i stand til at gengive godt op til 20k-grænsen (når det er sagt, er 20k knap nok mærkbar, og da 2,5k til 5k stadig registreres i de “højere tonehøjder”, mens 10k og 12k er gennemtrængende høje, er 20k ikke så nyttig en frekvens, når det drejer sig om at blande lyd).
Debat og konklusion
Med min erfaring gør bitraten (16 bit vs. 24 bit) ofte større forskel for lyden end samplefrekvensen (f.eks. 44,1k vs. 48k)
For noget materiale kan 96k eller 192k lyde en smule bedre, men den enorme filstørrelse er det ikke værd. Materiale vil i sidste ende blive downsamplet til mp3, og der er andre ting som endelig gain staging, der betyder mere. Kontroller din filudgangsforstærkning med et måleapparat og sørg for, at du ikke klipper og efterlader en smule headroom til konverterne og downsampling.
Så hvorfor overhovedet bruge 96k? Ved at sikre, at frekvenser op til 40k er dækket, har vi en meget præcis version af lyden, som kan bruges til at mixe ned til 44,1k eller noget mere fornuftigt. De fleste plugins kan bruge 96k, og de fleste lyttetests viser DOK kvalitetsforskel mellem 44,1k og 96k. 192k kan bruges eller endda højere, men det kan diskuteres med hensyn til mærkbar kvalitet vs. filstørrelse. Prøv det selv.
Der er bogstaveligt talt hundredvis af faktorer, der spiller ind på lyden af en optagelse. Mikrofonvalg og placering, pre-amps, konverterkvalitet og anti-aliasing, clocking samt fysiske omgivelser spiller alle en rolle, der gør langt større ændringer i lyden end 48k vs 96k eller 44.1 vs 48k. Så du skal ikke svede for meget over det.