- Kysymys: WAV- ja AIFF-tiedostomuoto: Mitä eroa on?
- Vastaus: WAV vai AIFF?
- Milloin siis kannattaa käyttää WAV / AIFF ja milloin MP3 / M4A jne.
- Miten downsampling vaikuttaa äänenlaatuun
- Mikä on WAV-tiedosto ja miten soitan sitä?
- Kaikki WAV- ja AIFF-tiedostot käyttävät samaa koodausmenetelmää!
- WAV- ja AIFF-koodaus selitetty tarkemmin
- Koska WAV- tai AIFF-tiedostot ovat Lossless-tiedostoja, ne voivat viedä PALJON S P A C E !
- Pulssikoodimodulaation jännittävä maailma
- Joitakin yleisiä näytteenottotaajuuksia olisivat:
- Keskustelu ja johtopäätökset
- So AIFF vs. WAV? Kumpi on parempi? Loppupäätelmä: Laadussa ei ole minkäänlaista eroa. Käytä kumpaakin. Sanoisin, että WAV on hieman yleisempi.
Kysymys: WAV- ja AIFF-tiedostomuoto: Mitä eroa on?
Kumpi on paras äänitiedostomuoto? Mp3 ja Mp4 sekä FLAC ja muut harvinaisemmat formaatit muodostavat myös pienen osan äänitiedostoista… mutta Mikä on paras WAV vai AIFF?
Vastaus: WAV vai AIFF?
WAV:tä käytetään enimmäkseen PC:ssä ja AIFF:ää enimmäkseen MAC:ssä, mutta kumpaakin voi toistaa käytännössä kaikentyyppisillä tietokoneilla ja laitteilla. Molemmat käyttävät samantyyppistä koodausta, joka johtaa suhteellisen suureen tiedostokokoon, mutta säilyttää korkealaatuisemman äänen kuin mp3 m4a tai muut pienemmät tiedostot.
Milloin siis kannattaa käyttää WAV / AIFF ja milloin MP3 / M4A jne.
Kun haluat nopeutta ja pientä tiedostokokoa, käytä mp3. Esimerkiksi internetissä tai sähköpostissa. Kukaan ei halua ladata 50mB:n tiedostoa kuunnellakseen kappaleen puhelimellaan, tai lähettää nopeaa kappaletta ystävälle. Jos suoratoistat musiikkia verkkosivustolla tai youtubessa, se on todennäköisesti mp3:n kaltainen häviöllinen tiedostomuoto. Itse asiassa mp3 on pelkkä videotiedosto ilman video-osaa.
Miten downsampling vaikuttaa äänenlaatuun
Kuvittele havainnollistamistarkoituksessa, että ylempi kuva on täyslaatuinen äänitiedostosi ja alempi on downsamplingattu mp3. Alemmassa kuvassa ei ole havaittavaa selkeyttä ja syväterävyyttä. Tämä on samankaltainen visuaalinen käsite kuin se, miten mp3-tiedostot ja muut häviölliset formaatit pystyvät pääsemään melko lähelle alkuperäistä tiedostoa, mutta niissä ei ole riittävästi dataa koko aaltomuodon täydelliseen esittämiseen.
Kuva ennen datan alasnäytteenottoa
Kuva datan alasnäytteenoton jälkeen (häviöllinen datanpakkaus)
Tässä kuvassa näytetään, kuinka alasnäytteenotettu kuva voi olla laadultaan alkuperäistä huonompi tilan säästämiseksi. Yleisesti ottaen se näyttää suunnilleen samalta, mutta tarkempi tarkastelu osoittaa yksityiskohtien häviämisen. Aivan kuten pikselöity JPEG, myös äänitiedostot, joissa on liikaa häviöllistä pakkausta, voivat olla epätarkkoja ja kuulostaa siltä, että niistä puuttuu WAV- tai AIFF-tiedoston yksityiskohdat. Ylempi kuva edustaisi WAV- tai AIFF-tiedostoa ja alempi kuva MP3- tai Mp4-tiedostoa, vaikka kuva ei olekaan varsinainen esitys, vaan havainnollistaa, miten pakkaus vaikuttaa laatuun.
Mikä on WAV-tiedosto ja miten soitan sitä?
Lähes kaikki puhelimet ja tietokoneet (mukaan lukien Macit ja Windows-käyttäjät) pystyvät soittamaan WAV-tiedostoa. Yleensä AIFF-tiedostoa voidaan toistaa Applen tuotteella, kuten iphonella Mac OS -pohjaisella tietokoneella, mutta lähes mikä tahansa mediasoitin, kuten VLC tai iTunes, toistaa molempia. Alun perin IBM:n ja Microsoftin kehittämät Wave-tiedostot ovat raakaääniformaatti, joka on peräisin ajalta ennen kuin ihmisillä oli internet. Vaikka formaatti on hyvin vanha, se on hyvin yksinkertainen, ja se on pohjimmiltaan matemaattinen funktio kuvaamaan ääniaaltoa.
Kaikki WAV- ja AIFF-tiedostot käyttävät samaa koodausmenetelmää!
Kaikki AIFF- ja WAV-tiedostot perustuvat samaan IFF* (Interchange File Format) -muodostelmaan.AVI, ANI ja WAV-formaatit käyttävät kaikki RIFF (Resource Interchange File Format) -muodostelmaa, joka on eräs IFF*-muoto, ja joka perustuu datan palasiin, joihin viitataan nimellä ”chunks”. On olemassa päätietokokonaisuus sekä nimikokonaisuus, artistikokonaisuus, tekijänoikeuskokonaisuus jne., joihin voidaan lisätä lisätietoa kyseisiä luokkia varten. Lisäksi WAV- ja AIFF-tiedostoissa voi olla useita kanavia, esimerkiksi yhdestä monokanavasta kahteen stereokanavaan, 5.1-kanavaan (kuusi kanavaa), kahdeksaan kanavaan tai useampaan kanavaan.”
*David huomautti ”…, AIFF ei ole johdettu RIFF:stä. Sekä AIFF että RIFF on johdettu IFF:stä, jonka Electronic Arts julkaisi vuonna 1985. Lisäksi AIFF edelsi RIFFiä 3 vuotta. Se ei voi perustua RIFFiin. Ne ovat hyvin samankaltaisia.”
*Kiitos korjauksesta David! AIFF on siis johdettu IFF:stä, WAV käyttää RIFF:ää, joka on myös johdettu IFF:stä ( Kiitos selvennyksestä!)
WAV- ja AIFF-koodaus selitetty tarkemmin
Kumpikin AIFF ja WAV ovat häviöttömiä tiedostomuotoja, toisin sanoen dataa ei menetetä. Tiedostomuoto eroaa hieman toisistaan, mutta digitaalinen informaatio tallennetaan aaltomuodon täsmällisenä matemaattisena esityksenä. Sekä WAV että AIFF käyttävät PCM:ää (pulssikoodimodulaatio) tiedon koodaamiseen siten, että laadun menetys on mahdollisimman pieni. WAV ja AIFF ovat molemmat CD-laatua tai ”studiolaatua”, CD:n ollessa 16-bittinen ja ”studiolaadun” ollessa yleensä 24-bittinen tai korkeampi. Yleinen nyrkkisääntö on, että jos äänität 16-bittisenä, renderöi tiedostot 16-bittisinä. Jos äänität 24-bittisenä, renderöi miksauksesi 24-bittisenä. Tiedostot voidaan aina downsamplata pienempään bittinopeuteen. Esimerkiksi 24-bittinen voidaan helposti downsamplata 16-bittiseksi, mutta kun olet kerran 16-bittinen, paluu 24-bittiseksi on melko hyödytöntä.
Koska WAV- tai AIFF-tiedostot ovat Lossless-tiedostoja, ne voivat viedä PALJON S P A C E !
Kaikki WAV- ja AIFF-tiedostot voidaan koodata aikaleimoilla, tempotiedoilla ja muulla informaatiolla, kuten markkereilla. Pro Tools tai Logic voi luoda WAV- tai AIFF-tiedostoja. Internetin ”lähteiden” mukaan ero on tavujärjestyksessä. AIFF on optimoitu Motorola-prosessorille ja WAV-tiedostot Intel-pohjaisille mikroprosessoreille, mutta todellisuudessa suorituskyvyssä ei ole eroa.
Pulssikoodimodulaation jännittävä maailma
Pulssikoodimodulaatio on matemaattinen tapa esittää analogisia signaaleja digitaalisesti. Sitä käytetään digitaalisissa audiolaitteissa. Amplitudi (joka muuten tunnetaan äänen energiatasona tai äänekkyytenä) mitataan eri pisteissä. Sitä, kuinka monta kertaa amplitudi mitataan sekunnissa, kutsutaan näytteenottotaajuudeksi. Esimerkiksi 44,1k näytteenottotaajuus tarkoittaa, että näytteitä otetaan 44 100 sekunnissa. Jos näytteenottotaajuus on 96k, ääni mitataan 96 000 kertaa sekunnissa.
Bittinopeus on amplitudia mittaavan ”mittakepin” askelten määrä. 16 bittiä ja 24 bittiä ovat yleisimmät, mutta yleinen ajatus on, että suurempi bittinopeus on tarkempi. 24 bitillä on suurempi dynaaminen alue kuin 16 bitillä , tai tarkempi mittaus, koska siinä on 24 mitattavaa datayksikköä, verrattuna vain 16 bittiin, jossa on 6 askelta vähemmän asteikolla.
Vaikka tämä saattaa olla lievää liiallista yksinkertaistamista, ymmärrät idean. Enemmän bittejä on parempi. Korkeampi näytteenottotaajuus on tarkempi.
Joitakin yleisiä näytteenottotaajuuksia olisivat:
- 44.1 16 bittiä (CD-laatu)
- 48k 16bit (DVD-videolaatu)
- 96k 24 bittiä DVD-Audio-laatu (DVD-A)
Studiossa käytetään usein ”studiolaatuna” 48k 24bit:iä tai 96k 24bit:iä, ja sitten myöhemmin alennetaan näytteenottotaajuutta. Useimmat ihmiset eivät halua 96k WAV-tiedostoja. Se on vain liian iso, ja kuka nykyään kuuntelee muutenkaan ”parempaa kuin CD-laatua”. Ehkä audiofiilit ja studioihmiset, mutta monet kuuntelevat myös mp3- tai häviöllisiä versioita. Kappaleiden on kuulostettava hyvältä kaikissa formaateissa, ja eri versioihin sekaantuminen voi olla kaninkolo, johon ei kannata mennä. Nyquistin teoreema sanoo, että alle puolet näytteenottotaajuudesta kilohertsissä olevat taajuudet voidaan rekonstruoida. Ihmisen kuuloalueen voidaan arvioida olevan 20hz-20khz. Tätä kaavaa käyttäen 44.1k:n pitäisi siis pystyä toistamaan hyvin 20k:n raja-arvoon asti (sanottuna 20k on tuskin havaittavissa, ja kun 2.5k-5k:n taajuudet ovat edelleen ”korkeammilla äänialueilla” ja 10k ja 12k:n taajuudet ovat lävistävän korkeita, 20k:n taajuus ei ole kovin käyttökelpoinen taajuus äänen sekoittamisessa).
Keskustelu ja johtopäätökset
Kokemukseni mukaan bittinopeus (16 bit vs. 24 bit) tekee usein suuremman eron äänentoistoon kuin näytteenottotaajuus (esim. 44.1k vs. 48k)
Jonkin materiaalin kohdalla 96k tai 192k saattaa kuulostaa hieman paremmalta, mutta valtava tiedostokoko ei ole sen arvoinen. Materiaali downsamplataan aikanaan mp3:ksi, ja on muita asioita, kuten lopullinen gain staging, joilla on enemmän väliä. Tarkista tiedostosi ulostulovahvistus mittarilla ja varmista, ettet clippaa, ja jätä hieman headroomia muuntimille ja downsamplingille.
Miksi siis käyttää 96k:ta ylipäätään? Varmistamalla, että taajuudet 40k:een asti katetaan, saamme erittäin tarkan version äänestä, jota voidaan käyttää miksaamiseen alas 44.1k:een tai johonkin järkevämpään. Useimmat plugarit voivat käyttää 96k:ta, ja useimmat kuuntelutestit VOIVAT osoittaa laatueron 44.1k:n ja 96k:n välillä. Voidaan käyttää 192k:ta tai jopa korkeampaa, mutta siitä voidaan kiistellä havaittavan laadun ja tiedostokoon välillä. Kokeile itse.
Tallenteen soundiin vaikuttavat kirjaimellisesti sadat tekijät. Mikrofonin valinta ja sijoittelu, esivahvistimet, muuntimen laatu ja anti-aliasing, tahdistus sekä fyysinen ympäristö vaikuttavat kaikki asiaan tehden paljon suurempia muutoksia soundiin kuin 48k vs 96k tai 44.1 vs 48k. Joten älä hikoile liikaa.