- Kérdés: WAV és AIFF fájlformátum: mi a különbség?
- Válasz: WAV vagy AIFF? AIFF és WAV pontosan ugyanolyan minőségű
- Mikor érdemes tehát WAV / AIFF-et használni, és mikor MP3 / M4A stb.
- How Downsampling Affects Audio Quality
- Mi az a WAV fájl, és hogyan játszhatom le?
- A WAV és az AIFF is ugyanazt a kódolási módszert használja!
- WAV és AIFF kódolás tovább magyarázva
- Mivel a WAV vagy AIFF fájlok Losslessek, sok S P A C E-t foglalhatnak el !
- A Pulse Code Modulation izgalmas világa
- Az általános mintavételi sebességek a következők:
- Quality Analysis via Nyqust- Shannon Sampling Theorem
- Vita és következtetés
- Szóval AIFF vs. WAV? Melyik a jobb? Végső következtetés: egyáltalán nincs különbség a minőségben. Használd bármelyiket. Én azt mondanám, hogy a WAV valamivel elterjedtebb.
Kérdés: WAV és AIFF fájlformátum: mi a különbség?
Melyik a legjobb audio formátum? Az Mp3 és az Mp4, valamint a FLAC és más kevésbé elterjedt formátumok is a hangfájlok egy kis részét teszik ki… de Mi a legjobb WAV vagy AIFF?
Válasz: WAV vagy AIFF? AIFF és WAV pontosan ugyanolyan minőségű
A WAV-ot főleg PC-ken használják, az AIFF-et pedig főleg MAC-eken, de bármelyik lejátszható gyakorlatilag minden típusú számítógépen és eszközön. Mindkettő ugyanazt a fajta kódolást használja, ami viszonylag nagy fájlméretet eredményez, de az mp3 m4a vagy más kisebb fájloknál jobb minőségű hangzást biztosít.
Mikor érdemes tehát WAV / AIFF-et használni, és mikor MP3 / M4A stb.
Ha a sebesség és a kis fájlméret a fontos, használd az mp3-at. Például az interneten, vagy e-mailben. Senki sem akar letölteni egy 50 mB-os fájlt, hogy meghallgasson egy dalt a telefonján, vagy elküldjön egy gyors dallamot egy barátjának. Ha egy weboldalon vagy a youtube-on streamelsz, akkor valószínűleg az mp3-hoz hasonló, veszteséges fájlformátumot használsz. Az mp3 valójában csak egy videofájl, a videós rész nélkül.
How Downsampling Affects Audio Quality
Az illusztráció kedvéért képzelje el, hogy a felső kép a teljes minőségű hangfájl, az alsó pedig a lemintavételezett mp3. Az alsó képből hiányzik a kép érzékelhető tisztasága és mélységélessége. Ez hasonló vizuális koncepció ahhoz, ahogyan az mp3-ak és más veszteséges formátumok képesek elég közel kerülni az eredeti fájlhoz, de hiányzik belőlük a teljes hullámforma teljes ábrázolásához szükséges adat.
Kép az adatok lemintavételezése előtt
Kép az adatok lemintavételezése után (veszteséges adattömörítés)
Ez a kép azt mutatja, hogy a lemintavételezett kép helytakarékosság céljából az eredetinél alacsonyabb minőségű lehet. Általánosságban nagyjából ugyanúgy néz ki, de közelebbről megvizsgálva látható a részletesség csökkenése. A pixeles JPEG-hez hasonlóan a túl nagy veszteséges tömörítésű hangfájlok is fénytelenek lehetnek, és úgy hangzanak, mintha nem lenne olyan részletgazdag a hangjuk, mint egy WAV- vagy AIFF-fájlé. A felső kép egy WAV vagy AIFF, az alsó kép pedig egy MP3 vagy Mp4 fájlt ábrázol, bár a kép nem egy tényleges ábrázolás, hanem annak szemléltetésére szolgál, hogy a tömörítés hogyan befolyásolja a minőséget.
Mi az a WAV fájl, és hogyan játszhatom le?
A WAV fájlokat szinte minden telefon és számítógép (beleértve a Mac- és Windows-felhasználókat is) képes lejátszani. Általában az AIFF lejátszható egy Apple terméken, például iphone Mac OS alapú számítógépen, de szinte bármilyen médialejátszó, például a VLC vagy az iTunes mindkettőt lejátssza. Az eredetileg az IBM és a Microsoft által kifejlesztett Wave fájlok egy nyers hangformátum, amely még azelőttről származik, hogy az emberek rendelkeztek volna internettel. Bár nagyon régi, a formátum nagyon egyszerű, és lényegében egy matematikai függvény a hanghullám leírására.
A WAV és az AIFF is ugyanazt a kódolási módszert használja!
Az AIFF és a WAV is ugyanazon az IFF* (Interchange File Format) formátumon alapul Az AVI, az ANI és a WAV is a RIFF(Resource Interchange File Format) formátumot használja, amely az IFF* egy változata, és az adatdarabokon alapul, amelyeket chunck-nak neveznek. Van a fő adatdarab, valamint a névdarab, előadói darab, szerzői jogi darab stb., amelyekhez további adatokat lehet hozzáadni az adott kategóriákhoz. Ezenkívül a WAV és az AIFF fájlok több csatornával is rendelkezhetnek, például egy mono csatornától kezdve a két sztereó csatornáig, 5.1 (hat csatorna), 8 csatorna vagy több csatornáig.”
*David megjegyezte: “…, az AIFF nem a RIFF-ből származik. Mind az AIFF, mind a RIFF az IFF-ből származik, amelyet az Electronic Arts adott ki 1985-ben. Továbbá az AIFF 3 évvel megelőzte a RIFF-et. Nem alapulhat a RIFF-en. Nagyon hasonlóak.”
*Köszönöm a helyesbítést David! Tehát az AIFF az IFF-ből származik, a WAV a RIFF-et használja, amely szintén az IFF-ből származik ( Köszönöm a pontosítást!)
WAV és AIFF kódolás tovább magyarázva
Az AIFF és a WAV is veszteségmentes fájlformátum, más szóval nincs adatvesztés. A fájlformátum némileg különbözik, de a digitális információt a hullámforma pontos matematikai ábrázolásaként tárolják. A WAV és az AIFF is PCM-et (Pulse Code Modulation) használ az adatok kódolásához oly módon, hogy a lehető legkisebb legyen a minőségromlás. A WAV és az AIFF egyaránt CD-minőségű vagy “stúdióminőségű”, a CD 16 bites, a “stúdióminőség” pedig általában 24 bites vagy magasabb. Az általános szabály az, hogy ha 16 biten rögzít, akkor a fájlokat 16 biten renderelje. Ha 24 biten veszel fel, akkor a mixeket 24 biten rendereld. A fájlok mindig lemintavételezhetők alacsonyabb bitsebességre. Például a 24 bites lejátszás könnyen lemintavételezhető 16-ra, de ha már 16-on van, a 24 bitesre való visszaváltás eléggé haszontalan.
Mivel a WAV vagy AIFF fájlok Losslessek, sok S P A C E-t foglalhatnak el !
A WAV és az AIFF fájlok is kódolhatók időbélyegekkel, tempóinformációkkal és más típusú információkkal, például markerekkel. A Pro Tools vagy a Logic képes WAV vagy AIFF fájlok létrehozására. Az internetes “források” szerint a különbség a bájtsorrendben van. Az AIFF a Motorola processzorra, a WAV fájlok pedig az Intel alapú mikroprocesszorokra optimalizáltak, de valójában nincs különbség a teljesítményben.
A Pulse Code Modulation izgalmas világa
A Pulse Code Modulation az analóg jelek digitális ábrázolásának matematikai módja. Digitális hangeszközökben használják. Az amplitúdót (más néven a hang energiaszintjét vagy hangosságát) különböző pontokon mérik. Az amplitúdó másodpercenkénti mérésének számát nevezzük mintavételi sebességnek. Például a 44,1k mintavételi sebesség azt jelenti, hogy másodpercenként 44 100 mintát rögzítünk. A 96k esetében másodpercenként 96 000 alkalommal mérik a hangot.
A bitráta az amplitúdót mérő “mérőpálca” lépéseinek száma. A 16 bit és a 24 bit a legelterjedtebb, de az általános elképzelés az, hogy a magasabb bitráta pontosabb. A 24 bitnek nagyobb a dinamikatartománya, mint a 16 bitnek , vagy pontosabb a mérés, mert 24 egységnyi adatot kell mérni, szemben a csak 16 bittel, amely 6 lépéssel kevesebb lépést tartalmaz a skálán.
Míg ez egy kis leegyszerűsítés lehet, érted a lényeget. A több bit jobb. A magasabb mintavételi sebesség pontosabb.
Az általános mintavételi sebességek a következők:
- 44.1 16 Bit (CD minőség)
- 48k 16bit (DVD-Video minőség)
- 96k 24 bit DVD-Audio minőség (DVD-A)
A stúdióban gyakran 48k 24bit vagy 96k 24bit-et használnak “stúdió minőségként”, majd később lemintavételezik. A legtöbb ember nem akar 96k-s WAV fájlokat. Egyszerűen túl nagy, és manapság amúgy is ki hallgatja a “CD-nél jobb minőséget”. Talán az audiofilok és a stúdiósok, de sokan hallgatnak mp3-at vagy veszteséges verziókat is. A dalaidnak minden formátumban jól kell szólniuk, és ha belegabalyodsz a különböző verziókba, az olyan nyúlüreg lehet, amibe nem akarsz lemenni. Rengeteg nagyszerű anyagot rögzítettek már 44.1k-ban, rengeteg szörnyű anyagot rögzítettek már 192k-ban (vagy még magasabbra!), de ettől még nem hangzik jobban, ha eleve nem jó.
Quality Analysis via Nyqust- Shannon Sampling Theorem
A Nyqust-tétel vagy Shannon Sampling-tétel egy matematikai képlet annak meghatározására, hogy mi az az elméleti maximális frekvencia, amit különböző mintavételi frekvenciákkal reprodukálni lehet. A nyquist-tétel kimondja, hogy a kilohertzben kifejezett mintavételi frekvencia fele alatti frekvenciák rekonstruálhatók. Az emberi hallás tartománya 20hz-20khz-re becsülhető. Tehát ezt a képletet használva a 44,1k a 20k határig jól reprodukálható (ennek ellenére a 20k alig érzékelhető, és mivel a 2,5k-5k még mindig a “magasabb hangmagasságú” területeken regisztrálható, a 10k és 12k pedig áthatóan magas, a 20k nem annyira hasznos frekvencia, ha hangkeverésről van szó).
Vita és következtetés
Tapasztalataim szerint a bitráta (16 bit vs. 24 bit) gyakran nagyobb különbséget jelent a hangzás szempontjából, mint a mintavételi frekvencia (pl. 44.1k vs. 48k)
Egyes anyagok esetében a 96k vagy 192k talán egy kicsit jobban szól, de a hatalmas fájlméret nem éri meg. Az anyagot előbb-utóbb lemintavételezik mp3-ra, és vannak más dolgok is, mint például a végső erősítés beállítása, amelyek többet számítanak. Ellenőrizze a fájl kimeneti erősítését egy mérőműszerrel, és győződjön meg róla, hogy nem vágja el a határértéket, és hagyjon egy kis headroomot az átalakítóknak és a downsamplingnek.
Szóval miért használ egyáltalán 96k-t? Ha biztosítjuk, hogy a 40k-ig terjedő frekvenciákat lefedjük, akkor egy nagyon pontos verziója lesz a hangnak, amit felhasználhatunk a 44.1k-ra vagy valami értelmesebbre való lekeveréshez. A legtöbb plugin képes 96k-t használni, és a legtöbb hallgatói teszt NEM mutat minőségi különbséget 44.1k és 96k között. Használható 192k vagy még magasabb is, de ez vitatható az érzékelhető minőség és a fájlméret között. Próbáld ki magad.
Szó szerint több száz tényező befolyásolja a felvétel hangzását. A mikrofon kiválasztása és elhelyezése, az előerősítők, a konverter minősége és az anti-aliasing, az órajelek, valamint a fizikai környezet mind szerepet játszanak, sokkal nagyobb változásokat okozva a hangzásban, mint a 48k vs 96k vagy 44.1 vs 48k. Szóval ne izgulj túlságosan.