WAV kontra AIFF: Który format plików audio jest najlepszy?

Pytanie: Format pliku WAV i AIFF: jaka jest różnica?
Odpowiedź: AIFF i WAV mają dokładnie taką samą jakość
Więc kiedy powinieneś używać WAV / AIFF, a kiedy powinieneś używać MP3 / M4A etc?
How Downsampling Affects Audio Quality
Co to jest plik WAV i jak go odtwarzać?
Oba formaty WAV i AIFF używają tej samej metody kodowania!
Kodowanie AIFF i AIFV wyjaśnione dalej
Ponieważ pliki WAV lub AIFF są bezstratne, mogą zajmować dużo S P A C E !
Ekscytujący świat modulacji kodu impulsowego
Kilka popularnych częstotliwości próbkowania to:
Analiza jakości poprzez Nyqust- Shannon Sampling Theorem
Dyskusja i wnioski
Więc AIFF vs WAV? Który jest lepszy? Ostateczny wniosek: nie ma absolutnie żadnej różnicy w jakości. Używaj albo. Powiedziałbym, że WAV jest nieco bardziej powszechny.

Pytanie: Format pliku WAV i AIFF: jaka jest różnica?

Który z nich jest najlepszy dla audio? Mp3 i Mp4, jak również FLAC i inne mniej popularne formaty stanowią niewielką część plików audio… ale co jest najlepsze WAV czy AIFF?

Odpowiedź: AIFF i WAV mają dokładnie taką samą jakość

WAV jest używany głównie dla komputerów PC, a AIFF głównie dla MAC, ale każdy z nich może być odtwarzany na praktycznie wszystkich typach komputerów i urządzeń. Oba używają tego samego typu kodowania, które skutkuje stosunkowo dużym rozmiarem pliku, ale utrzymaniem wyższej jakości dźwięku niż mp3 m4a lub inne mniejsze pliki.

Więc kiedy powinieneś używać WAV / AIFF, a kiedy powinieneś używać MP3 / M4A etc?

Gdy zależy ci na szybkości i małym rozmiarze pliku, użyj mp3. Na przykład, w Internecie lub w e-mailu. Nikt nie chce pobierać pliku o rozmiarze 50MB, aby posłuchać piosenki na swoim telefonie, lub wysłać szybki utwór do przyjaciela. Jeśli przesyłasz strumieniowo na stronie internetowej lub youtube, jest to prawdopodobnie strumieniowe przesyłanie plików w stratnym formacie podobnym do mp3. W rzeczywistości mp3 jest po prostu plikiem wideo, bez części wideo.

How Downsampling Affects Audio Quality

Dla celów ilustracyjnych, wyobraź sobie, że górny obraz jest plikiem audio o pełnej jakości, a dolny jest twoim downsampled mp3. Dolny obraz brakuje postrzeganej jasności i głębi pola obrazu. Jest to podobna koncepcja wizualna do tego, jak mp3 i inne formaty stratne są w stanie uzyskać całkiem blisko oryginalnego pliku, ale brakuje danych, aby w pełni reprezentować pełny kształt fali.

Obraz przed downsamplingiem danych

Obraz po downsamplingu danych (kompresja danych stratnych)

Ten obraz pokazuje, jak downsamplowany obraz może być niższej jakości niż oryginał, aby zaoszczędzić miejsce. Ogólnie rzecz biorąc, wygląda to mniej więcej tak samo, ale bliższa inspekcja pokazuje utratę szczegółów. Podobnie jak rozpikselowany JPEG, pliki audio, które mają zbyt dużo stratnej kompresji mogą być pozbawione blasku i brzmieć tak, jakby brakowało im szczegółów pliku WAV lub AIFF. Górny obraz reprezentowałby WAV lub AIFF, a dolny obraz reprezentowałby MP3 lub Mp4, chociaż obraz nie jest rzeczywistą reprezentacją, ale dla zilustrowania jak kompresja wpływa na jakość.

Co to jest plik WAV i jak go odtwarzać?

Prawie wszystkie telefony i komputery (w tym Mac i Windows) mogą odtwarzać plik WAV. Ogólnie rzecz biorąc, AIFF może być odtwarzany na produkcie Apple, takim jak iphone Mac OS oparty komputer, ale prawie każdy odtwarzacz multimedialny, taki jak VLC lub iTunes będzie odtwarzać oba. Pierwotnie opracowany przez IBM i Microsoft, pliki Wave są surowym formatem audio z przed ludzie mieli internet. Chociaż jest to bardzo stary format, jest on bardzo podstawowy i jest w zasadzie funkcją matematyczną do opisania fali dźwiękowej.

Oba formaty WAV i AIFF używają tej samej metody kodowania!

Oba formaty AIFF i WAV są oparte na tym samym formacie IFF* (Interchange File Format) AVI, ANI i WAV używają formatu RIFF (Resource Interchange File Format), który jest odmianą formatu IFF*, opartą na kawałkach danych, które są określane jako fragmenty. Istnieje główna część danych, jak również część z nazwiskami, artystów, praw autorskich, itd. Dodatkowo, pliki WAV i AIFF mogą mieć wiele kanałów, takich jak tylko jeden kanał mono, do dwóch kanałów stereo, 5.1 (sześć kanałów), 8 kanałów lub więcej.

*David zauważył „…, AIFF nie pochodzi od RIFF. Zarówno AIFF jak i RIFF wywodzą się z IFF, wydanego przez Electronic Arts w 1985 roku. Ponadto, AIFF poprzedził RIFF o 3 lata. To nie może być oparte na RIFF. Są one bardzo podobne.”
*Dzięki za korektę David! Więc, AIFF pochodzi z IFF, WAV używa RIFF, który również pochodzi z IFF (Dzięki za wyjaśnienie!)

Kodowanie AIFF i AIFV wyjaśnione dalej

Oba formaty AIFF i WAV są bezstratnymi formatami plików, innymi słowy, nie ma utraty danych. Format pliku różni się nieznacznie, ale informacja cyfrowa jest przechowywana jako dokładna matematyczna reprezentacja kształtu fali. Zarówno WAV jak i AIFF używają PCM (Pulse Code Modulation) do kodowania danych w sposób minimalizujący utratę jakości. WAV i AIFF mają jakość CD lub „jakość studyjną”, przy czym CD to 16 bitów, a „jakość studyjna” to zazwyczaj 24 bity lub więcej. Ogólna zasada jest taka, że jeśli nagrywasz w 16 bitach, renderuj pliki w 16 bitach. Jeśli nagrywasz w 24 bitach, renderuj swoje miksy w 24 bitach. Pliki zawsze mogą być downsamplowane do niższej prędkości bitowej. Na przykład 24 bity mogą być łatwo downsamplowane do 16, ale kiedy jesteś już przy 16, powrót do 24 bitów jest całkiem bezużyteczny.

Ponieważ pliki WAV lub AIFF są bezstratne, mogą zajmować dużo S P A C E !

Zarówno WAV jak i AIFF mogą być zakodowane ze znacznikami czasowymi, informacjami o tempie i innymi typami informacji jak markery. Pro Tools lub Logic mogą tworzyć WAV lub AIFF. Według internetowych „źródeł” różnica polega na kolejności bajtów. Z AIFF jest zoptymalizowany dla procesorów Motoroli, a pliki WAV zoptymalizowane dla mikroprocesorów opartych na Intelu, ale tak naprawdę nie ma różnicy w wydajności.

Ekscytujący świat modulacji kodu impulsowego

Modulacja kodu impulsowego jest matematycznym sposobem cyfrowej reprezentacji sygnałów analogowych. Jest ona wykorzystywana w cyfrowych urządzeniach audio. Amplituda (inaczej znany jako poziom energii lub głośność dźwięku) jest mierzona w różnych punktach. Liczba pomiarów amplitudy w ciągu sekundy nazywana jest częstotliwością próbkowania. Na przykład, częstotliwość próbkowania 44.1k oznacza, że rejestrowanych jest 44,100 próbek na sekundę. Dla 96k, 96,000 razy na sekundę dźwięk jest mierzony.

Bit rate to ilość kroków na „drążku pomiarowym”, który mierzy amplitudę. 16 bit i 24 bit są najbardziej powszechne, ale ogólna idea jest taka, że wyższa szybkość bitowa jest bardziej precyzyjna. 24 bity mają wyższy zakres dynamiczny niż 16 bitów, lub bardziej precyzyjny pomiar, ponieważ mają 24 jednostki danych do pomiaru, w porównaniu do tylko 16 bitów, które mają 6 mniej kroków na skali.

Choć może to być niewielkie uproszczenie, masz pomysł. Więcej bitów jest lepsze. Wyższa częstotliwość próbkowania jest bardziej dokładna.

Kilka popularnych częstotliwości próbkowania to:

44.1 16 Bit (Jakość CD)
48k 16bit (Jakość DVD-Video)
96k 24 bit Jakość DVD-Audio (DVD-A)

W studiu 48k 24bit lub 96k 24bit są często używane jako „jakość studyjna” i później downsamplowane. Większość ludzi nie chce plików WAV 96k. Są one po prostu za duże, a kto w dzisiejszych czasach słucha „jakości lepszej niż CD”. Może audiofile i studenci, ale wielu słucha też mp3 lub wersji stratnych. Potrzebujesz, żeby twoje utwory brzmiały świetnie we wszystkich formatach, a zapętlenie się w różnych wersjach może być króliczą norą, do której nie chcesz schodzić. Mnóstwo świetnego materiału zostało nagrane w 44.1k, mnóstwo okropnego materiału zostało nagrane w 192k (lub nawet wyżej!), ale to nie sprawi, że będzie brzmiał lepiej, nie jest dobry od początku.

Analiza jakości poprzez Nyqust- Shannon Sampling Theorem

Twierdzenie Nyqusta lub Shannon Sampling Theorem jest matematyczną formułą do określenia jaka jest teoretyczna maksymalna częstotliwość jaką możesz odtworzyć używając różnych częstotliwości próbkowania. Twierdzenie Nyquista stwierdza, że częstotliwości poniżej połowy częstotliwości próbkowania w kilohercach mogą być zrekonstruowane. Zakres słyszalności człowieka można oszacować na 20hz-20khz. Więc używając tego wzoru, 44.1k powinno być w stanie odtworzyć dobrze do granicy 20k (to powiedziawszy, 20k jest ledwo wyczuwalne, a z 2.5k do 5k wciąż rejestrującymi się w obszarach „wyższych tonów”, 10k i 12k będącymi przeszywająco wysokimi, 20k nie jest tak użyteczną częstotliwością jeśli chodzi o miksowanie dźwięku).

Dyskusja i wnioski

W moim doświadczeniu, szybkość bitowa (16 bit vs 24 bit) często robi większą różnicę w dźwięku niż częstotliwość próbkowania (np. 44.1k vs 48k)

Dla niektórych materiałów 96k może lub 192k może brzmieć trochę lepiej, ale ogromny rozmiar pliku nie jest tego wart. Materiał w końcu będzie downsamplowany do mp3 i są inne rzeczy, takie jak końcowe wzmocnienie, które mają większe znaczenie. Sprawdź wzmocnienie wyjściowe swojego pliku miernikiem i upewnij się, że nie obcinasz, i zostawiasz trochę miejsca na konwertery i downsampling.

Więc po co w ogóle używać 96k? Poprzez zapewnienie, że częstotliwości do 40k są pokryte, mamy bardzo dokładną wersję dźwięku, która może być użyta do miksowania w dół do 44.1k lub czegoś bardziej rozsądnego. Większość wtyczek może używać 96k, a większość testów odsłuchowych wykazuje różnicę w jakości pomiędzy 44.1k a 96k. 192k może być używane lub nawet wyższe, ale to może być przedmiotem dyskusji, jeśli chodzi o odczuwalną jakość vs rozmiar pliku. Wypróbuj to sam.

Są dosłownie setki czynników, które wpływają na dźwięk nagrania. Wybór mikrofonu i jego umiejscowienie, przedwzmacniacze, jakość konwertera i antyaliasing, taktowanie, jak również fizyczne środowisko odgrywają rolę, powodując znacznie większe zmiany w dźwięku niż 48k vs 96k lub 44.1 vs 48k. Więc nie przejmuj się tym za bardzo.

Więc AIFF vs WAV? Który jest lepszy? Ostateczny wniosek: nie ma absolutnie żadnej różnicy w jakości. Używaj albo. Powiedziałbym, że WAV jest nieco bardziej powszechny.

Free Press

AIFF kontra WAV: Który format pliku audio jest najlepszy?