Întrebare: Formatul de fișier WAV și AIFF: care este diferența?

Care este cel mai bun pentru audio? Mp3 și Mp4, precum și FLAC și alte formate mai puțin obișnuite alcătuiesc și ele o mică parte din fișierele audio existente… dar Care este cel mai bun WAV sau AIFF?

Răspuns: AIFF și WAV sunt exact de aceeași calitate

WAV este folosit mai ales pentru PC-uri, iar AIFF fiind folosit mai ales pentru MAC, dar ambele pot fi redate pe aproape toate tipurile de computere și dispozitive. Ambele folosesc același tip de codificare care are ca rezultat o dimensiune relativ mare a fișierului, dar o menținere a unui sunet de calitate superioară față de mp3 m4a sau alte fișiere mai mici.

Atunci când ar trebui să folosiți WAV / AIFF și când ar trebui să folosiți MP3 / M4A etc?

Când vă preocupă viteza și dimensiunea mică a fișierului, folosiți mp3. De exemplu, pe internet, sau într-un e-mail. Nimeni nu vrea să descarce un fișier de 50mB pentru a asculta o melodie pe telefon sau pentru a trimite o melodie rapidă unui prieten. Dacă faceți streaming pe un site web sau pe youtube, probabil că este vorba de un format de fișier cu pierderi similar cu mp3. De fapt, mp3 este doar un fișier video, fără partea video.

Cum afectează downsampling-ul calitatea audio

În scop ilustrativ, imaginați-vă că imaginea de sus este fișierul dvs. audio de calitate completă, iar cea de jos este mp3-ul downsampled. Imaginii de jos îi lipsesc claritatea percepută și profunzimea de câmp a imaginii. Acesta este un concept vizual similar cu modul în care mp3-urile și alte formate cu pierderi reușesc să obțină o imagine destul de apropiată de fișierul original, dar nu dispune de datele necesare pentru a reprezenta în totalitate forma de undă completă.

Imaginea înainte de Downsampling Data

Imaginea după Downsampling Data (Comprimarea datelor cu pierderi)

Această imagine arată cum o imagine downsampled poate fi de calitate mai slabă decât cea originală pentru a economisi spațiu. În general, arată aproximativ la fel, dar o inspecție mai atentă arată o pierdere de detalii. La fel ca un JPEG pixelat, fișierele audio care au prea multă compresie cu pierderi pot fi lipsite de strălucire și sună ca și cum le-ar lipsi detaliile unui fișier WAV sau AIFF. Imaginea de sus ar reprezenta un WAV sau AIFF, iar imaginea de jos ar reprezenta un MP3 sau Mp4, deși imaginea nu este o reprezentare reală, ci pentru a ilustra modul în care compresia afectează calitatea.

Ce este un fișier WAV și cum îl pot reda?

Peste toate telefoanele și computerele (inclusiv utilizatorii de Mac și Windows) pot reda un fișier WAV. În general, AIFF poate fi redat pe un produs Apple, cum ar fi iphone Mac OS based computer, dar aproape orice media player, cum ar fi VLC sau iTunes, le va reda pe ambele. Dezvoltate inițial de IBM și Microsoft, fișierele Wave sunt un format audio brut de dinainte ca oamenii să aibă internet. Deși este foarte vechi, formatul este foarte elementar și este, în esență, o funcție matematică pentru a descrie o undă sonoră.

Atât WAV cât și AIFF folosesc aceeași metodă de codificare!

Atât AIFF cât și WAV se bazează pe același IFF* (Interchange File Format) AVI, ANI și WAV folosesc toate RIFF (Resource Interchange File Format) o variantă a IFF*, care se bazează pe bucăți de date care sunt denumite chunks. Există o bucată principală de date, precum și o bucată de nume, o bucată de artist, o bucată de drepturi de autor etc., unde pot fi adăugate date suplimentare pentru aceste categorii. În plus, fișierele WAV și AIFF pot avea mai multe canale, cum ar fi de la un singur canal mono, la două canale stereo, 5.1 (șase canale), 8 canale sau mai multe.

*David a notat „…, AIFF nu este derivat din RIFF. Atât AIFF cât și RIFF au fost derivate din IFF, lansat de Electronic Arts în 1985. De asemenea, AIFF a precedat RIFF cu 3 ani. Nu se poate baza pe RIFF. Ele sunt foarte asemănătoare.”
*Mulțumesc pentru corecție David! Deci, AIFF este derivat din IFF, WAV folosește RIFF care este, de asemenea, derivat din IFF ( Mulțumesc pentru clarificare!)

WAV and AIFF Encoding Explained Further

Atât AIFF cât și WAV sunt formate de fișiere fără pierderi, cu alte cuvinte, nu există pierderi de date. Formatul de fișier diferă ușor, dar informațiile digitale sunt stocate ca o reprezentare matematică exactă a formei de undă. Atât WAV, cât și AIFF folosesc PCM (Pulse Code Modulation) pentru a codifica datele într-un mod care să minimizeze pierderea de calitate. WAV sau AIFF sunt ambele de calitate CD sau „calitate de studio”, CD-ul fiind de 16 biți, iar „calitatea de studio” fiind, de obicei, de 24 de biți sau mai mare. Regula generală de bază este că, dacă înregistrați la 16 biți, redă fișierele la 16 biți. Dacă înregistrați la 24 de biți, redați mixajele la 24 de biți. Fișierele pot fi oricând eșantionate la o rată de biți mai mică. De exemplu, 24 de biți poate fi cu ușurință redus la 16, dar odată ce ați ajuns la 16, revenirea la 24 de biți este destul de inutilă.

Din moment ce fișierele WAV sau AIFF sunt Lossless, ele pot ocupa MULT S P A C E !

Atât WAV, cât și AIFF pot fi codificate cu timestamps, informații despre tempo și alte tipuri de informații, cum ar fi markere. Pro Tools sau Logic pot crea WAV sau AIFF-uri. Conform „surselor” de pe internet, diferența constă în ordinea octeților. AIFF fiind optimizat pentru procesorul Motorola, iar fișierele WAV fiind optimizate pentru microprocesoarele bazate pe Intel, dar în realitate nu există nicio diferență de performanță.

Lumea captivantă a modulației prin cod de impulsuri

Modulația prin cod de impulsuri este o modalitate matematică de a reprezenta digital semnale analogice. Ea este utilizată în dispozitivele audio digitale. Amplitudinea (cunoscută și sub numele de nivelul de energie sau intensitatea unui sunet) este măsurată în diferite puncte. Numărul de ori de câte ori este măsurată amplitudinea pe secundă se numește rata de eșantionare. De exemplu, o rată de eșantionare de 44,1k înseamnă că sunt captate 44.100 de eșantioane pe secundă. Pentru 96k, se măsoară sunetul de 96.000 de ori pe secundă.

Rata de biți este cantitatea de pași pe „bățul de măsură” care măsoară amplitudinea. 16 biți și 24 de biți sunt cele mai comune, dar ideea generală este că o rată de biți mai mare este mai precisă. 24 de biți are o gamă dinamică mai mare decât 16 biți , sau o măsurare mai precisă, deoarece are 24 de unități de date de măsurat, față de doar 16 biți, care are cu 6 pași mai puțin pe scală.

Chiar dacă aceasta poate fi o ușoară simplificare excesivă, ați înțeles ideea. Mai mulți biți este mai bine. O rată de eșantionare mai mare este mai exactă.

Câteva rate de eșantionare obișnuite ar fi:

  • 44.1 16 Bit (calitate CD)
  • 48k 16bit (calitate DVD-Video)
  • 96k 24 bit calitate DVD-Audio (DVD-A)

În studio, 48k 24bit sau 96k 24bit sunt deseori folosite ca „calitate de studio” și apoi sunt supuse ulterior unui downsampled. Majoritatea oamenilor nu doresc fișiere WAV de 96k. Este pur și simplu prea mare și, oricum, cine mai ascultă „calitate mai bună decât pe CD” în zilele noastre. Poate audiofilii și oamenii de studio, dar mulți ascultă și versiuni mp3 sau lossy. Aveți nevoie ca melodiile dvs. să sune bine în toate formatele, iar a vă lăsa prinși în toate versiunile diferite poate fi o gaură de iepure în care nu doriți să coborâți. O mulțime de materiale grozave au fost înregistrate la 44,1k, o mulțime de materiale groaznice au fost înregistrate la 192k (sau chiar mai mult!), dar asta nu înseamnă că sună mai bine de la început.

Analiză de calitate prin teorema de eșantionare Nyqust- Shannon

Teorema Nyqust sau teorema de eșantionare Shannon este o formulă matematică pentru a determina care este frecvența maximă teoretică pe care o puteți reproduce folosind diferite frecvențe de eșantionare. Teorema Nyquist afirmă că frecvențele sub jumătate din rata de eșantionare în kilohertzi pot fi reconstruite. Gama de frecvențe ale auzului uman poate fi estimată la 20hz-20khz. Așadar, folosind această formulă, 44,1k ar trebui să poată reproduce bine până la limita de 20k (acestea fiind spuse, 20k sunt abia perceptibile, iar cu 2,5k până la 5k care se înregistrează încă în zonele „înalte”, 10k și 12k fiind foarte înalte, 20k nu este o frecvență atât de utilă atunci când vine vorba de mixarea audio).

Dezbatere și concluzie

Din experiența mea, rata de biți (16 biți vs 24 biți) face de multe ori mai multă diferență în ceea ce privește sunetul audio decât rata de eșantionare (de exemplu, 44,1k vs 48k)

Pentru unele materiale, 96k poate sau 192k poate suna un pic mai bine, dar dimensiunea enormă a fișierului nu merită. Materialul va fi în cele din urmă eșantionat la mp3 și există alte lucruri, cum ar fi etapizarea finală a câștigului, care contează mai mult. Verificați câștigul de ieșire al fișierului dvs. cu un metru și asigurați-vă că nu sunteți tăiat și că lăsați un pic de spațiu pentru convertoare și downsampling.

Atunci de ce să folosiți 96k deloc? Asigurându-ne că sunt acoperite frecvențele de până la 40k, avem o versiune foarte precisă a sunetului care poate fi folosită pentru a mixa până la 44.1k sau ceva mai rezonabil. Majoritatea pluginurilor pot folosi 96k, iar majoritatea testelor de ascultare DOAR arată o diferență de calitate între 44,1k și 96k. Se poate folosi 192k sau chiar mai mult, dar acest lucru ar putea fi dezbătut în ceea ce privește calitatea perceptibilă față de dimensiunea fișierului. Încercați singur.

Există literalmente sute de factori care intră în sunetul înregistrării. Alegerea și plasarea microfonului, preamplificatoarele, calitatea convertorului și anti-aliasing-ul, clocking-ul, precum și mediul fizic, toate joacă un rol făcând schimbări mult mai mari în sunet decât 48k vs 96k sau 44.1 vs 48k. Așa că nu vă faceți prea multe griji.

Afară de AIFF vs WAV? Care este mai bun? Concluzia finală: nu există absolut nici o diferență de calitate. Folosiți oricare dintre ele. Aș spune că WAV este ușor mai comun.

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.