- Domanda: Formato file WAV e AIFF: qual è la differenza?
- Risposta: AIFF e WAV sono esattamente la stessa qualità
- Quindi, quando dovresti usare WAV / AIFF e quando dovresti usare MP3 / M4A ecc?
- Come il downsampling influenza la qualità dell’audio
- Cos’è un file WAV e come lo riproduco?
- Sia WAV che AIFF usano lo stesso metodo di codifica!
- Codifica WAV e AIFF spiegata ulteriormente
- Siccome i file WAV o AIFF sono Lossless, possono occupare un sacco di S P A C E !
- L’eccitante mondo della modulazione di codice a impulsi
- Alcune frequenze di campionamento comuni sarebbero:
- Analisi della qualità tramite il teorema di campionamento di Nyqust-Shannon
- Dibattito e conclusione
- Quindi AIFF vs WAV? Qual è meglio? Conclusione finale: non c’è assolutamente nessuna differenza nella qualità. Usate entrambi. Direi che il WAV è leggermente più comune.
Domanda: Formato file WAV e AIFF: qual è la differenza?
Quale è meglio per l’audio? Mp3 e Mp4 così come FLAC e altri formati meno comuni fanno una piccola parte dei file audio là fuori pure… ma Qual è meglio WAV o AIFF?
Risposta: AIFF e WAV sono esattamente la stessa qualità
WAV è usato principalmente per PC e AIFF è usato principalmente per MAC, ma entrambi possono essere riprodotti su praticamente tutti i tipi di computer e dispositivi. Entrambi usano lo stesso tipo di codifica che si traduce in un file di dimensioni relativamente grandi, ma mantenendo un suono di qualità superiore a mp3 m4a o altri file più piccoli.
Quindi, quando dovresti usare WAV / AIFF e quando dovresti usare MP3 / M4A ecc?
Quando sei preoccupato della velocità e delle piccole dimensioni del file, usa mp3. Per esempio, su internet, o in una e-mail. Nessuno vuole scaricare un file di 50mB per ascoltare una canzone sul proprio telefono, o inviare un brano veloce ad un amico. Se stai trasmettendo in streaming su un sito web, o su youtube, è probabile che stia trasmettendo un formato di file lossy simile all’mp3. Infatti, l’mp3 è solo un file video, senza la parte video.
Come il downsampling influenza la qualità dell’audio
A scopo illustrativo, immagina che l’immagine in alto sia il tuo file audio di qualità completa, e quella in basso sia il tuo mp3 downsampling. L’immagine in basso manca della chiarezza percepita e della profondità di campo dell’immagine. Questo è un concetto visivo simile a come gli mp3 e altri formati con perdita sono in grado di ottenere un file abbastanza vicino a quello originale, ma mancano i dati per rappresentare pienamente la forma d’onda completa.
Immagine prima del Downsampling Data
Immagine dopo il Downsampling Data (Lossy Data Compression)
Questa immagine mostra come un’immagine downsampling può essere di qualità inferiore all’originale per risparmiare spazio. In generale, sembra la stessa, ma un’ispezione più ravvicinata mostra la perdita di dettagli. Proprio come un JPEG pixelato, i file audio che hanno troppa compressione lossy possono essere poco brillanti, e suonare come se mancassero del dettaglio di un file WAV o AIFF. L’immagine in alto rappresenterebbe un WAV o AIFF, e l’immagine in basso rappresenterebbe un MP3 o Mp4, anche se l’immagine non è una rappresentazione reale, ma per illustrare come la compressione influisce sulla qualità.
Cos’è un file WAV e come lo riproduco?
Quasi tutti i telefoni e computer (compresi i Mac e gli utenti Windows) possono riprodurre un file WAV. Generalmente, AIFF può essere riprodotto su un prodotto Apple come il computer basato su iPhone Mac OS, ma quasi tutti i lettori multimediali come VLC o iTunes possono riprodurre entrambi. Originariamente sviluppato da IBM e Microsoft, i file Wave sono un formato audio grezzo da prima che la gente avesse internet. Anche se è molto vecchio, il formato è molto basilare, ed è essenzialmente una funzione matematica per descrivere un’onda sonora.
Sia WAV che AIFF usano lo stesso metodo di codifica!
Sia AIFF che WAV sono basati sullo stesso IFF* (Interchange File Format) AVI, ANI, e WAV usano tutti RIFF (Resource Interchange File Format) un tipo di IFF*, che è basato su pezzi di dati che vengono chiamati chunk. C’è il chunk dei dati principali, così come il chunk del nome, il chunk dell’artista, il chunk del copyright, ecc, dove possono essere aggiunti dati aggiuntivi per quelle categorie. Inoltre, i file WAV e AIFF possono avere più canali, come un solo canale mono, due canali stereo, 5.1 (sei canali), 8 canali o più.
*David ha notato “…, AIFF non deriva da RIFF. Sia AIFF che RIFF sono derivati da IFF, rilasciato da Electronic Arts nel 1985. Inoltre, AIFF ha preceduto RIFF di 3 anni. Non può essere basato su RIFF. Sono molto simili.”
*Grazie per la correzione David! Quindi, AIFF è derivato da IFF, WAV usa RIFF che è anche derivato da IFF (grazie per il chiarimento!)
Codifica WAV e AIFF spiegata ulteriormente
Sia AIFF che WAV sono formati di file senza perdita, in altre parole, non c’è perdita di dati. Il formato del file differisce leggermente, ma le informazioni digitali sono memorizzate come un’esatta rappresentazione matematica della forma d’onda. WAV e AIFF usano entrambi PCM (Pulse Code Modulation) per codificare i dati in modo da minimizzare la perdita di qualità. WAV o AIFF sono entrambi di qualità CD o “qualità studio”, dove il CD è a 16 bit e di solito la “qualità studio” è a 24 bit o superiore. La regola generale è che se registri a 16 bit, rendi i file a 16 bit. Se registri a 24 bit, renderizza i tuoi mix a 24 bit. I file possono sempre essere sottocampionati a un bit rate più basso. Per esempio 24 bit possono essere facilmente downsamplati a 16, ma una volta che sei a 16, tornare a 24 bit è abbastanza inutile.
Siccome i file WAV o AIFF sono Lossless, possono occupare un sacco di S P A C E !
Sia WAV che AIFF possono essere codificati con timestamp, informazioni sul tempo, e altri tipi di informazioni come i marcatori. Pro Tools o Logic possono creare WAV o AIFF. Secondo “fonti” internet la differenza è l’ordine dei byte. L’AIFF è ottimizzato per i processori Motorola, mentre i file WAV sono ottimizzati per i microprocessori basati su Intel, ma in realtà non c’è differenza di prestazioni.
L’eccitante mondo della modulazione di codice a impulsi
La modulazione di codice a impulsi è un modo matematico per rappresentare digitalmente segnali analogici. È usato nei dispositivi audio digitali. L’ampiezza (altrimenti nota come il livello di energia o il volume di un suono) viene misurata in diversi punti. La quantità di volte che l’ampiezza viene misurata al secondo è chiamata frequenza di campionamento. Per esempio, 44.1k tasso di campionamento, significa che vengono catturati 44.100 campioni al secondo. Per 96k, il suono viene misurato 96.000 volte al secondo.
Il bit rate è la quantità di passi sul ‘bastone di misura’ che misura l’ampiezza. 16 bit e 24 bit sono i più comuni, ma l’idea generale è che un bit rate più alto sia più preciso. 24 bit ha una gamma dinamica più alta di 16 bit, o una misurazione più precisa perché ha 24 unità di dati da misurare, contro solo 16 bit, che ha 6 passi in meno sulla scala.
Mentre questa può essere una leggera semplificazione eccessiva, si ottiene l’idea. Più bit è meglio. Una frequenza di campionamento più alta è più esatta.
Alcune frequenze di campionamento comuni sarebbero:
- 44.1 16 Bit (CD Quality)
- 48k 16bit (DVD-Video Quality)
- 96k 24 bit DVD-Audio Quality (DVD-A)
In studio 48k 24bit o 96k 24bit sono spesso usati come “studio quality” e poi downsampled successivamente. La maggior parte delle persone non vuole file WAV a 96k. È semplicemente troppo grande, e chi ascolta la “qualità migliore del CD” di questi tempi comunque. Forse gli audiofili e la gente da studio, ma molti ascoltano anche versioni mp3 o lossy. Hai bisogno che le tue canzoni suonino bene in tutti i formati, e farsi prendere da tutte le diverse versioni può essere una tana di coniglio in cui non vuoi andare. Un sacco di grande materiale è stato registrato a 44.1k, un sacco di materiale terribile è stato registrato a 192k (o anche più in alto!) ma questo non lo fa suonare meglio fin dall’inizio.
Analisi della qualità tramite il teorema di campionamento di Nyqust-Shannon
Il teorema di Nyqust o teorema di campionamento di Shannon è una formula matematica per determinare quale sia la massima frequenza teorica che puoi riprodurre usando diverse frequenze di campionamento. Il teorema di Nyquist afferma che le frequenze inferiori alla metà della frequenza di campionamento in kilohertz possono essere ricostruite. La gamma dell’udito umano può essere stimata in 20hz-20khz. Quindi, usando questa formula, 44.1k dovrebbe essere in grado di riprodurre bene fino al limite di 20k (detto questo, 20k è appena percettibile, e con 2.5k a 5k che si registrano ancora nelle aree “higher pitch”, 10k e 12k che sono penetranti, 20k non è una frequenza così utile quando si tratta di mixare l’audio).
Dibattito e conclusione
Nella mia esperienza, il bit rate (16 bit vs 24 bit) spesso fa più differenza per l’audio che la frequenza di campionamento (es. 44.1k vs 48k)
Per alcuni materiali 96k o 192k possono suonare un po’ meglio, ma l’enorme dimensione del file non ne vale la pena. Il materiale finirà per essere downsampling in mp3, e ci sono altre cose come il guadagno finale che contano di più. Controlla il guadagno di uscita del tuo file con un misuratore e assicurati di non essere in clipping, e lascia un po’ di headroom per i convertitori e il downsampling.
Perciò perché usare 96k? Assicurandoci che le frequenze fino a 40k siano coperte, abbiamo una versione molto accurata del suono che può essere usata per mixare fino a 44.1k o qualcosa di più ragionevole. La maggior parte dei plugin può usare 96k, e la maggior parte dei test di ascolto mostra una differenza di qualità tra 44.1k e 96k. Si possono usare 192k o anche di più, ma questo potrebbe essere discusso per quanto riguarda la qualità percepibile rispetto alla dimensione del file. Provate voi stessi.
Ci sono letteralmente centinaia di fattori che entrano nel suono della registrazione. La scelta e il posizionamento dei microfoni, i preamplificatori, la qualità del convertitore e l’anti-aliasing, il clocking, così come l’ambiente fisico, sono tutti fattori che giocano un ruolo importante nel cambiare il suono molto più di 48k contro 96k o 44.1 contro 48k. Quindi non preoccupatevi troppo.