- Question: WAV e AIFF: Qual é a diferença?
- Resposta: AIFF e WAV são exatamente da mesma qualidade
- Então quando deve usar WAV / AIFF e quando deve usar MP3 / M4A etc?
- Como o Downsampling afeta a qualidade de áudio
- O que é um arquivo WAV e como eu o reproduzo?
- Both WAV e AIFF usam o mesmo método de codificação!
- Codificação AIFF Explained Further
- Desde que os arquivos WAV ou AIFF sejam sem perdas, eles podem ocupar um MONTE de S P A C E !
- O emocionante mundo da Modulação de Código de Pulso
- Algumas taxas de amostragem comuns seriam:
- Análise de Qualidade via Nyqust- Shannon Sampling Theorem
- Debate e Conclusão
- Então AIFF vs WAV? O que é melhor? Conclusão final: não há absolutamente nenhuma diferença na qualidade. Use também. Eu diria que WAV é um pouco mais comum.
Question: WAV e AIFF: Qual é a diferença?
Qual é o melhor formato de ficheiro de áudio? Mp3 e Mp4 assim como FLAC e outros formatos menos comuns fazem também uma pequena parte dos ficheiros de áudio por aí… mas Qual é o melhor WAV ou AIFF?
Resposta: AIFF e WAV são exatamente da mesma qualidade
WAV é usado principalmente para PCs e AIFF é usado principalmente para MAC, mas ambos podem ser reproduzidos em praticamente todos os tipos de computadores e dispositivos. Ambos usam o mesmo tipo de codificação que resulta num ficheiro relativamente grande, mas mantendo um som de qualidade superior ao mp3 m4a ou outros ficheiros mais pequenos.
Então quando deve usar WAV / AIFF e quando deve usar MP3 / M4A etc?
Quando estiver preocupado com a velocidade e tamanho de ficheiro pequeno, use mp3. Por exemplo, na Internet, ou num e-mail. Ninguém quer baixar um arquivo de 50mB para ouvir uma música no telefone, ou mandar uma música rápida para um amigo. Se você está transmitindo em um site, ou no youtube, é provável que esteja transmitindo um arquivo com perdas no formato similar ao mp3. Na verdade, mp3 é apenas um arquivo de vídeo, sem a parte de vídeo.
Como o Downsampling afeta a qualidade de áudio
Para fins ilustrativos, imagine que a imagem superior é o seu arquivo de áudio de qualidade total, e a inferior é o seu mp3 downsampled. A imagem inferior não tem a percepção de clareza e profundidade de campo da imagem. Este é um conceito visual similar a como os mp3s e outros formatos com perdas são capazes de chegar bem perto do arquivo original, mas faltam os dados para representar completamente a forma de onda completa.
Image before Downsampling Data
Image after Downsampling Data (Lossy Data Compression)
Esta imagem mostra como uma imagem com downsampled pode ser de menor qualidade que a original para economizar espaço. Geralmente, ela parece mais ou menos a mesma, mas uma inspeção mais detalhada mostra perda de detalhes. Tal como um JPEG pixelizado, os ficheiros de áudio que têm demasiada compressão com perda podem não ter brilho e soar como se não tivessem o detalhe de um ficheiro WAV ou AIFF. A imagem superior representaria uma WAV ou AIFF, e a imagem inferior representaria um MP3 ou Mp4, embora a imagem não seja uma representação real, mas para ilustrar como a compressão afeta a qualidade.
O que é um arquivo WAV e como eu o reproduzo?
A maioria dos telefones e computadores (incluindo Macs e usuários do Windows) pode reproduzir um arquivo WAV. Geralmente, AIFF pode ser reproduzido num produto Apple como o iphone Mac OS, mas quase todos os media player como VLC ou iTunes irão reproduzir ambos. Originalmente desenvolvidos pela IBM e Microsoft, os arquivos Wave são um formato de áudio bruto de antes das pessoas terem a internet. Embora seja muito antigo, o formato é muito básico, e é essencialmente uma função matemática para descrever uma onda sonora.
Both WAV e AIFF usam o mesmo método de codificação!
Both AIFF e WAV são baseados no mesmo IFF* (Interchange File Format) AVI, ANI, e WAV todos usam RIFF(Resource Interchange File Format) um sabor de IFF*, que é baseado em pedaços de dados que são referidos como pedaços de dados. Há o pedaço de dados principal, assim como o nome do pedaço, pedaço de artista, pedaço de copyright, etc, onde dados adicionais podem ser adicionados para essas categorias. Além disso, os ficheiros WAV e AIFF podem ter vários canais, desde apenas um canal mono, até dois canais estéreo, 5.1 (seis canais), 8 canais ou mais.
*A AIFF não é derivada do RIFF. Ambos AIFF e RIFF foram derivados da IFF, lançada pela Electronic Arts em 1985. Além disso, AIFF precedeu a RIFF por 3 anos. Ela não pode ser baseada na RIFF. Eles são muito parecidos.”
* Obrigado pela correção David! Assim, AIFF é derivado de IFF, WAV usa RIFF que também é derivada de IFF ( Obrigado pelo esclarecimento!)
Codificação AIFF Explained Further
Both AIFF e WAV são formatos de arquivo sem perdas, em outras palavras, não há perda de dados. O formato do arquivo difere ligeiramente, mas a informação digital é armazenada como uma representação matemática exata da forma de onda. WAV e AIFF usam ambos PCM (Pulse Code Modulation) para codificar os dados de forma a minimizar a perda de qualidade. WAV ou AIFF são ambos qualidade de CD ou “qualidade de estúdio”, sendo o CD de 16 bits e normalmente “qualidade de estúdio” de 24 bits ou superior. A regra geral é se você gravar a 16 bits, renderizar os arquivos a 16 bits. Se gravar a 24 bit, renderize as suas mixagens a 24 bit. Os ficheiros podem sempre ser reduzidos para uma taxa de bits mais baixa. Por exemplo 24 bit podem ser facilmente reduzidos para 16, mas uma vez que você esteja em 16, voltar para 24 bit é bastante inútil.
Desde que os arquivos WAV ou AIFF sejam sem perdas, eles podem ocupar um MONTE de S P A C E !
Both WAV e AIFF podem ser codificados com timestamps, informações de tempo, e outros tipos de informações como marcadores. Pro Tools ou Logic podem criar WAV ou AIFFs. De acordo com as “fontes” da Internet a diferença é a ordem dos bytes. Com AIFF sendo otimizado para processador de motorola, e arquivos WAV otimizados para microprocessadores baseados em Intel, mas realmente não há diferença no desempenho.
O emocionante mundo da Modulação de Código de Pulso
A modulação de código de pulsos é uma forma matemática de representar sinais analógicos digitalmente. Ela é usada em dispositivos de áudio digital. A amplitude (também conhecida como o nível de energia ou a sonoridade de um som) é medida em diferentes pontos. A quantidade de vezes que a amplitude é medida por segundo é chamada de taxa de amostragem. Por exemplo, 44,1k de taxa de amostragem, significa que 44.100 amostras por segundo são capturadas. Para 96k, 96.000 vezes por segundo o som é medido.
Bit rate é a quantidade de passos na ‘vara de medição’ que mede a amplitude. 16 bits e 24 bits são os mais comuns, mas a idéia geral é que uma taxa de bits mais alta é mais precisa. 24 bits tem uma faixa dinâmica maior que 16 bits, ou medição mais precisa porque tem 24 unidades de dados para medir, contra apenas 16 bits, que tem 6 passos a menos na escala.
Embora esta possa ser uma pequena simplificação, você tem a idéia. Mais Bits é melhor. Uma maior taxa de amostragem é mais exata.
Algumas taxas de amostragem comuns seriam:
- 44,1 16 bits (Qualidade de CD)
- 48k 16 bits (Qualidade de DVD-Vídeo)
- 96k 24 bits Qualidade de DVD-Audio (DVD-A)
No estúdio 48k 24bit ou 96k 24bit são muitas vezes usados como “qualidade de estúdio” e depois amostrados mais tarde. A maioria das pessoas não quer arquivos WAV 96k. É simplesmente muito grande, e quem ouve “melhor que a qualidade de CD” hoje em dia de qualquer forma. Talvez audiófilos e pessoas de estúdio, mas muitos também ouvem versões mp3 ou com perdas. Você precisa que suas músicas soem bem em todos os formatos, e ficar preso em todas as diferentes versões pode ser uma toca de coelho que você não quer ir para baixo. Muito material excelente foi gravado a 44.1k, muito material terrível foi gravado a 192k (ou até mais!) mas não o faz soar melhor, não é bom desde o início.
Análise de Qualidade via Nyqust- Shannon Sampling Theorem
Nyqust Theorem ou Shannon Sampling theorem é uma fórmula matemática para determinar qual a frequência máxima teórica que você pode reproduzir usando diferentes taxas de amostragem. O teorema de nyquist afirma que frequências abaixo da metade da taxa de amostragem em kilohertz podem ser reconstruídas. O intervalo da audição humana pode ser estimado em 20hz-20khz. Assim, usando essa fórmula, 44,1k deve ser capaz de reproduzir bem até o limite de 20k (dito isto, 20k é pouco perceptível, e com 2,5k a 5k ainda registrando nas áreas de “tom mais alto”, 10k e 12k sendo piercingamente alto, 20k não é tão útil de uma freqüência quando se trata de mixagem de áudio).
Debate e Conclusão
Na minha experiência, a taxa de bits (16 bit vs 24 bit) muitas vezes faz mais diferença para o áudio do que a taxa de amostragem (ex. 44,1k vs 48k)
Para algum material 96k pode ou 192k pode soar um pouco melhor, mas o enorme tamanho do arquivo não vale a pena. O material acabará sendo reduzido para mp3, e há outras coisas como o ganho final que importam mais. Verifique o ganho de saída do seu arquivo com um medidor e certifique-se de que você não está cortando, e deixando um pouco de espaço para os conversores e downsampling.
Então por que usar 96k de todo? Ao garantir que frequências até 40k são cobertas, temos uma versão muito precisa do som que pode ser usada para misturar até 44.1k ou algo mais razoável. A maioria dos plugins pode usar 96k, e a maioria dos testes de escuta DO mostram diferença de qualidade entre 44.1k e 96k. 192k podem ser usados ou até mais, mas isso pode ser debatido até onde a qualidade perceptível vs tamanho do arquivo. Experimente você mesmo.
Existem literalmente centenas de fatores que entram no som da gravação. A escolha e colocação do microfone, pré-amplificadores, qualidade do conversor e anti-aliasing, relógio, assim como o ambiente físico, todos desempenham um papel muito maior do que 48k vs 96k ou 44.1 vs 48k no som. Então não se preocupe muito.