- Pregunta: Formato de archivo WAV y AIFF: ¿cuál es la diferencia?
- Respuesta: AIFF y WAV son exactamente la misma calidad
- Entonces, ¿cuándo debe utilizar WAV / AIFF y cuándo debe utilizar MP3 / M4A, etc.?
- Cómo afecta el downsampling a la calidad del audio
- ¿Qué es un archivo WAV y cómo lo reproduzco?
- ¡Tanto WAV como AIFF utilizan el mismo método de codificación!
- Explicación de la codificación de WAV y AIFF
- Dado que los archivos WAV o AIFF son sin pérdidas, pueden ocupar MUCHO ESPACIO
- El apasionante mundo de la modulación por código de pulsos
- Algunas frecuencias de muestreo comunes serían:
- Análisis de calidad a través del teorema de muestreo de Nyqust-Shannon
- Debate y conclusión
- ¿Entonces AIFF vs WAV? ¿Cuál es mejor? Conclusión final: no hay absolutamente ninguna diferencia de calidad. Utiliza cualquiera de los dos. Yo diría que WAV es ligeramente más común.
Pregunta: Formato de archivo WAV y AIFF: ¿cuál es la diferencia?
¿Cuál es el mejor para el audio? Mp3 y Mp4, así como FLAC y otros formatos menos comunes hacen una pequeña porción de los archivos de audio por ahí también .. pero ¿Qué es mejor WAV o AIFF?
Respuesta: AIFF y WAV son exactamente la misma calidad
WAV se utiliza sobre todo para PC y AIFF se utiliza sobre todo para MAC, pero cualquiera de los dos se puede reproducir en prácticamente todos los tipos de ordenadores y dispositivos. Ambos utilizan el mismo tipo de codificación que da lugar a un tamaño de archivo relativamente grande, pero manteniendo un sonido de mayor calidad que el mp3 m4a u otros archivos más pequeños.
Entonces, ¿cuándo debe utilizar WAV / AIFF y cuándo debe utilizar MP3 / M4A, etc.?
Cuando le preocupa la velocidad y el pequeño tamaño del archivo, utilice mp3. Por ejemplo, en Internet o en un correo electrónico. Nadie quiere descargar un archivo de 50mB para escuchar una canción en su teléfono, o enviar una melodía rápida a un amigo. Si estás transmitiendo en un sitio web, o en Youtube, es probable que estés transmitiendo un formato de archivo con pérdidas similar al mp3. De hecho, el mp3 no es más que un archivo de vídeo, sin la parte de vídeo.
Cómo afecta el downsampling a la calidad del audio
Para ilustrar, imagine que la imagen superior es su archivo de audio de calidad completa, y la inferior es su mp3 con downsampling. La imagen inferior carece de la claridad percibida y la profundidad de campo de la imagen. Se trata de un concepto visual similar a la forma en que los mp3 y otros formatos con pérdidas son capaces de acercarse bastante al archivo original, pero carecen de los datos para representar completamente la forma de onda.
Imagen antes del downsampling de datos
Imagen después del downsampling de datos (compresión con pérdida de datos)
Esta imagen muestra cómo una imagen con downsampling puede ser de menor calidad que la original para ahorrar espacio. En general, tiene el mismo aspecto, pero una inspección más detallada muestra la pérdida de detalles. Al igual que un JPEG pixelado, los archivos de audio que tienen demasiada compresión con pérdidas pueden ser deslucidos y sonar como si les faltara el detalle de un archivo WAV o AIFF. La imagen superior representaría un WAV o AIFF, y la imagen inferior representaría un MP3 o Mp4, aunque la imagen no es una representación real, sino para ilustrar cómo la compresión afecta a la calidad.
¿Qué es un archivo WAV y cómo lo reproduzco?
Casi todos los teléfonos y ordenadores (incluidos los usuarios de Mac y Windows) pueden reproducir un archivo WAV. Generalmente, el AIFF puede ser reproducido en un producto Apple como el iphone u ordenador basado en Mac OS, pero casi cualquier reproductor multimedia como VLC o iTunes puede reproducir ambos. Desarrollado originalmente por IBM y Microsoft, los archivos Wave son un formato de audio en bruto de antes de que la gente tuviera Internet. Aunque es muy antiguo, el formato es muy básico, y es esencialmente una función matemática para describir una onda de sonido.
¡Tanto WAV como AIFF utilizan el mismo método de codificación!
Tanto AIFF como WAV se basan en el mismo IFF* (Interchange File Format) AVI, ANI y WAV utilizan RIFF (Resource Interchange File Format) una variante de IFF*, que se basa en trozos de datos que se denominan chunks. Existe el trozo de datos principal, así como el trozo de nombre, el trozo de artista, el trozo de copyright, etc., donde se pueden añadir datos adicionales para esas categorías. Además, los archivos WAV y AIFF pueden tener múltiples canales, desde un solo canal mono, hasta dos canales estéreo, 5.1 (seis canales), 8 canales o más.
*David señaló «…, AIFF no deriva de RIFF. Tanto el AIFF como el RIFF derivan del IFF, lanzado por Electronic Arts en 1985. Además, el AIFF precedió al RIFF en 3 años. No puede basarse en el RIFF. Son muy similares»
*¡Gracias por la corrección David! Así pues, AIFF se deriva de IFF, WAV utiliza RIFF, que también se deriva de IFF ( ¡Gracias por la aclaración!)
Explicación de la codificación de WAV y AIFF
Tanto AIFF como WAV son formatos de archivo sin pérdidas, es decir, no hay pérdida de datos. El formato de archivo difiere ligeramente, pero la información digital se almacena como una representación matemática exacta de la forma de onda. Tanto WAV como AIFF utilizan PCM (Pulse Code Modulation) para codificar los datos de forma que se minimice la pérdida de calidad. Tanto WAV como AIFF tienen calidad de CD o «calidad de estudio», siendo el CD de 16 bits y la «calidad de estudio» de 24 bits o más. La regla general es que si grabas a 16 bits, renderiza los archivos a 16 bits. Si grabas a 24 bits, renderiza tus mezclas a 24 bits. Los archivos siempre pueden reducirse a una tasa de bits inferior. Por ejemplo, los archivos de 24 bits pueden ser fácilmente reducidos a 16, pero una vez que estás en 16, volver a 24 bits es bastante inútil.
Dado que los archivos WAV o AIFF son sin pérdidas, pueden ocupar MUCHO ESPACIO
Tanto WAV como AIFF pueden ser codificados con marcas de tiempo, información de tempo, y otros tipos de información como marcadores. Pro Tools o Logic pueden crear WAV o AIFF. Según las «fuentes» de Internet, la diferencia es el orden de los bytes. El AIFF está optimizado para los procesadores Motorola, y los archivos WAV están optimizados para los microprocesadores Intel, pero en realidad no hay ninguna diferencia en el rendimiento.
El apasionante mundo de la modulación por código de pulsos
La modulación por código de pulsos es una forma matemática de representar digitalmente las señales analógicas. Se utiliza en dispositivos de audio digital. La amplitud (también conocida como nivel de energía o volumen de un sonido) se mide en diferentes puntos. La cantidad de veces que se mide la amplitud por segundo se denomina frecuencia de muestreo. Por ejemplo, una frecuencia de muestreo de 44,1k significa que se capturan 44.100 muestras por segundo. Para 96k, se miden 96.000 veces por segundo el sonido.
La tasa de bits es la cantidad de pasos en la «vara de medir» que mide la amplitud. 16 bits y 24 bits son los más comunes, pero la idea general es que una mayor tasa de bits es más precisa. 24 bits tiene un mayor rango dinámico que 16 bits , o una medición más precisa porque tiene 24 unidades de datos para medir, frente a sólo 16 bits, que tiene 6 pasos menos en la escala.
Aunque esto puede ser una ligera simplificación, se entiende la idea. Más Bits es mejor. Una frecuencia de muestreo más alta es más exacta.
Algunas frecuencias de muestreo comunes serían:
- 44.1 16 bits (calidad de CD)
- 48k 16bit (calidad de DVD-Vídeo)
- 96k 24 bits calidad de DVD-Audio (DVD-A)
En el estudio se suelen utilizar 48k 24bit o 96k 24bit como «calidad de estudio» y luego se hace un downsample. La mayoría de la gente no quiere archivos WAV de 96k. Es demasiado grande, y quién escucha «mejor que la calidad del CD» hoy en día. Tal vez los audiófilos y la gente de los estudios, pero muchos también escuchan mp3 o versiones con pérdidas. Necesitas que tus canciones suenen bien en todos los formatos, y meterte en todas las versiones puede ser una madriguera en la que no quieres entrar. Un montón de material excelente se ha grabado a 44,1k, un montón de material terrible se ha grabado a 192k (¡o incluso más!), pero eso no hace que suene mejor si no es bueno desde el principio.
Análisis de calidad a través del teorema de muestreo de Nyqust-Shannon
El teorema de Nyqust o teorema de muestreo de Shannon es una fórmula matemática para determinar cuál es la frecuencia máxima teórica que se puede reproducir utilizando diferentes frecuencias de muestreo. El teorema de Nyquist establece que se pueden reconstruir las frecuencias por debajo de la mitad de la frecuencia de muestreo en kilohercios. El rango del oído humano puede estimarse en 20hz-20khz. Así que usando esa fórmula, 44,1k debería ser capaz de reproducir bien hasta el límite de 20k (dicho esto, 20k es apenas perceptible, y con 2,5k a 5k todavía registrando en las áreas de «tono más alto», siendo 10k y 12k penetrantes, 20k no es tan útil de una frecuencia cuando se trata de mezclar audio).
Debate y conclusión
En mi experiencia, la tasa de bits (16 bits vs 24 bits) a menudo hace más diferencia en el audio que la tasa de muestreo (por ejemplo, 44,1k vs 48k)
Para algunos materiales 96k puede o 192k puede sonar un poco mejor, pero el enorme tamaño del archivo no vale la pena. El material acabará siendo muestreado a mp3, y hay otras cosas como el escalonamiento de la ganancia final que importan más. Comprueba la ganancia de salida de tu archivo con un medidor y asegúrate de que no estás recortando, y deja un poco de margen para los convertidores y el downsampling.
Entonces, ¿por qué usar 96k? Al asegurar que se cubren las frecuencias hasta 40k, tenemos una versión muy precisa del sonido que se puede utilizar para mezclar a 44,1k o algo más razonable. La mayoría de los plugins pueden utilizar 96k, y la mayoría de las pruebas de escucha SÍ muestran la diferencia de calidad entre 44,1k y 96k. Se puede utilizar 192k o incluso más, pero eso podría ser debatido en cuanto a la calidad perceptible frente al tamaño del archivo. Pruébelo usted mismo.
Hay literalmente cientos de factores que intervienen en el sonido de la grabación. La elección y colocación del micrófono, los preamplificadores, la calidad del convertidor y el antialiasing, el clocking, así como el entorno físico, todos ellos juegan un papel importante, haciendo que los cambios en el sonido sean mucho mayores que 48k vs 96k o 44.1 vs 48k. Así que no te preocupes demasiado.