Audio Digital: Una guía básica no técnica (o no tanto)
April 22, 2011
ESTO ES UN DRAFT PERO PREFIERO COMPARTIRLO DE UNA VEZ E IR ADAPTANDO POCO A POCO EL CONTENIDO
¿Tienes o vas a comprar un sistema de audio de buena calidad?, ¡leer esto te va a ayudar!
- Descripción y comparación de formatos de audio
- Diferencia entre equipos que hacen ruido y equipos de calidad – PENDIENTE -
- Como escuchar audio 24/96
He decidido escribir este artículo para compartir algunos de mis hallazgos en cuestiones musicales, aclaro que no soy un profesional del audio ni nada por el estilo, solamente un usuario más que gusta de escuchar buenas grabaciones de audio.
Entendiendo la forma del audio
Todos hemos visto alguna vez en la escuela o en reproductores de audio una manera de ver una representación “gráfica” de la música que estamos escuchando: (barras de frecuencia o una representación en ondas)
|
Bandas de frecuencia |
Ondas |
|
|
|
Pondremos especial atención en las “Ondas” porque es así como en verdad el audio es procesado tanto por nuestros oídos como por los sistemas digitales.
Por simplicidad hablaré brevemente de las características que nos importan en este momento sobre las ondas, y para hacerlo más simple solamente comentaré sobre las ondas de una sola frecuencia, es decir las ondas sinuidales a diferencia de las ondas armónicas que ya requieren adentrarnos en cuestiones de matemáticas; Si desean más detalles les recomiendo entrar a este artículo de Wikipedia.
Una onda está compuesta de varias partes, el monte es la parte superior de la onda, mientras que el valle es la parte inferior.
Se le llama periodo al momento en que una onda completa un ciclo completo (valga la redundancia), es decir “sube, baja y sube”( cuando va de un monte a un valle y de ahí al siguiente monte), o “baja, sube y baja” (cuando va de un valle a un monte y de ahí al siguiente valle); a este periodo lo llamaremos frecuencia.

Dado lo anterior podemos ver que la frecuencia equivale a un periodo o un ciclo de una onda y para poder medir la cantidad de ciclos que hay en el audio (y en otras muchas cosas) se mide la cantidad de estos ciclos que ocurren en el transcurso de un segundo y a esta medida la llamaremos Herz o con su abreviación “Hz”.
Por poner un ejemplo, descuelguen su teléfono y escuchen el tono que da, pueden notar que siempre es el mismo “tuuuuuuuuuu”, este sonido es un sonido sinoidal, que siempre mantiene la misma frecuencia.
Entonces por el párrafo anterior, sabemos que un Herz equivale a un solo ciclo de una onda en un segundo, 1000 Herz (o 1Khz) equivalen a 1,000 ciclos por segundo, 1,000,000 Herz (o 1Mhz) equivalen a 1,000,000 ciclos por segundo. ¡¿Quedó claro?!, Entre mayor sea la frecuencia, más agudo será el sonido, por lo tanto entre menor sea la frecuencia el sonido tenderá a ser más grave.
En la vida cotidiana estamos expuestos a una inmensa fuente de sonidos, ya sea el perro de la calle, el vecino con su martillo, la lavadora, el televisor, etc; Cada uno de estos produciendo sonido a diferentes frecuencias y volúmenes, dando como resultado ondas de todos colores y sabores.

Esta es la forma en que se produce una onda de una tecla de piano, ¡¿Son muchos Herz no?! Y ¡Cada uno tiene su propio tono!
Audio digital
En la actualidad las computadoras, reproductores de CD, DVD, Bluray e incluso teléfonos utilizan un formato conocido como PCM (Pulse-code modulation) para codificar o decodificar el audio de forma digital.
La función de PCM es la de representar digitalmente una onda análoga de audio, para lograr este objetivo existe un proceso que se llama “Cuantización” (Quantization en inglés) el cual consiste en rellenar o marcar cada onda de audio en intervalos regulares (horizontales) con el objetivo de conseguir una representación digital, esto se hace desde el origen de la onda hasta el monte o hasta el valle.
La siguiente imagen representa la cuantización de 4 bits de una onda (en color rojo):

Se usan hasta 4 bits para representar una marca, comenzando en el origen con “7″ que se puede representar como “0100b”, el monte con el valor de “15″ como “1111b” y el valle con el valor de “0″ como “0000b”.
De esta manera, cada onda, cada Herz de una muestra de audio es procesada tanto en la grabación como en la reproducción y es lo que hace que podamos escuchar la música desde nuestros CDs o reproductores portátiles, ¡Esto se hace por una vez por cada Herz!, ¡Mil veces en un Khz!.
El CD (Compact Disc / Disco compacto)
El medio más común en el que encontramos música digital (independientemente de los archivos multimedia) es el CD; Muchas personas creen que el CD es el formato de música que más calidad puede ofrecer en un sistema de audio HiFi pero esto no es del todo correcto ya que tiene sus limitantes.
Los CDs por ser medios digitales están sujetos a las mismas reglas de codificación del audio de PCM que tratamos en la sección anterior, las especificaciones para la producción de un CD se encuentran definidas en el “Red book” y entre las características que necesitamos conocer son:
| Canales de grabación: | 2 |
| Muestreos por segundo: | 44,100 |
| Bits por muestreo: | 16 |
Esto quiere decir que una onda se muestrea 44,100 veces con hasta 16 bits por muestreo (65,536 distintos posibles valores o marcas) y esto por cada canal de audio, dando como resultado:
| Bits por muestreo | Muestreos por Segundo | Bit rate de dos canales (estereo) | Tamaño de 1 minuto de audio |
| 16 | 44,100 | 1.35 Mb/s | 10.1 Mb |
Al momento de digitalizar una fuente de audio analógica, aunque sea a un CD, se sufrirá pérdida en la calidad, es minúscula, tan pequeña que en verdad no tiene un peso real, por poner un ejemplo llano, podemos verlo de la siguiente manera:
| Fuente de audio original | Audio grabado en CD |
![]() |
![]() |
Como podemos apreciar se toman demasiadas variantes y demasiadas muestras por cada segundo de audio, logrando con esto que el sonido digital tenga alta fidelidad contra la muestra original que fue digitalizada, pero aun así esta fidelidad no es absoluta, ni garantiza que la calidad de la grabación sea muy buena.
Para permitir identificar la manera en que los CDs son grabados o producidos se utilizaba (todavía se utiliza pero no es tan común ahora), un código llamado “SPARS“.
Con este código se pretendía ilustrar al comprador de un cd la manera en que se produjo y con esto tener una especie de idea sobre la calidad de la pieza, sin embargo cayó en desuso por confusiones y anomalías en su utilización, pero las coloco aquí para que en caso de que las vean, sepan de qué trata:
| Grabación Inicial | Mezcla y Edición | Producción digital* | Acrónimo |
| Análoga | Análoga | Digital | AAD |
| Análoga | Digital | Digital | ADD |
| Digital | Digital | Digital | DDD |
| Digital | Análoga | Digital | DAD |
* Por tratarse de un medio completamente digital, siempre la última letra será “D”

Ahora es importante mencionar que no es posible guiarse en este acrónimo para identificar una buena grabación de una mala ya que pueden llegar a encontrar grabaciones “DDD” pésimas, o grabaciones “AAD” asombrosas.
Formatos de audio digitales
Actualmente existen muchos formatos de audio que pueden contener música, todos conocemos al menos uno de ellos (MP3, AAC, WMA, MP4, OGG, FLAC, etc).
Cada uno de estos formatos de audio presentan características particulares por lo que tienen sus pros y contras; No voy a ahondar entre las bondades de uno u otro formato, pero si hablaré sobre la compresión.
Formatos de audio con compresión con pérdida
De acuerdo a Wikipedia, se denomina algoritmo de compresión con pérdida a cualquier procedimiento de codificación que tenga como objetivo representar cierta cantidad de información utilizando una menor cantidad de la misma, siendo imposible una reconstrucción exacta de los datos originales.
Algunos formatos con compresión con pérdida permiten almacenar aparentemente la misma información (audio o imágenes) ocupando un espacio mucho menor que la fuente original.
Tomando como ejemplo el CD (y la tabla vista anteriormente) un minuto de audio ocupa 10.01 Mb, entonces una canción de 3 minutos ocupará 30.03 Mb.
Formatos de audio como MP3 de 128Kb/s permitirá grabar los mismos tres minutos de audio en un archivo mucho menor, de 2.82Mb, menos del 90% que su contraparte original de CD.
| Audio grabado en CD | Audio en compresión con pérdida |
![]() |
![]() |
Esta compresión se logra quitando del audio las partes de la música que escapan de la percepción del oído humano, es decir las frecuencias muy altas o muy bajas; Este proceso que podemos llamar “downsampling” (reducir el muestreo), causará que NUNCA podamos volver a tener la misma calidad que el archivo original.
Si pudiéramos “ver” la música con pérdida, veríamos algo muy parecido a esto:
| Fuente original | Compresión mínima | Compresión mediana | Alta compresión |
![]() |
![]() |
![]() |
![]() |
En estas imágenes, la compresión con pérdida se realizó guardando las imágenes cada vez con una menor cantidad de bits; En el caso de las imágenes los bits se utilizan para representar la cantidad de variaciones de color que hay en cada pixel, en el caso del audio son la cantidad de bits que se tomarán en cada muestreo.
Si intentamos tener una imagen con la misma calidad que la original a partir de una imagen comprimida, JAMAS lo lograremos, la información ya se perdió. El mismo principio aplica con el audio.
Formatos de audio con compresión sin pérdida
Un formato de compresión sin pérdida, nos permitirá comprimir la fuente original pero también nos permitirá descomprimirla y con esto volver a tener la fuente original, sin ningún cambio.
En el caso del audio, esto quiere decir que podremos comprimir nuestros CDs de música para que ocupe poco espacio en disco y al momento de reproducirla, esta será descomprimida automáticamente y tendrá exactamente la misma calidad que la fuente original (nuestro CD).
¿Un ejemplo práctico de compresión sin pérdida?, imaginemos un archivo de texto que mide aproximadamente 1Mb (1,000,994 bytes) y como es grande no podemos enviarlo por correo. Debemos comprimirlo.
![]() |
![]() |
Tenemos los hash MD5 y SHA-1 (es el resultado matemático de aplicar un algoritmo a un archivo, el cual nos da algo así como la huella digital que es única para el).
Utilizando alguna herramienta de compresión como Winzip o WinRAR hacemos lo debido, lo comprimimos, ¡y ahora el archivo mide solamente 3,013 bytes!

Ahora como esta es compresión sin pérdida, cuando lo descomprimamos obtendremos nuevamente una representación de la fuente original:
![]() |
![]() |
Como podemos ver, volvimos a recrear el archivo fuente a partir de un archivo comprimido, y es exactamente igual, el archivo mide lo mismo (1,000,994 bytes) y su hash MD5 y SHA-1 son exactamente iguales.
Como mencioné anteriormente, ¡el mismo principio aplica al audio!, existen formatos de audio como FLAC, Apple Loseless, WMA Loseless, APE (entre otros) y estos nos permitirán comprimir nuestra música sin pérdida, con lo que al reproducirla se escuchará exactamente igual que la fuente original.
| Fuente de audio original (o de CD) | Compresión sin pérdida (igual al original) |
![]() |
![]() |
Audio de verdadera alta fidelidad
Es común escuchar o leer que algún audiófilo menosprecia la calidad del audio digital, porque no tiene la misma profundidad, atmósfera, transparencia, presencia, impacto, enfoque, resonancia, etc, etc, es cierto.
¿¡Por qué ocurre esto si la música está siendo procesada digitalmente!?… Aquí viene el rollo.
La música y cualquier sonido por naturaleza tiene un espectro muy amplio de frecuencias, mucho más amplio del que nosotros los humanos podemos percibir, ¿Han visto los silbatos para perros?, estos emiten frecuencias muy altas que son inaudibles para un ser humano, pero ponen locos a los perros.
El aparato auditivo del ser humano es muy limitado en comparación con algunos animales, solamente permite escuchar sonidos que van de los 12Hz a los 23,000Hz y esto en el caso de los niños, porque los adultos conforme van creciendo su rango auditivo se reduce hasta los 16,000Hz (los rangos varían de persona a persona).
Audio analógico
La preferencia de los audiófilos es el reproducir discos de vinil en sistemas completamente (o en su mayoría) analógicos, en los que no se encuentran transistores para realizar la amplificación sino los bulbos (y bulbos realmente caros).
Prefieren reproducir discos de vinil y además en sistemas analógicos porque estos discos llegan a contener frecuencias de hasta 50Khz, permitiendo un espectro mucho más amplio para escuchar la música.
¿¡Pero entonces por qué quieren escuchar hasta 50Khz si dijimos que el humano solo alcanza a escuchar hasta los 20Khz!?, ¡¡Solamente un murciélago audiófilo podría lograr escuchar todo ese rango de frecuencias!!

La respuesta es simple pero a la vez puede parecer un mito, ¡no es necesario ser murciélago para apreciar las bondades de escuchar la música a estas frecuencias!.
El hecho es que además de escuchar la música, también “se puede sentir”, un ejemplo muy común es cuando una canción tiene muchos graves, sentimos el “bum bum” del subwoofer; Lo mismo ocurre con otras frecuencias que son más altas.
Al ser un medio completamente analógico, no existe ningún rango digital que limite la cantidad de muestras tomadas y la cantidad de bits que tiene cada una de ellas, con esto permitiendo “sentir” todas esas características (profundidad, atmósfera, transparencia, presencia, impacto, enfoque, resonancia, etc), claro, también requieres algunas bocinas que cuestan lo mismo que un departamento o un buen auto.
¿Es/será posible tener calidad similar pero digital?, sí.
Audio a 24bits y 96Khz (24/96) (o superiores)
¿Recuerdan el tema de PCM y como se guarda digitalmente la música?, si, nuevamente caemos en el tema de los bits y los Herz,
Utilizando la misma técnica de PCM es posible contar con una mayor cantidad de muestreos y bits en el audio, el objetivo es justamente mejorar la calidad del sonido reduciendo la cantidad de escalones que tiene el muestreo.
Un ejemplo común que encontramos en cuestiones gráficas son los DPI (Dots Per Inch o Puntos Por Pulgada), entre mayor sea la cantidad de DPIs en una imagen, mejor será su resolución, por ejemplo tenemos esta comparación entre iPod 3 e iPod4:

Entonces si se incrementa la cantidad de bits y la cantidad de muestreos, podemos calcular las implicaciones en cuestión de tamaño del audio con esta calidad:
| Bits por muestreo | Muestreos por Segundo | Bit rate de dos canales (estereo) | Tamaño de 1 minuto de audio | |
| CD | 16 | 44,100 | 1.35 Mb/s | 10.1 Mb |
| 24/96 | 24 | 96,000 | 4.39 Mb/s | 33.0 Mb |
¡Cómo se puede ver, el tamaño que ocupa un archivo con esta calidad es más de tres veces superior que su contraparte en CD estándar!
¿Cómo o donde reproducir archivos de 24 bits y 96Khz (o 192Khz)?
Primeramente deberás conseguir audio grabado de esta manera, existen algunas opciones tanto legales como de las otras… (intenten buscando alguna de estas opciones: 24-96, 96khz, vinyl)
Estos archivos generalmente se consiguen en formato FLAC, en el sitio www.hdtracks.com se puede conseguir un “sampler” gratis, también se pueden comprar álbumes grabados con estas características.
Reproducir el audio en la computadora
Deberás tener una tarjeta de audio que soporte estas características, podrás saberlo si revisas en la configuración de tu tarjeta.

Desde luego deberás tener un buen juego de bocinas o audífonos si quieres percibir una diferencia significativa.
En un sistema de teatro en casa o un amplificador
Hoy en día la mayor parte de los equipos de teatro en casa, o amplificadores permiten reproducir audio con estas frecuencias, por lo menos asegúrate que tenga entrada para cable óptico o coaxial.
Actualmente existen algunos Bluray de audio que se encuentran grabados en frecuencias de 24/88 o 24/96, la cuestión es encontrar donde los vendan…
Otra opción es conectar la computadora (o laptop) vía cable de fibra óptica o HDMI al amplificador.
Si se utiliza un cable de fibra óptica, se deberá configurar la tarjeta de audio de la PC para que envíe el audio en formato 24/96 (o el formato que el amplificador pueda procesar).
Si se utiliza un cable HDMI, en Windows aparecerá automáticamente un nuevo dispositivo de reproducción, en este caso el amplificador.
![]() |
![]() |
|
Aparece el amplificador (TX-SR606) |
Lo establecemos como default |
Deberemos acceder a la configuración para realizar ajustes similares a los hechos con la tarjeta de fibra óptica:
![]() |
![]() |
| Configura |
IMPORTANTE: Indistintamente si se hace con fibra óptica o con cable HDMI, es muy recomendado deshabilitar cualquier opción que modifique el sonido o que lo optimice, ya sea agregar eco, efectos sonoros, reducción de ruido, etc, de lo contrario no se podrá gozar el audio en esta resolución.
El último paso es contar con un programa en la PC que pueda decodificar los archivos FLAC y por ende reproducir el audio, en mi caso uso “Media Monkey” y esta es la manera como se ve, reproduciendo una canción del sampler de www.hdtracks.com:

Al final podremos ver en nuestro amplificador que efectivamente se está reproduciendo el audio en esta frecuencia:

Sin duda notarán la diferencia en la definición tan clara de los agudos y de los graves.
¡Espero que les haya sido de utilidad!
¿Quieres comparar formatos de audio de 16bits/44.1Khz, 24bits/96Khz y 24/192Khz?
http://www.soundkeeperrecordings.com/format.htm



































