introducción al audio digital

3
 Introducción al audio digital. Como se representa el sonido en una computadora . Antes de discutir acerca de la representación digital del sonido debemos aclarar como es el sonido desde un punta de vista físico. Sonido es una onda mecánica, de presión de aire. Esta onda alcanza periódicamente una presión mínima y una presión máxima, lo que determina la frecuencia  del sonido. Los sonidos mas agudos tienen una frecuencia mayor mientras que los sonidos graves alternan los picos de presión a intervalos de tiempo mayores y tienen por lo tanto una frecuencia menor. El volúmen del sonido está determinado por la cantidad de aire que es desplazado por el mismo. Por lo tanto, un tono puro es una onda simple y se ve como una de las dos ondas de la figura 1. Fig.1: Tonos simples. Es interesante notar que cuando dos o tres tonos simples son combinados, se forma un tono complejo como se ve en la figura 2. Fig.2: Dos y tres tonos simples combinados para formar un tono complejo. Para trabajar con audio en una computadora, es necesario capturar el mismo con un micrófono; o generarlo en un sintetizador de sonido. En el caso de la captura con micrófono, las ondas de presión de aire son convertidas en una señal electromagnética. Esta señal es enviada luego a un dispositivo electrónico llamado conversor analógico

Upload: emanuel-romero-scebba

Post on 05-Oct-2015

224 views

Category:

Documents


0 download

DESCRIPTION

zxc

TRANSCRIPT

  • Introduccin al audio digital.

    Como se representa el sonido en una computadora.

    Antes de discutir acerca de la representacin digital del sonido debemos aclarar como es el sonido desde un punta de vista fsico.

    Sonido es una onda mecnica, de presin de aire. Esta onda alcanza peridicamente una presin mnima y una presin mxima, lo que determina la frecuencia del sonido. Los sonidos mas agudos tienen una frecuencia mayor mientras que los sonidos graves alternan los picos de presin a intervalos de tiempo mayores y tienen por lo tanto una frecuencia menor. El volmen del sonido est determinado por la cantidad de aire que es desplazado por el mismo. Por lo tanto, un tono puro es una onda simple y se ve como una de las dos ondas de la figura 1.

    Fig.1: Tonos simples.

    Es interesante notar que cuando dos o tres tonos simples son combinados, se forma un tono complejo como se ve en la figura 2.

    Fig.2: Dos y tres tonos simples combinados para formar un tono complejo.

    Para trabajar con audio en una computadora, es necesario capturar el mismo con un micrfono; o generarlo en un sintetizador de sonido. En el caso de la captura con micrfono, las ondas de presin de aire son convertidas en una seal electromagntica. Esta seal es enviada luego a un dispositivo electrnico llamado conversor analgico

  • digital, que la convierte en una serie de nmeros enteros o decimales. Una onda es una curva contnua, mientras que una cantidad de nmeros tratando de representar dicha onda reduce necesariamente algo de la complejidad de esa curva, como se ve en la figura 3.

    La representacin de ondas sonoras en archivos de audio no comprimidos (WAV o AIFF) se realiza midiendo la amplitud de la misma a intervalos regulares de tiempo (generalmente muchas veces por segundo) y convirtiendo esa medida en un nmero binario de cierto tamao. Cada medicin es llamada una muestra, y al proceso entero se lo conoce como muestreo (o sampling). Esto genera una representacin de la onda mediante porciones de valores discretos. Estos factores, la cantidad de mediciones por segundo o frecuencia de muestreo (sampling rate) y la precisin con que se realiza la medicin, o resolucin (bit depth) determina la calidad del archivo de audio generado. Los archivos comprimidos como el MP3 operan de la misma manera pero con un nivel extra de compresin a los fines de reducir el tamao del mismo. Un archivo MP3 es mas pequeo que el mismo archivo no comprimido. Esto salva espacio de almacenamiento a costa de reducir la calidad del audio, lo cual significa que la informacin contenida en el archivo es diferente.

    Fig.3: Representacin de una sinusoide con valores numricos.

    En los dos diagramas superiores de la figura 3, se puede ver como una frecuencia de muestreo mas alta significa que la cantidad de bloques, que representan cantidad de valores en una cadena de nmeros decimales, refleja la curva en forma mas aproximada. La frecuencia de muestreo es el nmero de muestras (o samples) por segundo que se toman de una onda en el proceso de digitalizacin de la misma. En un CD de audio, la onda es muestreada a 44.1 KHz (kilohertzios), o 44100 muestras por segundo. Esta es la frecuencia de muestreo mas comn en audio digital contemporneo de consumo, pero no es la nica opcin. Antiguos formatos utilizaban muestreos tan bajos como 11 o 22 KHz mientras que formatos actuales de video utilizan frecuencias de 48 KHz. Las frecuencias de muestreo altas generan mas cantidad de datos, mientras que las bajas generan menos informacin. Dependiendo de el uso, una frecuencia de muesrteo puede resultar mas apropiada que otra. Un estndard cmodo es 44.1 KHz.

  • En los diagramas inferiores de la figura 3, el grfico a la izquierda muestra como una resolucin baja resulta mas dificultosa para aproximar con precisin la curva. Especialmente, un audio de 8 bits (o 256 valores de amplitud posibles por cada muestra), no alcanzan para una buena representacin del sonido., recuerden el sonido del primer sistema Nintendo. Esto tiene su propio encanto pero usted no querr grabar msica con una resolucin de 8 bits. El CD utiliza una resolucin de 16 bits permitiendo mas de 65000 valores de amplitud posibles por muestra. El software moderno de audio digital tambin trabaja comunmente en 16 bits pero permite valores mas altos, como 24 bits, generando masivamente mas de 16 millones de posibles valores por muestra.

    La informacin de audio queda por lo tanto representada en cadenas de nmeros decimales. Estas cadenas son la raz para el procesamiento, almacenamiento y manipulacin del audio digital y para comunicar esta informacin a la interfaz de audio y a los parlantes. Listados a continuacin algunos de los equipos y harware necesarios para generar, capturar o reproducir audio digital.

    Placa de audio o interfaz de audio. Es una placa de expansin de la computadora que facilita la entrada y salida se seales de audio desde y hacia la misma con el soporte de software especfico. Se utiliza tpicamente para proveer componentes de audio a las aplicaciones multimedia como programas para composicin musical, edicin de audio o video, aplicaciones didcticas y entretenimiento (juegos). Muchas computadoras poseen soluciones de audio nativas mientras que otras requieren expansiones para proveer o aumentar su capacidad de audio.

    Buffering y Buffers. Las computadoras solo toman una porcin pequea de audio para procesar o enviar a los parlantes en un momento dado. Esta tcnica es llamda bufferig. Tcnicamente un buffer es una porcin pequea de audio digital, en la forma de una cadena de nmeros decimales, de una longitud determinada. Estos trozos son continuamente manipulados por las aplicaciones y enviados desde y hacia los conversores.

    Drivers. Muchas libreras permiten comunicar al software con la computadora y la placa de audio. Las placas de audio genricas manejan eficientemente, tanto el volcado de audio a los parlantes, como la captura y digitalizacin de sonido proveniente de micrfonos o entradas de lnea. Las aplicaciones que permiten comunicar al sistema operativo con el software y con la placa de audio son llamadas drivers y se utilizan generalmente para estableces comunicacin eficiente de datos a travs de puertos USB o puertos serie.

    Extracto del libro Programming Interactivity: A Designer's Guide to Processing, Arduino, and Openframeworks, Joshua Noble, "O'Reilly Media, Inc.", 2009.

    Traduccin: Luis Tamagnini, 2014.