tema 3.- · musicales electrónicos, que pueden estar integrados en los circuitos del propio...

65
Tema 3.- Audio. Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 1/65 Tema 3.- Audio.

Upload: others

Post on 03-Feb-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 1/65

    Tema 3.- Audio.

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 2/65

    Índice ÍNDICE........................................................................................................................................................................ 2

    SONIDO....................................................................................................................................................................... 3 3.1. INTRODUCCIÓN. ............................................................................................................................................. 3 3.2. PRINCIPIOS DEL SONIDO. ................................................................................................................................ 3 3.3. CARACTERÍSTICAS DE LOS SONIDOS............................................................................................................... 4 3.4. HARDWARE PARA SONIDO ............................................................................................................................. 6

    3.4.1. Tarjetas de Sonido. ............................................................................................................................... 6 3.4.2. EL DAC, Sensibilidad, Linealidad y Ruido........................................................................................... 8 3.4.3. Micrófonos .......................................................................................................................................... 10 3.4.4. Altavoces ............................................................................................................................................. 15

    3.5. DIGITALIZACIÓN DEL SONIDO. ..................................................................................................................... 21 3.6. EDICIÓN DE SONIDO DIGITAL. ...................................................................................................................... 23 3.7. EL ESTÁNDAR M.I.D.I. ................................................................................................................................ 24

    3.7.1. Descripción del estándar M.I.D.I........................................................................................................ 25 3.7.2. Interfaz M.I.D.I. .................................................................................................................................. 25 3.7.3. Los canales M.I.D.I............................................................................................................................. 25 3.7.4. Conexionados M.I.D.I. ........................................................................................................................ 26 3.7.5. Mensajes M.I.D.I................................................................................................................................. 26 3.7.6. Dispositivos usados en M.I.D.I. .......................................................................................................... 29

    3.8. FORMATOS DE ARCHIVOS DE AUDIO. ........................................................................................................... 30 3.8.1. WAV .................................................................................................................................................... 31 3.8.2. MP3..................................................................................................................................................... 31 3.8.3. VQF..................................................................................................................................................... 36 3.8.4. OGG VORBIS ..................................................................................................................................... 37

    3.9. AUDIO DIGITAL............................................................................................................................................ 43 3.9.1. SRS. ..................................................................................................................................................... 43 3.9.2. DOLBY DIGITAL AC-3. ..................................................................................................................... 44 3.9.3. SUPER AUDIO-CD ............................................................................................................................ 45 3.9.4. HDCD ................................................................................................................................................. 46 3.9.5. DVD-Audio ......................................................................................................................................... 46 3.9.6. TABLA COMPARATIVA DE SISTEMAS DE AUDIO DIGITAL ....................................................... 50

    3.10. SONIDO EN INTERNET .............................................................................................................................. 51 3.10.1. Estrategias de uso del sonido en páginas web .................................................................................... 51 3.10.2. Grabación de sonidos para páginas web............................................................................................ 53 3.10.3. Ejemplos de inserción de sonido en web............................................................................................. 53 3.10.4. Streaming ............................................................................................................................................ 54

    3.11. HERRAMIENTAS PARA EL TRATAMIENTO DE AUDIO ................................................................................. 59 3.11.1. Editores ............................................................................................................................................... 59 3.11.2. Compresión/Conversión...................................................................................................................... 63 3.11.3. Streaming ............................................................................................................................................ 65

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 3/65

    Sonido.

    3.1. Introducción. El sonido es uno de los elementos más importantes, junto con el vídeo, en un sistema o

    producción multimedia. Como el resto de medios que utilizamos en las producciones multimedia, el almacenamiento y tratamiento del sonido se realizará mediante técnicas digitales. Esto significa que el sonido, un fenómeno físico esencialmente analógico, ha de ser convertido en una señal eléctrica y después transformado en información digital y almacenado en la memoria de un ordenador. Otra forma de manejar el sonido en un sistema multimedia es generándolo directamente mediante instrumentos musicales electrónicos, que pueden estar integrados en los circuitos del propio computador o ser dispositivos externos con los que habrá que comunicarse adecuadamente.

    Toda esta problemática se tratará en los puntos siguientes, comenzando por los conceptos básicos

    del sonido, señales analógicas, conversión a valores digitales, su almacenamiento y, terminando con los aspectos relacionados con la generación de sonidos sintéticos.

    También abordaremos con más detenimiento el estudio de algunos formatos de audio muy

    extendidos como el MP3, VQF, Dolby Digital, etc.

    3.2. Principios del sonido.

    El sonido se produce por la interacción de un objeto que vibra, un medio de transmisión y un receptor, es decir, una onda de presión se transmite a través de un medio, como el aire, y produce una sensación, llamada auditiva, al perturbar el estado de reposo de las estructuras del oído. Para que el sonido sea percibido por el ser humano, el objeto debe vibrar con una frecuencia de entre 20 Hz. y 20 KHz.

    Figura 1. El sonido.

    La vibración produce una compresión y refracción alternativa del aire que se transmite en forma

    de ondas sonoras. Estas ondas llegan al oído, donde se producen unos estímulos eléctricos que el cerebro interpreta como sonidos. Las ondas sonoras se atenúan con la distancia y pueden ser absorbidas o reflejadas por los obstáculos que encuentran a su paso.

    La estructura de nuestro sistema auditivo para la recepción del sonido es el que se describe a continuación. El tímpano, que es una membrana, vibrará en simpatía con las partículas de aire que la rodean y provocará la vibración de los huesos del oído interno. En la siguiente figura se puede apreciar la estructura del órgano auditivo.

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 4/65

    Figura 2. El oído.

    El elemento que transforma estos movimientos vibratorios en señales neuronales es la membrana

    basilar, dentro de la cóclea. La forma de la cóclea hace que las vibraciones que penetran en ella a través de la ventana oval alcancen de forma más intensa una zona más o menos profunda en función de su frecuencia. La membrana basilar está recubierta de pequeñas vellosidades conectadas a haces nerviosos que transmiten la información al cerebro. Como se puede apreciar por esta descripción, la información espectral del sonido (conjunto de frecuencias que componen la señal en un momento dado) llega ya desmenuzada a los centros auditivos del cerebro.

    Figura 3. Esquema del oído.

    3.3. Características de los sonidos. Existen una serie de características que nos permiten identificar y diferenciar unos sonidos de

    otros. Las principales podemos resumirlas en las siguientes:

    INTENSIDAD: Corresponde a la amplitud de la onda sonora, es decir a cuánto se alejan las partículas ( y por

    tanto el tímpano) de su posición de reposo en cada periodo de la vibración. El oído responde a un rango de intensidades impresionante, desde el sonido casi imperceptible al umbral del dolor. La sensación sonora se incrementa aproximadamente al doble cada vez que la amplitud del sonido se multiplica por diez. Muchos sonidos presentan un patrón claro de intensidad que varía con el tiempo. A este patrón se le llama envolvente. Por ejemplo, un piano presenta un fuerte golpe de gran intensidad inicial, que decae más o menos rápidamente hasta desaparecer. Una flauta sin embargo, presenta una envolvente más aplanada, ya que no existe golpe inicial, sino una intensidad del sonido mantenida mientras dura la nota.

    Figura 4. Envolvente de intensidad de un sonido.

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 5/65

    Las intensidades de los sonidos que podemos percibir tienen un rango de más de 15 órdenes de magnitud por lo que para su medición se usa una escala logarítmica (decibelios)

    2

    2

    10log10refa

    adB =

    donde a es la amplitud de onda del sonido que se está midiendo, y aref es la amplitud de

    referencia (la del sonido con el cual se compara). Así los decibelios son una relación entre dos amplitudes de onda. Si se toma como amplitud de referencia el umbral de audición, la siguiente tabla muestra la intensidad en dB de algunos sonidos representativos:

    Descripción Nivel (dB) Intensidad

    Umbral del dolor 130 1013 Concierto heavy metal 120 1012 Martillazos sobre metal 110 1011 Tráfico de vehículos 70 107 Conversación normal 60 106 Restaurante concurrido 50 105 Casa en la ciudad 40 104 Iglesia vacía 30 103 Estudio de grabación 20 102 Umbral de audición 0 1

    Relacionado con la intensidad está el concepto de rango dinámico, que es la diferencia en

    decibelios entre el sonido más fuerte y más débil que un sistema puede producir. En un aparato de sonido, este valor indica la diferencia entre el volumen máximo y el ruido de fondo que se emite cuando no hay señal. En los equipos de sonido de cierta calidad el rango dinámico oscila entre los 80 dB y los 95 dB.

    FRECUENCIA Y PERIODO:

    Son dos conceptos que representan el mismo fenómeno físico y que están inversamente

    relacionados. Miden, respectivamente, cuántas vibraciones por segundo se producen y cuantas fracciones de segundo dura una vibración. Las unidades en que se mide la frecuencia son los ciclos por segundo, o hercios (Hz). El periodo se mide en segundos. Los humanos somos capaces de percibir frecuencias de entre 20 y 20.000 Hz aproximadamente.

    Figura 5. Movimiento armónico simple y ondas complejas.

    TONO:

    El tono de un sonido está directamente relacionado con la frecuencia, aunque no son sinónimos.

    La frecuencia es una magnitud física asociada a todo sonido, mientras que el tono (agudo o grave) es una característica perceptiva que solo captamos en los sonidos periódicos: los que tienen una frecuencia más o menos constante.

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 6/65

    Desde el punto de vista musical, al duplicar la frecuencia de un sonido, se pasa a la octava siguiente. Por ejemplo, el La de la octava central del piano tiene una frecuencia de 440 Hz., y el La de la siguiente octava (más agudo), 880 Hz. En la música occidental, la octava se divide en 12 semitonos (las doce teclas que hay en cada octava de un piano). Para obtener la frecuencia de un semitono a partir de la frecuencia del anterior, hay que multiplicar por 12 2 = 1,05946. Las notas correspondientes a las teclas blancas del piano se denominan

    Terminología europea Do Re Mi Fa Sol La Si Terminología anglosajona C D E F G A B

    Las notas correspondientes a las teclas negras del piano se denominan con el nombre de la tecla

    blanca situada a la izquierda añadiéndole el símbolo # (sostenido), o con el nombre de la tecla blanca situada a la derecha, añadiéndole el símbolo b (bemol). Así, la tecla negra que está entre el Do y el Re será indistintamente Do# o Re b.

    TIMBRE:

    Dos instrumentos musicales distintos, como un violín y una flauta, que estén interpretando la

    misma nota (frecuencia) con la misma intensidad, son sin embargo claramente diferenciables. Esto es así porque existe una tercera característica importante de los sonidos que es su timbre o forma de onda. Lo que ocurre en realidad es que no todos los sonidos son tan simples como el movimiento armónico de un péndulo, sino que la mayoría están provocados por movimientos complejos de los objetos. Estos movimientos complejos, sin embargo, se pueden descomponer en una suma de movimientos simples. La frecuencia de vibración más grave (frecuencia base o frecuencia fundamental) es la que determina el periodo y la amplitud y es la que percibimos. Las restantes frecuencias, que suelen ser múltiplos de la frecuencia base, son los armónicos. Por ello, el timbre corresponde al conjunto de frecuencias que se pueden encontrar en un sonido en mayor o menor proporción.

    Figura 6. Espectros de frecuencias.

    3.4. Hardware para sonido

    3.4.1. Tarjetas de Sonido. El elemento hardware básico para realizar las tareas relacionadas con el sonido en un ordenador

    es la tarjeta de sonido. En los ordenadores personales típicos, las podemos encontrar en BUS ISA (cada vez menos), PCI (las más frecuentes) e incluso integradas en placa base. En la siguiente figura podemos ver el aspecto que presenta una tarjeta de sonido típica.

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 7/65

    Figura 11. Aspecto de una tarjeta de sonido típica.

    Aparte de las capacidades de muestrear y reproducir sonidos (ADC y DAC), la mayoría de las

    tarjetas de sonido disponen de los siguientes elementos: • Un chip de síntesis de efectos sonoros por tabla de ondas o por modulación de

    frecuencia. Se usa a menudo para emular instrumentos MIDI sin necesidad de conectar un verdadero instrumento a la tarjeta.

    • Un mezclador capaz de seleccionar y combinar las señales procedentes del micrófono,

    entrada de línea, reproductor de discos compactos, DAC y chip de síntesis, y dirigir esta señal combinada a la salida de altavoces a la de auriculares, o al ADC. La figura 12 ilustra las conexiones del mezclador.

    • Controlador de un lector de CD-ROM (esto es menos frecuente en las nuevas tarjetas).

    • Procesador de audio, DSP (Digital Sound Processor). Algunas tarjetas poseen un

    procesador de audio, capaz de realizar operaciones sobre el audio en tiempo real.

    Figura 12. Conexiones del mezclador.

    Las tarjetas de Sonido, para relacionarse con el mundo exterior suelen disponer de las siguientes

    conexiones:

    • Salida Analógica Amplificada para altavoces. En esta salida la tarjeta de sonido suele entregar una señal amplificada de 2 a 4 W. Sirve para conectar los altavoces a la tarjeta.

    • Salida Analógica Sin Amplificar (Line Out). Esta señal proviene del mezclador y se

    entrega sin amplificar, para conectar la salida de sonido a un amplificador externo.

    • Micrófono. Mediante esta conexión se conecta la entrada de la señal del micrófono.

    • Entrada Analógica Auxiliar (Line In). Esta entrada permite introducir en la tarjeta la señal proveniente de una fuente externa, como una radio, un equipo de música, etc.

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 8/65

    • Conector MIDI / Joystick. Este conector permite la conexión de un JoyStick analógico o

    bien servir de interfaz para la conexión con otros dispositivos MIDI, como teclado, sintetizadores, etc.

    Figura 13. Esquema de conexiones de una Sound Blaster 16.

    En cuanto a las capacidades y prestaciones de una tarjeta de sonido, hay que destacar en primer

    lugar el número de bits de los ADC y DAC. En las primeras tarjetas había que conformarse con 8 bits, es decir tan sólo 256 niveles de señal discernibles. En la actualidad la mayoría de tarjetas disponibles son de 16 bits, lo cual supone 65536 niveles, proporcionando una relación entre el nivel menor y el mayor superior a la que pueden manejar los circuitos analógicos típicos. Por ejemplo, la Soundblaster Audigy Platinium Ex usa 24 bits. Hay que mencionar también que las denominaciones de algunas tarjetas cuyo nombre comercial incluye números como 32, 64 o 128 (AWE-32, AWE-64, SB128PCI, Terratec Maestro32, etc.) no deben llevar a engaño. Estos números indican típicamente el número de voces MIDI que puede generar su chip de síntesis. La máxima frecuencia de muestreo utilizable es también una característica básica de una tarjeta de sonido, aunque en la actualidad todas las tarjetas superan las 44.000 muestras por segundo, lo cual excede al doble de la máxima frecuencia perceptible por el oído humano normal.

    Las tarjetas de sonido actuales disponen todas de la circuitería duplicada para permitir grabación

    y reproducción en estereofonía. Otra característica presente en algunas tarjetas de sonido recientes es la capacidad de grabar (ADC) y reproducir (DAC) al mismo tiempo ("full duplex"). Si además las frecuencias de muestreo de la grabación y la reproducción pueden ser distintas, entonces la prestación se denomina "enhanced full duplex". Finalmente, se están introduciendo tarjetas con capacidad de proceso de la señal para simular que el origen de los sonidos se encuentra en una posición y estado de movimiento concretos en el espacio tridimensional alrededor del oyente. Para ello se emplean técnicas de alteración de la amplitud, frecuencia (efecto doppler) y fase de los sonidos. Esto permite que el usuario perciba el sonido como procedente del lugar en el que se desarrolla la acción en un simulador o un juego, por ejemplo. Algunos de estos sistemas proporcionan salida para 4 o más altavoces, en lugar de los 2 tradicionales.

    3.4.2. EL DAC, Sensibilidad, Linealidad y Ruido. El elemento clave en la digitalización de audio es el conversor analógico/digital o DAC, que

    transforma la señal de audio en una secuencia de datos binarios. Estos conversores se caracterizan por una serie de propiedades, entre las cuales podemos destacar las siguientes: frecuencia de muestreo, resolución de la muestra, umbral de sensibilidad, linealidad de la respuesta y ruido.

    Como vemos, la frecuencia de muestreo y la resolución que hemos descrito anteriormente son

    sólo dos de las características que definen la calidad de un DAC, y posiblemente las otras tres que mencionamos sean más importantes que estas dos. Vamos a verlas con más detenimiento.

    UMBRAL DE SENSIBILIDAD:

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 9/65

    Imaginemos que estamos en una fiesta entre amigos. Estamos bailando, bebiendo, y en medio de la juerga se nos acerca un amigo y nos pide las llaves del coche. Lo normal es que no le oigamos a la primera y le respondamos que «las 2 de la mañana». Nuestro amigo se da cuenta de que no le oímos bien y eleva la voz; esta vez no pide las llaves en voz alta, sino que grita y se acerca nuestros oídos. Ahora le hemos podido entender. La diferencia de intensidad entre la primera y la segunda vez es el umbral de sensibilidad que tenemos en esos momentos para discernir una conversación. En términos absolutos, el sonido más leve que podemos escuchar es el que producen las alas de un mosquito al batir, y el más intenso, más allá del cual podemos rompernos los tímpanos, es el de un avión a reacción aterrizando.

    Los DAC también tienen un umbral de sensibilidad, y una tolerancia, lo que quiere decir que no

    sólo es importante que puedan discernir una diferencia de intensidad más o menos amplia, sino que además dos mediciones del mismo sonido deben dar el mismo resultado. Una de las diferencias más importantes entre el DAC de una tarjeta de sonido normal y una profesional es la tolerancia. Esta depende de los controles de calidad que se aplican en la fabricación del chip, y puede variar mucho de uno a otro.

    LINEALIDAD:

    Volvamos al ejemplo de la fiesta. Estamos bailando un ritmo lento; apenas damos un salto cada

    dos o tres segundos. De repente, cambian la música y empieza un tema rock. Los saltos aumentan y ahora es posible que demos uno por segundo. Cambian de nuevo la música y ponen algo heavy; si intentamos mover la cabeza más de tres o cuatro veces por segundo podemos perder la consciencia. Esto quiere decir que nuestra cabeza tiene un comportamiento lineal hasta los tres o cuatro movimientos por segundo. Más allá de esta cifra, rompemos el ritmo (y el cuello). Un DAC también tiene respuesta en frecuencia. Como podemos deducir del ejemplo de la fiesta, los objetos que se comportan bien a una frecuencia puede que no lo hagan en otra; incluso pueden dar resultados erróneos.

    La linealidad de la respuesta es otra característica importantísima de los instrumentos musicales

    y de los sistemas de grabación y reproducción. La razón de que haya altavoces de dos y tres vías es que cada uno de los conos que los forman sólo responden bien en una franja estrecha del espectro auditivo. Así, es necesario un tweeter para reproducir agudos y un woofer para los tonos graves.

    Todo tiene una respuesta en frecuencia característica, desde el micrófono hasta los cables,

    pasando por el DAC y las membranas de los altavoces. Por norma un dispositivo es mejor cuanto más lineal es su respuesta, aunque esto tampoco es cierto del todo. Nuestro oído es el primero que no responde por igual a todas las frecuencias. De hecho, es más sensible a los tonos agudos que a los graves.

    Los sistemas de audio más profesionales buscan lo que se llama «color» del sonido, que es un

    comportamiento algo irregular, parecido al que tiene el oído humano.

    RUIDO:

    Volvamos, por última vez, al ejemplo de la fiesta. Estamos oyendo un tema y en un momento dado se acaba el disco. Cuando finaliza su reproducción podemos escuchar una especie de silbido que proviene de los altavoces. Pero ¿cómo es posible? Especialmente si utilizamos un lector de discos compactos, no debería escucharse nada cuando no hay música.

    El problema es que los circuitos eléctricos y electrónicos tienen ruido. ¿Y qué es el ruido? Pues los

    temas de algunos grupos modernos podrían denominarse así, pero en general el ruido es todo aquello que se oye pero no debería oírse.

    Los DAC también tienen ruido. Muy poco, es cierto, pero ahí está y si se combina un ruido un

    poco elevado con un circuito poco preciso, podemos encontrar que la tolerancia de las muestras llega a distorsionar la grabación. De hecho, esto es lo que ocurre con muchas tarjetas de sonido económicas.

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 10/65

    3.4.3. Micrófonos

    Micrófono es el término genérico que se usa para hablar de los elementos que transforman la energía acústica, (sonido - fuente original: guitarra, voz), en energía eléctrica, (la señal de audio - ya sea Digital o analógica). El micrófono es un tipo de transductor, un dispositivo, que transforma energía de una forma a otra. El micrófono se usa para amplificar la señal de audio original, la cual reproduciremos o copiaremos (ya sea similar o distorsionada) a otra por medio de dispositivos eléctricos, teniendo en cuenta que nunca volverán a ser como habían sido en un principio (por muy buen micro que se tenga, nunca se logrará el sonido original que emite la fuente), es decir, no existe el micro perfecto y nunca reproduciremos el sonido original como la fuente nos a lo ha hecho llegar, pero según el micro lograremos más calidad, semejanza, cercanía, cuerpo, etc… Todo aquello que nos rodea, que es lo que nos va a afectar en la grabación y hay que tenerlo en cuenta en la elección de un micrófono, ya sea la localización, cableado, mesa, conversores, dinámica, acústica de la sala de captación, etc… Y aquí es donde podemos aplicar una de las máximas o mandamientos, dentro del mundo del sonido:

    TU EQUIPO SONARÁ COMO SUENE EL PEOR DE LOS COMPONENTES DE TU EQUIPO. Es decir que cuando tengamos que comprar un micrófono o cualquier componente de nuestro

    estudio tendremos que tener en cuenta que todos los elementos del estudio sean semejantes unos a otros ya que aunque compremos un gran micrófono el registro del sonido no dependerá solamente de la calidad de ese micrófono, sino de todo la cadena de registro que tengamos, (aunque contra mejor micro, mejor captación, es lógico). Principales diseños de micrófonos

    Existen seis diseños comunes de micrófonos: • De mano - tipo de micrófono que usa en la mano el talento o en entrevistas en locación • Lavaliere - Solía colgar de un cordel alrededor del cuello. Una variación más actualizada es el

    micrófono personal (de corbata o solapa) o de clip • Cañón (shotgun) - usado en producciones en locación para captar sonidos a distancia de la

    cámara • Micrófono piezoeléctrico - llamado PZ o PZM, este tipo de micrófonos ofrecen una óptima

    captación de sonidos transmitidos a través de superficies duras, como por ejemplo una mesa • Micrófonos de contacto - captan el sonido en contacto directo con la fuente sonora. Este tipo de

    micrófonos se encuentran generalmente montados en instrumentos musicales. • Micrófonos de estudio - es la categoría mas grande de micrófonos e incluye varios diseños según

    su aplicación Estas seis categorías poseen diferentes tipos de transductores o elementos encargados de convertir

    las ondas sonoras en energía eléctrica. Micrófonos dinámicos Los micrófonos dinámicos (también llamados de bobina móvil) son considerados como los

    micrófonos profesionales más resistentes. Este tipo de micrófono es una buena elección para la labor periodística (ENG) donde comúnmente se encuentra una variedad de condiciones difíciles (como el incendio aquí ilustrado). En un micrófono dinámico las ondas sonoras golpean un diafragma soportado en una bobina de cable fino. La bobina se encuentra suspendida en un campo magnético permanente. Cuando las ondas sonoras golpean el diafragma este hace vibrar la bobina en el campo magnético. El resultado es una pequeña corriente eléctrica generada por la fricción, esta corriente tendrá que ser después amplificada miles de veces. Una de sus mayores ventajas es que no requieren de una fuente externa de energía para operar y son particularmente resistentes al abuso físico. Sin embargo su fidelidad no siempre es la mejor. Cuando se requiere de menor tamaño, excelente sensibilidad y la mejor calidad de respuesta, otro tipo de micrófono es preferido: el micrófono de condensador.

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 11/65

    Micrófonos de condensador / capacitor Los micrófonos de condensador (también llamados capacitores o micrófonos de condensador

    eléctrico) poseen una incomparable calidad de respuesta. Además pueden ser tan pequeños que son fáciles de esconder. Sin embargo, la mayoría de los micrófonos de condensador no son tan resistentes como los dinámicos y el trabajo en condiciones climáticas adversas puede resultar un problema. Los micrófonos de condensador funcionan bajo el principio de un condensador eléctrico o capacitor. Un diafragma de metal ultra delgado es fuertemente estirado sobre una pieza plana de metal o cerámica. En la mayoría de los micrófonos de condensador una fuente de poder provee una carga eléctrica entre ambos elementos.

    Las ondas sonoras que golpean el diafragma causan fluctuaciones en la carga eléctrica que deben ser

    posteriormente amplificada en el preamplificador (pre-amp). Dicho preamplificador puede estar integrado al cuerpo del micrófono o estar ubicado en un dispositivo separado. Debido a que estos micrófonos requieren de un preamplificador ello implica que, a diferencia de sus contrpartes dinámicas, la mayoría de los micrófonos de condensador requieren de una fuente de poder, ya sea de corriente o baterías. Para proveer de corriente AC a un micrófono de condensador usualmente la fuente está integrada en la mezcladora de audio. A esto se le conoce como fuente fantasma (phantom power). Cuando su utiliza este tipo de alimentación el cable del micrófono sirve a dos propósitos: entrega la señal captada por el micrófono a la cósola y lleva la energía de la cósola al preamplificador del micrófono.

    El uso de baterías como alimentación del preamplificador es mas conveniente (no se tiene que

    utilizar un mezclador especial u otro dispositivo de alimentación de corriente), pero también representa un problema: al final de su ciclo de vida las baterías se "mueren" sin previo aviso. Para evitar esta situación en plena producción, especialmente en vivo, suele colocarse dos micrófonos miniatura de condensador junto al talento. Si alguno de los micrófonos falla, el otro puede ser inmediatamente activado. Esta técnica del micrófono doble es conocida como cobertura dual (dual redundancy).

    Existe otro tipo de micrófonos en uso como el micrófono de cinta (ribbon), que es mucho más

    sensible, pero aún así los de tipo dinámico y de condensador son los más usados en la producción de televisión.

    Micrófonos piezoeléctricos Los Pz (a veces abreviados como PZM) son micrófonos de presión que se utilizan limitadamente

    para ciertos efectos. Este micrófono depende enteramente de la reflexión del sonido. En situaciones especiales (como cuando está ubicado en la superficie de una mesa) un PZ tiene una respuesta superior a cualquier otro tipo de micrófono.

    Micrófonos de Mano

    Normalmente los micrófonos de mano son dinámicos ya que estos controlan mejor las saturaciones

    de algunos cantantes. Debido a que estos micrófonos son utilizados a muy cortas distancias, algunas consideraciones especiales deben ser mencionadas. Primero, es aconsejable que el micrófono esté inclinado unos 30 grados y no completamente perpendicular a la boca. Hablar o cantar directamente al micrófono frecuentemente crea un seseo indeseable (una exageración o distorsión del sonido "S"); popeo de sonidos explosivos (palabras que inician en "p, s, t y b) y el indeseable efecto de proximidad (la exageración de las frecuencias bajas que mencionamos antes). La mayoría de los micrófonos de mano están diseñados para usarse a una distancia de 8 a 16 pulgadas, pero esta distancia puede tener que ser reducida en situaciones ruidosas. Muchos micrófonos de mano tienen integrado un filtro de popeo diseñado para reducir el impacto de consonantes explosivas.

    Cuando un micrófono es usado muy de cerca es recomendable colocar un escudo de viento sobre el

    micrófono para reducir más el efecto de sonidos explosivos. Estas protecciones ayudan en el trabajo en

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 12/65

    locación a solucionar un problema común: el efecto del viento sobre la membrana del micrófono. Incluso una suave brisa puede crear una turbulencia que estorbe al sonido de una voz. Micrófonos Personales

    Los micrófonos personales pueden encontrarse colgando de un cordel alrededor del cuello (lavaliere

    o lav mic) o sujetados con un clip a la ropa (clip-on mic). Este tipo de micrófono puede ser de condensador o tipo dinámico. Los micrófonos personales de condensador pueden ser muy pequeños y discretos -- una ventaja importante cuando es necesario ocultar el micrófono. Cuando se coloca un micrófono personal no debe estar junto a piezas de joyería o pins decorativos. Cundo el talento se mueva el micrófono puede rozar contra cualquiera de estos objetos y causar ruido. Los micrófonos personales están diseñados para captar sonidos a 14 pulgadas. Si un micrófono de clip es colocado en la solapa de un saco o el lado de un vestido tenemos que anticipar en que dirección girará el talento en el momento de hablar. Si la persona gira al contrario del micrófono la distancia entre el mismo y su boca se incrementará hasta 2 piés. Micrófono / Audífono

    El micrófono / audífono está adaptado a las necesidades de las transmisiones deportivas.

    Normalmente un micrófono dinámico unidireccional con un filtro antipopeo está integrado a dos audífonos que llevan dos señales separadas: el audio del evento y las indicaciones del director. El micrófono integrado a la diadema del audífono asegura una distancia constante entre micrófono y boca, aún cuando el locutor se encuentre en movimiento constante.

    Efecto de Proximidad

    ¿Porque será que aún con los ojos cerrados podemos fácilmente percibir si la persona que nos está

    hablando se encuentra a dos o quince piés de nosotros? Primero podemos suponer que la voz de una persona a dos piés de distancia se escucharía mas fuerte que la de alguién a 15 piés. Esto es parte de la respuesta, pero existen otras razones. Podríamos pensar que la voz de una persona de cerca suena diferente a una persona a distancia. Esta diferencia se acentúa significativamente cuando tratamos de editar escenas diferentes. Para montar el audio en escenas que tienen notables diferencias de audio debemos entender como cambia el sonido con la distancia. El sonido al viajar por la distancia pierde frecuencias bajas (graves) y en el extremo del recorrido frecuencias altas (agudo). Es por esto que los micrófonos usados a distancias cercanas normalmente sufren lo que llamamos efecto de proximidad -- o sea respuesta exagerada a frecuencias bajas. Algunos micrófonos poseen filtros que reducen las frecuencias graves no naturales provocadas por las distancias cercanas.

    Cuando son usados micrófonos direccionales a diferentes distancias la perspectiva sonora o

    presencia de audio (balance de frecuencias sonoras y otras características acústicas) cambia en correspondencia con cada distancia diferente. Es posible tratar de corregir este defecto durante la fase de post-producción donde varios sistemas para mejorar el audio son utilizados como ecualizadores gráficos (discutidos antes) para tratar de empatar el audio de escenas sucesivas. De cualquier forma es preferible evitar el efecto de proximidad desde la fuente original. Además diferentes micrófonos y diferentes locaciones poseen características diferentes de audio lo cual complica el proceso de edición.

    Conexiones Para asegurar la fidelidad de los micrófonos y equipos de audio en general los conectores deben

    mantenerse limpios, secos y en buen estado, sin dobleces o partes sueltas. Los dos conectores en la fotografía de la izquierda son la hembra y el macho de conectores tipo Canon. Estos conectores de tres pins son comunes en equipos de audio profesionales. También existen los conectores miniatura (con el conector flotante al centro) para monoaural y estéreo. Finalmente a la derecha se encuentra un conector tipo RCA. Cuando se usan en locación los conectores de audio deben mantenerse secos, sin embargo los cables de los micrófonos pueden encontrarse sobre pasto mojado o incluso cruzar por agua (nada

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 13/65

    recomendable) sin efectos dañinos (asumiendo que la cobertura plástica no esté dañada). Si usted debe trabajar en lluvia o nieve la humedad puede evitarse envolviendo los conectores en bolsas plásticas bien selladas. Debe enfatizarse que esto solo se aplica a cables de micrófonos. Micrófonos inalámbricos

    Los micrófonos inalámbricos pueden resolver muchos problemas de audio durante una producción,

    especialmente cuando el talento debe estar libre de cables que entorpezcan el movimiento. En un micrófono inalámbrico un micrófono de condensador se conecta a un radio transmisor miniatura de frecuencia modulada. Debido a que la señal de audio es convertida en una señal de radio frecuencia estos micrófonos también son conocidos como RF mics. Existen dos tipos de micrófonos inalámbricos: el integrado (todo en una pieza) o el de dos piezas.

    En el integrado de mano se encuentran el micrófono, el transmisor, la batería y la antena construidos

    en un mismo cuerpo como el que se muestra a la izquierda. Cuando se desea utilizar un micrófono pequeño de clip, un sistema de dos piezas es la mejor opción. En este caso el micrófono se conecta a una unidad separada de transmisión que puede estar sujetada en un cinturón, colocada en un bolsillo, o incluso ocultada bajo la ropa. Muchos de los problemas de interferencia, señal débil y otros que presentaban los primeros micrófonos inalámbricos han sido resueltos y eliminados. Actualmente los micrófonos RF son ampliamente usados en estudio y locación. Incluso las cámaras-grabadoras poseen un receptor integrado para usar micrófonos inalámbricos eliminando el fastidioso cable que normalmente conecta al reportero con la cámara.

    Rango de transmisión En un micrófono inalámbrico, el sonido se convierte en una débil señal de frecuencia modulada y se

    transmite en patrón semicircular por medio de una antena interna (en el interior del cuerpo del micrófono) o externa (generalmente en forma de un pequeño cable sujetado en la base del cuerpo). En este último caso, la antena debe mantenerse relativamente extendida y no doblada en un bolsillo. En condiciones óptimas los micrófonos inalámbricos pueden transmitir fielmente en un radio de poco mas de 1,000 pies (180 mts.). Si hay obstrucciones, especialmente objetos de metal, esta distancia puede reducirse aproximadamente 250 pies (40 mts.).

    Problemas de interferencia Los objetos de metal que interfieren entre el micrófono RF y el receptor crean una condición

    conocida como recepción múltiple (multipath), producida en parte por la reflexión de la señal en dichos objetos. Esta señal secundaria interfiere con la señal original. Este problema puede ser particularmente problemático si el talento se encuentra en movimiento alrededor de los objetos que interfieren. Como veremos, este problema puede ser solucionado. Debido a las limitaciones impuestas por la FCC (Comisión Federal de Comunicaciones en Estados Unidos), la señal FM del micrófono, debe ser relativamente débil. Debido a esto otro tipo de radiotransmisiones pueden interferir ocasionalmente. A esto se le conoce como interferencia RF. A pesar que estas señales pueden encontrarse en frecuencias diferentes, las transmisoras cercanas emiten señales armónicas (secundarias) que si son lo suficientemente fuertes pueden ser captadas por un micrófono inalámbrico. Para que una señal de micrófono RF sea fiel debe tener al menos el doble de potencia que la señal de interferencia. La mayoría de los micrófonos RF transmiten en frecuencias mayores que las de la radio FM y del rango VHF (very high frequency), o en parte de la banda UHF (ultra-high frequency) que por encontrarse menos saturada es preferida por muchos ingenieros de audio. Debido a que la frecuencia UHF es utilizada también por otros radio-servicios, los micrófonos inalámbricos profesionales permiten seleccionar diferentes frecuencias. En algunos equipos pueden encontrarse diez grupos diferentes cada uno con siete canales para seleccionar. Con todas estas opciones disponibles generalmente es posible encontrar alguna frecuencia libre de interferencia.

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 14/65

    Antenas receptoras Una buena señal de micrófono RF tendría poco valor si no puede ser recibida sin recepción múltiple

    o cualquier tipo de interferencia. Una de las maneras mas efectivas de eliminar la interferencia es colocando adecuadamente la antena (o antenas) receptora. Existen dos tipos de receptores para inalámbricos. El receptor único usa una sola antena montada en la parte trasera del receptor. Este tipo de receptor es más propenso a problemas de recepción -- especialmente cuando el talento se encuentra en movimiento. En los receptores duales se utilizan dos antenas. Ya que estas pueden ser colocadas a cierta distancia entre ellas, se asume que en el momento en que alguna antena no está recibiendo adecuadamente la señal la otra antena si lo haría. Para evitar que ambas antenas interfieran entre sí, circuitos electrónicos trabajan constantemente en el interior del receptor para seleccionar instantáneamente la más clara y fuerte de las dos señales. Tanto con receptores únicos como duales pueden usarse varios micrófonos inalámbricos simultáneamente, cada uno en una diferente frecuencia de radiotransmisión. Una vez recibida, cada señal es enviada a un mixer de audio y controlada como una señal normales. Micrófonos no visibles en escena

    Aunque puede ser apropiado usar micrófonos de mano, lavalier o inalámbricos en entrevistas, hay

    muchas situaciones en producción donde se hace necesario usar micrófonos no visibles -- generalmente fuera del campo de la vista de la cámara. Algunos ejemplos son:

    Cuando ver un micrófono no sería apropiado, como en el caso de una producción dramática. Cuando los cables del micrófono restringirían el movimiento de talento, como en un número del

    baile. Cuando hay demasiadas personas en la escena como para usar micrófono en mano o micrófonos de

    RF, como con un coro. Debido a su naturaleza, los micrófonos no-direccionales, omni-direccionales o los de patrón

    cardioide usados a una distancia de 2 o más metros recogen sonidos indeseados. Dependiendo de la acústica de la locación, esto causará que el audio suene encajonado y fuera del eje del micrófono. Por ello, en estas situaciones donde la distancia es un factor deben usarse micrófonos super o hiper-cardioide. De la misma forma como el ojo ( en realidad el cerebro) ve selectivamente y no nota un perchero "que sale desde" la cabeza de alguien en un encuadre, el oído escucha selectivamente y "filtra" la reverberación excesiva -- o el ruido de fondo -- en una habitación que haría difícil de entender las palabras.

    Acústica Siempre que un cuarto tenga paredes lisas y paralelas, continuas o pisos sin alfombra, la

    reverberación (ecos de las paredes) puede convertirse en un problema. La solución más simple en estos casos es mover los micrófonos lo más cerca al sujeto; pero esto no siempre es posible. Otras soluciones podrían ser el uso de micrófonos direccionales, agregar materiales absorbentes en las paredes, o ubicar objetos en la escena que absorban o rompan los sonidos reflejados. La solución más rápida, sobre todo en locación, es utilizar un micrófono muy direccional a un extremo de una caña (fishpole) y sostenerlo fuera del encuadre de la cámara. Como su nombre sugiere, una caña (fishpole) consiste en una barra extensible con un micrófono montado en uno de sus extremos. Un operador con un audífono (para monitorear claramente el registro) dirige el micrófono acorde a las tomas y la posición del talento. Se usan generalmente micrófonos supercardioide y hipercardioide montados en un dispositivo de suspensión llamado shock mount.

    Micrófono boom En estudio se usa un método diferente y la simple caña se transmuta en una categoría mucho más

    grande llamada micrófono de boom. Los micrófonos de boom pueden ir desde una jirafa pequeña (básicamente una caña sobre un trípode con ruedas) a un boom móvil (que pesa varios cientos de kilos, requiere dos personas para operarlo y puede extender el micrófono a una distancia de 10 o más metros).

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 15/65

    Los booms más grandes tienen una plataforma central controlada hidráulicamente donde se sientan los operadores y miran la escena en un monitor de televisión mientras controlan cosas tales como:

    El movimiento de izquierda y derecha (balance) del brazo del boom. La extensión del boom (alcance del brazo). Paneo a derecha o Izquierda del micrófono atado. Inclinación vertical del micrófono.

    Micrófonos suspendidos A veces usted puede manejárselas sin un boom, sobre todo si el talento se limita a un área pequeña.

    En este caso pudiera suspender un micrófono (o varios) sobre el área de actuación fijándolo a un tubo fuera del encuadre más abierto de cámara. La desventaja de este método es que los micrófonos no pueden moverse durante la producción. Por supuesto, la calidad del audio variará con la posición de los actores en relación a los micrófonos. Los micrófonos de boom y los micrófonos suspendidos deben evaluarse con las luces del estudio encendidas para asegurar que no proyecten sombras visibles en el fondo o en el set.

    Micrófonos ocultos

    A veces es posible esconder estratégicamente un micrófono donde el talento se ubicará y fuera de la

    vista de la cámara. Esto elimina la necesidad de utilizar micrófonos de mano y los problemas que ocasionan los cables. Los micrófonos se colocan detrás de un elemento de utilería o incluso se esconden en la decoración de una mesa como en un jarrón de flores. Cuando coloque los micrófonos tenga presente el efecto de proximidad discutido en un módulo anterior. Usted puede encontrarse durante la edición que los sonidos captados por diferentes micrófonos a diferentes distancias no se pueden combinar sin crear diferencias molestas en la calidad del sonido. Cuando se usan varios micrófonos en un set, cada micrófono que no se esté usando en un momento en particular debe apagarse para evitar la cancelación de fases que degrada el sonido.

    3.4.4. Altavoces

    El altavoz es el último eslabón en la cadena de audio. Transforma la energía eléctrica que le entrega

    la etapa de potencia en energía mecánica, y por ello se le llama transductor. Su función es inversa a la de otro conocido transductor: el micrófono, que transforma las ondas sonoras que capta su membrana (energía mecánica) en energía eléctrica que entrega a la etapa preamplificadora. En principio, la banda de frecuencias audibles por el oído humano abarcan desde los 16 Hz a los 20 kHz, aunque varía con las personas según sus características fisiológicas, y también varía con la edad. A medida que envejecemos, perdemos sensibilidad hacia los extremos del rango, sobre todo de las altas frecuencias.

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 16/65

    Podemos representar las ondas sonoras mediante un sistema de ejes cartesianos X-Y donde el eje X

    representa el tiempo y el eje Y representa la amplitud o intensidad de esa onda sonora. En el dibujo representamos una onda senoidal, producida por la vibración en el aire de una lámina metálica. Como toda función periódica, es decir, que se repite en un mismo intervalo de tiempo, llamamos período T al tiempo empleado por la onda en completar un ciclo completo. A la inversa del período se denomina frecuencia (f = 1/T) y viene dado en ciclos/segundo, hercios (Hz) o sencillamente (s^-1) que son segundos elevado a menos uno.

    El altavoz moderno, tal como lo conocemos, es relativamente reciente. El tipo más extendido, y el que más se utiliza en sistemas hi-fi es el altavoz dinámico.

    1.- Cono o diafragma 2.- Campana 3.- Yugo 4.- Imán permanente 5.- Bobina móvil 6.- Araña 7.- Tapa de retención de polvo 8.- Hilos de conexión de la bobina 9.- Bornes de conexión

    La impedancia del altavoz habitualmente es de 4 a 8 ohmios. No confundir la impedancia con la resistencia. La impedancia es la resistencia que ofrece el altavoz al paso de una señal senoidal de 1 kHz, mientras que su resistencia es la que mediríamos mediante un óhmetro entre sus bornas de conexión. l altavoz moderno parte de las investigaciones de Edgar Villchur, que en 1954 preconiza el uso de cajas

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 17/65

    acústicas para extender las frecuencias bajas, encerrando el altavoz en un recinto cerrado. Un año después, la empresa Acoustic Research introduce en el mercado el modelo AR-1W que emplea el principio de suspensión acústica. Posteriormente, a principios de los años 60 Neville Thiele publica "Loudspeakers in Vented Boxes", y junto con Richard Small, ambos ingenieros australianos, establecen los métodos de estudio de los altavoces y los recintos o cajas donde se hallan enclavados. El uso de las cajas bass-reflex (vented box) se inició a principios de los 70 como consecuencia de la aplicación de las teorías de Thiele-Small. Todos los instrumentos musicales, y la voz humana, se halla dentro del rango audible, y ocupa los rangos o regiones del espectro que le corresponden. De todos los instrumentos musicales, el piano ocupa todo el rango de frecuencias, y no en vano se toma a menudo como elemento de prueba o muestra de un equipo hi-fi por este motivo.

    Para cubrir todo el espectro audible, un sólo altavoz no es suficiente. Debido a las características de los altavoces, y la tecnología conocida hoy día, se necesitan al menos dos altavoces o drivers para reproducir todo el rango de frecuencias audibles con una fidelidad aceptable, de modo que uno se encargue de las frecuencias más bajas y el otro de las más altas. Podemos dividir en mayor número de tramos este rango en tres, o incluso cuatro tramos, y destinar a cada uno de ellos un tipo de altavoz diferente. A cada uno de estos tramos se denomina vía, y así existen altavoces (cajas) de 2, 3 ó 4 vías dependiendo del número de tramos en que se ha dividido el espectro. No tiene por qué coincidir con el número de altavoces que tenga la caja. Podemos poner 2 altavoces para los graves y un altavoz para los agudos, y será un sistema de 2 vías con tres altavoces. Atendiendo a la gama de frecuencias que el altavoz es capaz de reproducir, los altavoces o drivers pueden dividirse en:

    • woofer (graves) • midrange (medios) • tweeter (agudos)

    Pero existen altavoces de otros tipos, tales como subwoofers, midbass, etc., que cubren otros

    tramos de frecuencias y que se utilizan en sistemas multivía.

    Para poder distribuir correctamente la energía que se entrega a la caja, hay que dividir la señal que llega a la misma al tipo de señal que cada altavoz requiere. De otra forma estaríamos desperdiciando la energía, o incluso dañaríamos algún altavoz. Para lograr esto, se recurre al crossover, que es un filtro que deja

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 18/65

    pasar cierto rango de frecuencias con más facilidad que otros. La complejidad de estos sistemas, hace necesario el estudio de los mismos en capítulo aparte.

    No todos los altavoces, dentro de la misma gama de potencia, reproducen una misma señal a un mismo nivel sonoro (SPL). Depende de la sensibilidad del altavoz. La mayoría de los altavoces se mueven en el rango de los 80-100 dB w/m. La unidad w/m nos indica el nivel sonoro del mismo cuando reproduce 1w de señal de entrada a la distancia de 1 metro del oyente. A mayor sensibilidad del altavoz, mayor es la sensación sonora que proporciona. Esta consideración es de vital importancia a la hora de elegir los altavoces correctos para un equipo dado. Un amplificador single-ended a triodo, suele ofrecer una potencia de salida de 5 a 10 watios. Si elegimos unos altavoces con una sensibilidad adecuada, el nivel sonoro puede ser equivalente a un equipo de 60w con altavoces menos sensibles. Cada 3 dB de aumento en la sensibilidad, exige la mitad de potencia para ofrecer el mismo nivel sonoro. Ofrece el mismo nivel sonoro un amplificador de 5w con altavoces de 100 dB/w/m que otro amplificador de 80w con altavoces de 88 dB/w/m. Por ello es muy importante elegir la sensibilidad de acuerdo al amplificador. Mi amplificador tiene una potencia de 30w y los altavoces una sensibilidad de 86 dB/w/m. Si quisiera obtener el mismo SPL con un amplificador de 9w, tendría que poner unos altavoces de 91 dB/w/m. El cálculo del incremento en dB es muy sencillo:

    esta cantidad la sumamos a los 86 dB/w/m y obtenemos 91 dB/w/m. Parámetros de Thiele-Small

    Gracias a los parámetros Thiele-Small de un altavoz, se puede predecir cual será la respuesta del

    mismo en varias cajas diferentes. Los parámetros más importantes son los siguientes:

    Parámetros de pequeña señal:

    • Frecuencia de resonancia al aire libre del altavoz F(s).- Es la frecuencia del driver cuando está al aire libre, no ubicado en una caja. Es la frecuencia natural que se puede oir cuando se golpea suavemente el cono del altavoz. Una F(s) típica de woofer está en torno a los 20-80 Hz, los midranges se mueven hacia los 300 Hz, y los tweeters tienen F(s) alrededor de 1 kHz. Normalmente, F(s) coincide con la frecuencia más baja que el altavoz es capaz de reproducir.

    • Q total del altavoz Q(ts).- Se calcula mediante la Q(ms) y Q(es) que son las Q mecánica y Q

    eléctrica del driver correspondiente. Indica cómo de "aguda" es la gráfica de respuesta de frecuencia del altavoz cuando se sitúa en una caja cerrada. Cuanto mayor es Q(ts), la gráfica de respuesta presentará un pico mayor que si Q(ts) fuera menor.

    • Volumen equivalente de suspensión del altavoz V(as).- . Indica el volumen de aire que

    tendría una rigidez equivalente a la de la suspensión del altavoz cuando se comprime con un pistón cuyo tamaño es igual al del cono del altavoz.

    Parámetros de gran señal:

    • Potencia máxima, térmicamente limitada P(t).- Representa la máxima potencia que se puede

    aplicar a un altavoz de forma continua sin que se llegue a deteriorar debido a sobrecalentamiento excesivo.

    • Potencia máxima, mecánicamente limitada P(er).- Este parámetro no puede determinarse

    hasta que el altavoz no se ponga en una caja y depende no solamente de la caja, sino también de la frecuencia de la señal que inyectemos. Un sistema podría manejar perfectamente una señal de 300 Hz, pero podría estar muy limitado para manejar otra de 50 Hz, debido a una excesiva excursión del cono del altavoz.

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 19/65

    • Límite de excursión lineal X(max).- Indica hasta donde puede desplazarse el cono del altavoz antes de que la bobina salga fuera del entrehierro magnético (magnetic gap). Si el cono se desplaza más de lo debido, se incrementa la distorsión del sistema.

    • Área del pistón S(D).- Es el área efectiva del cono del altavoz, medido desde el diámetro

    medio (punto medio) del surround, que es ese material muy blando que une el cono con el aro de chapa exterior del altavoz.

    • Volumen de desplazamiento V(D).- Multiplicando el área del pistón S(D) por la excursión

    máxima X(max) se obtiene el volumen de desplazamiento del altavoz V(D) y es un indicativo de la más baja frecuencia que el altavoz puede reproducir

    Sistemas de altavoces

    La adquisición de unos altavoces es fundamental para disfrutar de las excelencias que ofrece nuestro equipo de audio. Si queremos disfrutar al máximo, la incorporación de unos altavoces de calidad es casi obligada, aunque claro, existen situaciones y soluciones intermedias. Como solución económica, bastaría con adquirir un par de canales, incluso si así lo deseamos autoamplificados. Pero claro, debido a la cobertura que está adquiriendo la reproducción de música en formato MP3 o el vídeo MPEG-2 (DVD) para la mayoría de los usuarios, este sistema se quedaría algo corto. Para ello, sobre la base que hemos comentado, existen alternativas tales como ampliar el número de canales de salida, la inclusión de un subwoofer, o la posibilidad de emplear diferentes efectos digitales para mejorar la calidad del sonido.

    Una de las opciones que más se está utilizando (principalmente en juegos de alto nivel y reproducción DVD), es aquel que se conoce como sonido envolvente o 3D. Para lograrlo lo más habitual es aumentar el número de altavoces hasta 4 (2 delanteros y 2 traseros), para que de este modo (siempre y cuando estos estén correctamente situados), se logre un mayor realismo en el audio y podamos "vivir" las imágenes que vemos en nuestro monitor como si nos encontrásemos dentro de la propia escena. De ese modo todos los sonidos que supuestamente provienen de los laterales o de la parte de atrás de la imagen del monitor, nosotros la escucharemos en 3 dimensiones de la misma manera en la que se desarrolla la acción.

    De todos modos tampoco es necesario que para lograr un sonido envolvente 3D debamos tener

    instalados 4 altavoces y un subwoofer, ya que existen alternativas que con tan sólo dos altavoces, logramos efectos 3D por un precio más reducido. Este sistema, dependiendo de la compañía que lo monte, se conoce como Virtual Surround, Virtual Dolby, CMSS, etc. En muchos casos esta simulación la realiza vía hardware la tarjeta de sonido, aunque también existen modelos a altavoces 5.1 que también cuentan con capacidad para ello. El sentido de esto último se basa en el caso de que conectemos el sistema 5.1 en un equipo con salida estéreo convencional (un reproductor MP3, un walkman, etc). Esta simulación funciona por medio de retardos de tiempo en la reproducción de voces por un lado, efectos por otro, etc; pero presenta un serio inconveniente, y es que el usuario debe colocarse justo en el centro de ambos altavoces y no moverse para no perder el efecto 3D.

    Sistemas 5.1

    Una de las características que más comúnmente encontramos entre las especificaciones de los

    altavoces de gama media / alta que se venden en la actualidad, es aquella conocida como 5.1. Como su propio nombre indica, este es un sistema compuesto por 5 canales independientes además de otro no direccionado o salida dedicada al LFE (efecto de baja frecuencia) para el subwoofer. Aprovechando las capacidades de calidad que 5.1 ofrece, los juegos y películas en DVD ya incluyen una serie de estándares de audio entre los que destacaremos el Dolby Digital y el DTS (Digital Surround), que son los más utilizados. Para dar una mayor eficacia a los sistemas de altavoces 5.1, Dolby Digital utiliza un reparto de los bits que componen el audio en los canales de manera individual. Tal y como su nombre indica, Dolby Digital se trata de una especificación completamente digital que funciona con un máximo de 5.1 canales de información total. Estos 5 canales funcionan con un ancho de banda completa que va desde 20 Hz hasta 20 Khz. De todos modos tiene soporte para una amplia gama de especificaciones entre las que se incluyen opciones desde mono a seis canales. Procedamos a describir cada uno de estos altavoces:

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 20/65

    • ALTAVOCES FRONTALES: los canales izquierdo y derecho (estéreo) correspondientes a los altavoces frontales crean la anchura de la imagen y son los que reproducirán la música, la ambientación y los efectos especiales como los encuadres o las tomas panorámicas de coches y trenes a través de la pantalla, los efectos que se producen “entre bastidores”, teléfonos que suenan o perros que ladran. Junto con el canal surround su propósito es crear una atmósfera auténtica, real y totalmente envolvente. Sus características principales y posicionamiento son:

    o Son los encargados de llevar el peso de la música y los efectos de sonido, así que ambos deberían tener la misma capacidad de respuesta.

    o Deberían estar alineados por delante del altavoz central o a su misma altura, pero jamás detrás de este.

    o Deberían estar distribuidos formando un ángulo de 45o respecto a la posición del oyente. o Es recomendable que estén a la misma altura que el altavoz central

    • ALTAVOZ CENTRAL: este canal se emplea principalmente para acoplar la acción principal y los

    diálogos a la pantalla de televisión o de cine. De este modo, donde quiera que esté sentado el espectador estos sonidos le ayudan a mantener un punto focal relevante de la imagen. Los diálogos de los actores proceden de forma convincente de su fuente origen, centralizando todos los sonidos relacionados con la acción principal que se está desarrollando en la pantalla. Si no existe la posibilidad de un altavoz central, se puede usar el Phantom Mode, según el cual la señal se reproduce usando los altavoces izquierdo y derecho. Sus características principales y posicionamiento son:

    o El altavoz central debería ser idéntico a los altavoces laterales (modo wide). o También podría usarse un altavoz central más pequeño (modo normal), con lo que se

    trasladaría el canal de bajos a los altavoces frontales. o Si fuera necesario, podría pasarse sin un altavoz central (modo fantasma), pero solamente

    en el caso en que el oyente estuviera situado en el centro de la sala. o Debería estar alineado por detrás de los altavoces frontales o a su misma altura, pero

    nunca por delante de estos. o Debería estar elevado a la altura de los tweeters (altavoz de frecuencias altas agudas) de

    los frontales. o No puede estar más lejos de 60cm del televisor y debería estar protegido magnéticamente

    para evitar la distorsión de la imagen.

    • ALTAVOCES SURROUND: el canal surround(envolvente) se utiliza principalmente para los efectos atmosféricos relacionados con la imagen que aparece en pantalla (tormentas, multitudes, ruido de tráfico, sonidos de la selva, etc.). El papel desempeñado por el canal envolvente es añadir profundidad y sumergir al espectador en la acción que se está representando. Para conseguir un efecto totalmente envolvente, algunos de estos sonidos también pueden reproducirse en los altavoces centrales. Todos los efectos especiales de las películas de acción (aviones, explosiones, balas que rebotan etc.) se reproducen por este canal. Sus características principales y posicionamiento son:

    o No necesitan reproducir frecuencias bajas, por lo que pueden ser pequeños. o Su colocación es crucial para conseguir una buena sensación envolvente. A ser posible

    deberían colocarse a unos 60-90cm por encima del oyente a ambos lados del área de escucha, y no detrás. Si esto no fuera posible, algunas soluciones podrían ser:

    Colocarlos en la pared trasera, ya sea enfocándose uno a otro, enfocando hacia el centro de la sala o dirigiéndolos a las paredes trasera y lateral.

    Si no hubiera paredes adyacentes, los altavoces surround pueden colocarse en soportes elevados, encarándose el uno al otro, o a ambos lados o detrás del ángulo de visión enfocados hacia arriba.

    • ALTAVOZ SUBWOOFER: es una canal diferenciado para frecuencias más bajas. Este canal es el

    resultado de aplicar un filtro pasa bajos a la información de los canales frontales. De este modo, por el altavoz subwoofer se reproducirán los graves amplificados de la señal principal, obteniéndose una sensación más envolvente de la música o los efectos especiales. Sus características principales y posicionamiento son:

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 21/65

    o Algunos modelos llevan incorporado un amplificador, mientras que otros están diseñados para reproducir la señal procedente de un amplificador externo.

    o Su colocación en la sala es indiferente, ya que debido a la amplitud de ondas que produce, no requiere ningún tipo de direccionalidad para crear una sensación envolvente.

    En una sala de cine, los altavoces principales (izquierdo, centro y derecho) y el subwoofer se

    colocan detrás de la pantalla. También existen varios altavoces surround derechos e izquierdos dispuestos en las paredes laterales y del fondo de la sala. Todos los altavoces están conectados a amplificadores de potencia.

    3.5. Digitalización del sonido. Nosotros no percibimos todas las ondas que se propagan a nuestro alrededor. Podemos

    comprobar que animales como perros y gatos son capaces de oír frecuencias que nosotros no alcanzamos. El ser humano es capaz de percibir, por término medio, los sonidos que hay en el espectro sonoro desde los 20 Hz a los 20 KHz; es decir, que el sonido más grave que podemos percibir es el que produce una cuerda al oscilar 20 veces por segundo, mientras que el más agudo es el que produce la misma cuerda si vibrase 20.000 veces por segundo. Por tanto, si queremos construir un sistema que grabe el sonido que nos rodea, no nos interesa que lo grabe todo, sino sólo aquellas porciones del espectro de frecuencias que podemos percibir.

    Pero ¿cómo podemos grabar el sonido?. Hasta hace pocos años se utilizaban procedimientos

    analógicos, que trataban de almacenar en un medio físico las variaciones de intensidad que producen la suma de frecuencias que llegan a una membrana. Esa membrana se comporta de una forma parecida a nuestro tímpano, con la diferencia de que en lugar de generar impulsos nerviosos, genera variaciones en una corriente eléctrica que quedan registradas en una cinta magnética. Este sistema de grabación tiene una ventaja y muchos inconvenientes. La ventaja es que es analógico, es decir, que produce un registro cuya intensidad es proporcional a la señal que le llega de forma continua. El sonido analógico no tiene porqué ser peor que el digital, de hecho, en condiciones óptimas, es mejor. Los principales inconvenientes que presenta son, esencialmente, todos los que se desprenden del ruido que aparece en el interior de los circuitos eléctricos y del que genera el rozamiento de los mecanismos: roce de los cabezales contra la cinta, de los motores, del mecanismo de arrastre, de la deformación de la cinta, etc. La calidad de la señal analógica se degrada en la generación de copias y con la reproducción repetida. Por otra parte, tampoco nos ofrece las posibilidades de edición del sonido digital.

    La grabación digital no obtiene un registro de estas variaciones de frecuencia, sino que las analiza

    para extraer su descripción detallada. Como lo que llega a la membrana es una suma de frecuencias, estudiamos esta suma como una sola frecuencia, que tiene dos propiedades fundamentales: frecuencia y amplitud. ¿Cuál es la frecuencia de muestreo necesaria para efectuar un buen registro?. La respuesta es sencilla: el doble de la máxima frecuencia de la señal original que queremos grabar si seguimos el teorema de Nyquist. Así, si lo que queremos es hacer un registro perfectamente fiel de todo el sonido que nos llega perceptible por nuestro oído (20Hz – 20KHz), tenemos que tomar muestras al doble de la frecuencia máxima, 20 KHz. Así, esta frecuencia de muestreo debe ser de unos 44 KHz.

    Ahora bien, ¿cuál es la diferencia mínima que tenemos que registrar en la amplitud de las ondas?

    Se ha demostrado, mediante experimentos de laboratorio, que el ser humano puede diferenciar bastantes matices entre un sonido y otro. Desde luego, son más de los 64.000 intervalos que proporciona un muestreo de 16 bits (216=65.536), pero esta cantidad de muestras es suficiente para satisfacer a la mayoría de los mortales, y es una cifra cómoda para los ordenadores, ya que se trata de la mitad de una palabra de 32 bits.

    Como veremos a continuación, la digitalización del sonido consiste en convertir una señal

    analógica en una secuencia digital y para ello se llevan a cabo dos procesos: Muestreo o discretización temporal: medida del valor de la señal original a intervalos regulares de

    tiempo.

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 22/65

    Cuantización o discretización de la amplitud: aproximación de cada valor medido al valor entero más próximo.

    El sonido, para su manejo en un sistema multimedia, ha de adquirirse por medios electrónicos. El

    primer elemento de la cadena es el micrófono, que convierte las variaciones de presión del medio en señales eléctricas. Éstas son después amplificadas para que alcancen los niveles adecuados para atacar las siguientes etapas del proceso.

    La digitalización consiste en convertir los valores de intensidad de la señal en valores numéricos

    que la representen. Para ello se utilizan circuitos convertidores de analógico a digital ("ANALOG TO DIGITAL CONVERTER", o ADC) que llevan a cabo una conversión o lectura cada cierto tiempo. A cada lectura se la llama muestra y el número de muestras que se toman por segundo es la frecuencia de muestreo. Lógicamente, en algún momento esa misma señal o una versión mezclada, procesada o alterada de ella, ha de volcarse de nuevo al exterior en forma de sonido. Para ello se usa un convertidor de digital a analógico ("DIGITAL TO ANALOG CONVERTER" o DAC) conectado a un amplificador de salida y a un altavoz.

    Figura 8. Proceso completo de digitalización del sonido.

    La precisión con la que el ADC lee los valores de la señal, es decir, el número de bits de la

    representación digital que obtiene, o tamaño de palabra del convertidor, tiene una repercusión directa en la calidad de la señal. En la siguiente figura se puede apreciar claramente este efecto.

    Figura 9. Efecto del tamaño de palabra del convertidor en la calidad de la señal obtenida.

    La frecuencia de muestreo también tiene una influencia clave en la exactitud con la que la señal se

    ve representada en su forma digital, y por tanto en la fidelidad con la que se reproducirá después. Esto se aprecia en la figura 10, en la que se puede comprobar el efecto de deformación "aliasing" que aparece al muestrear una señal a una frecuencia menor al doble de su frecuencia. Efectivamente, según se formaliza en el Teorema de Nyquist, la frecuencia de muestreo debe ser al menos doble que la máxima frecuencia de la señal que se pretenda conservar. Por tanto, para obtener una sensación sonora fiel a la que se tendría frente al sonido original, la frecuencia de muestreo ha de ser superior a 40.000 muestras por segundo.

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 23/65

    Figura 10. Efecto de la frecuencia de muestreo del convertidor en la calidad de la señal obtenida.

    3.6. Edición de sonido digital. Una de las mayores ventajas del sonido digital es la enorme flexibilidad que ofrece a la hora de

    editar el sonido. Una vez digitalizado el sonido y convertido en una secuencia de números, los programas de edición de sonido digital permiten aplicar operaciones matemáticas a dichos números para hacer todo tipo de modificaciones en el sonido original.

    Se pueden clasificar las técnicas de edición de sonido digital atendiendo al aspecto del sonido que

    se modifica. Las propiedades del sonido que podemos modificar y las operaciones que podemos realizar sobre las mismas son:

    • MODIFICACIÓN DE LA DIMENSIÓN TEMPORAL:

    o Cortar, copiar y pegar: lo que en la edición de sonido analógico se hacía cortando y pegando fragmentos de cinta magnética, se lleva a cabo ahora de manera sencilla con técnicas de manipulación directa. Para evitar ruidos en las transiciones, conviene seleccionar fragmentos con comienzo y final de valor nulo.

    o Cambio de sentido: comenzar la reproducción de un sonido por el final y terminar por el principio.

    o Eliminar silencios: se define una amplitud por debajo de la cual el sonido se considera silencio, y se eliminan esos fragmentos. Puede servir para quitar las porciones inicial y final de una grabación, así como para eliminar las porciones de silencio entre sonidos.

    o Insertar silencios: de una duración determinada a partir de la posición del cursor.

    • MODIFICACIÓN DE LA AMPLITUD MEDIANTE OPERACIONES DE MULTIPLICACIÓN:

    o Modificar la ganancia: multiplicar las muestras por un número real. Al multiplicar por un valor entre 0 y 1 el nivel sonoro disminuye y si el valor es mayor que 1, aumenta.

    o Silenciar: multiplicar por cero las muestras de la zona seleccionada. o Umbral de ruido (“noise gate”): silencia las muestras por debajo de un determinado

    valor umbral. Permite eliminar el ruido de fondo, pero solo en aquellas porciones en las que no hay otros sonidos. También consigue que los ataques y decaimientos de los sonidos sean más bruscos.

    o Normalizar: es un caso particular de modificación de la ganancia que obtiene la máxima amplitud posible sin que se produzca distorsión. Para ello, se recorre todo el fragmento de sonido y se registra la mayor amplitud de onda. Se calcula el cociente entre la mayor amplitud de onda posible y la mayor amplitud registrada. Finalmente, se multiplican todas las muestras por dicho cociente.

    o Aplicación de envolventes: las envolventes son curvas que determinan la evolución temporal de la amplitud. Una envolvente puede especificar, por ejemplo, un aumento gradual del volumen al principio de un sonido, y una disminución brusca del mismo al final.

    o Fundido de entrada y de salida (“fade in” y “fade out”): son dos envolventes muy utilizadas. El fundido de entrada tiene valor inicial cero, y valor final uno y se

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 24/65

    usa para darle un comienzo progresivo al sonido. El fundido de salida tiene un valor inicial 1 y valor final 0 y sirve para darle un final progresivo al sonido.

    o Modulación de la amplitud con una señal periódica: El efecto sonoro que se consigue es una variación cíclica del volumen (“trémolo”)

    o Inversión: hacer una reflexión de las muestras con respecto al eje horizontal, con lo que los valores positivos pasan a ser negativos y viceversa (cambio de fase). Se trata de un efecto sutil que se percibe mejor cuando se aplica a uno de los dos canales de un sonido estéreo.

    • MODIFICACIÓN DE LA AMPLITUD MEDIANTE OPERACIONES DE SUMA:

    o Mezclar: se suman los valores de dos fragmentos de sonido. o Desplazamiento del cero (“DC Bias Offset”): algunas tarjetas de sonido tienen un

    error constante al digitalizar, con lo que el cero queda desplazado. Si se graba un fragmento de silencio, la línea horizontal queda por debajo o por encima del eje horizontal. Hay programas de edición de sonido que pueden detectar y corregir este error.

    • MODIFICACIÓN DE LA FRECUENCIA:

    o Cambio de la frecuencia de reproducción: si un sonido muestreado a 44,1 KHz. se reproduce a 22,05 KHz. sonará una octava más grave y durará el doble de tiempo. El fichero original no se modifica.

    o Remuestreo: a partir de las muestras de un sonido digital, aumentar o disminuir su frecuencia de muestreo, añadiendo o eliminando muestras respectivamente. Para pasar de 44,1 KHz. a 22,05 KHz. se elimina una muestra de cada dos. Antes de remuestrear a una frecuencia más baja, conviene filtrar el sonido original y eliminar las frecuencias superiores a la mitad de la nueva frecuencia de muestreo. Para pasar de 22,05 KHz. 44,1 KHz., se crea por interpolación una nueva muestra entre cada dos. Hay que aclarar que este proceso no mejora la calidad del sonido, pero puede ser necesario por razones de compatibilidad entre programas o ficheros de sonido.

    o Transposición: es un término musical que significa subir o bajar la altura de una melodía uno o más semitonos. La transposición supone una variación de la duración del sonido: dura más cuanto más grave, y menos cuanto más agudo.

    o El “pitch bend” o modificación continua de la frecuencia: es similar a la transposición, pero en vez de realizarse en intervalos discretos (semitonos) se lleva a cabo de forma continua. Se puede definir la evolución de la frecuencia en el tiempo mediante una envolvente. El efecto musical así obtenido se llama “glissando” y equivale a desplazar la mano izquierda sobre el mástil de una guitarra mientras suena una cuerda.

    3.7. El estándar M.I.D.I. El MIDI (Musical Instrument Digital Interface) es un protocolo para comunicar entre sí

    instrumentos musicales electrónicos. Es un método para describir la música mediante comandos, y es por lo tanto mucho más compacto que su equivalente en sonido digitalizado.

    Este protocolo de comunicaciones de datos permite a un instrumento musical controlar a otro. El

    instrumento controlador recibe el nombre de MAESTRO o MASTER y el instrumento o instrumentos controlados recibe el nombre de ESCLAVOS.

    También es posible desde un ordenador controlar la mayoría de los instrumentos musicales

    electrónicos y capturar y almacenar la información que genera la ejecución de un intérprete sobre un instrumento.

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 25/65

    El estándar MIDI data del año 1983 y fue tal su éxito que se mantiene con pocos cambios desde

    entonces. Su meta inicial era conseguir que desde un teclado central se pudieran controlar distintos instrumentos musicales electrónicos interconectados, pero con el uso de ordenadores, el MIDI se convierte además en una herramienta para distintas aplicaciones musicales: ayuda a la composición, docencia, edición de partituras...

    Podemos distinguir tres aspectos de este estándar de comunicación:

    • Las especificaciones físicas: conectores, tensiones, etc. • Las especificaciones de datos: notas. • Las especificaciones de control: cambios de sonido, velocidad, frecuencia, etc.

    3.7.1. Descripción del estándar M.I.D.I. El estándar M.I.D.I. es un protocolo de comunicaciones serie (similar al RS-232) asíncrono. Su

    velocidad de transmisión es de 31,25 Kbaudios. Dentro de este estándar podemos diferenciar las especificaciones que se describen en los aparatados siguientes.

    3.7.2. Interfaz M.I.D.I.

    La interfaz es el dispositivo electrónico que se encarga de enviar y recibir información M.I.D.I. hacia y desde otros dispositivos. El interfaz M.I.D.I. transmite información digital por una línea y la recibe por otra. Cada dispositivo debe contar con una interfaz M.I.D.I.

    El conector que recibe información, recibe el nombre de M.I.D.I. IN. El que transmite la

    información recibe el nombre de M.I.D.I. OUT y el encargado de retransmitir la información que pasa por el M.D.I. IN se llama M.I.D.I THRU. Este último conector se utiliza para conectar más de dos dispositivos M.I.D.I.

    Los tres son conectores DIN hembra de 5 pines (figura 14). Los cables MIDI siempre conectan el

    MIDI OUT o el MIDI THRU de un dispositivo con el MIDI IN de otro, y no deben tener una longitud superior a 15 metros.

    Figura 14. Formato de los conectores M.I.D.I.

    3.7.3. Los canales M.I.D.I.

    El sistema M.I.D.I. estructura la información en 16 canales diferentes simultáneos, que permiten dirigir los mensajes individuales a 16 instrumentos distintos. Cada mensaje lleva su número de canal al que afecta, de manera que no hay confusión posible.

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 26/65

    Cada canal MIDI permite implementar un instrumento virtual diferente. En un sintetizador hay

    que distinguir 2 conceptos:

    • Capacidad polifónica: numero máximo de notas que puede reproducir simultáneamente. • Capacidad multitímbrica: numero máximo de instrumentos musicales diferentes que se

    pueden reproducir simultáneamente.

    Los sintetizadores MIDI suelen tener una polifonía de 32 ó más notas, y una capacidad multitímbrica de hasta 16 (límite determinado por los 16 canales de estándar MIDI). Los instrumentos que puede reproducir un sintetizador MIDI se llaman también “programas”. Para activar un instrumento determinado, basta con mandar un mensaje de Program Change junto con el número de instrumento que se desee. Si el sintetizador es multitímbrico, se pueden mandar varios mensajes de Program Change, cada uno a un canal MIDI diferente. Inicialmente, los números de los instrumentos en los sintetizadores MIDI no estaban estandarizados, por lo que al reproducir un tema compuesto en otro sintetizador, un piano podía oírse como una flauta. Para resolver este problema, y como complemento del estándar MIDI 1.0, surgió en 1990 el General MIDI (GM), que entre otros aspectos incluye:

    • Polifonía mínima de 24 notas. • Capacidad multitímbrica de 16 canales. • Lista estándar de 128 instrumentos o “programas”, numerados del 0 al 127, o del 1 al 128,

    según los fabricantes. • Caja de ritmos en el canal 10 con una lista estándar de 59 sonidos de percusión.

    El estándar General MIDI no dice nada sobre la calidad de la simulación de los instrumentos, por

    lo que ésta puede variar enormemente de un sintetizador a otro. Algunos fabricantes han creado extensiones del General MIDI , como el General Standard de Roland o el XG de Yamaha.

    3.7.4. Conexionados M.I.D.I.

    Las diferentes conexiones que nos podemos encontrar entre elementos M.I.D.I. son las siguientes:

    • CONEXIONADO BÁSICO: se necesitan por lo menos dos teclados, uno que transmita información (MAESTRO) y otro que la reciba (ESCLAVO). Este tipo de conexión se realiza utilizando los conectores MIDI IN y MIDI OUT.

    • CONEXIONADO ENCADENADO DAISY O SERIE: en este tipo de conexión se hace uso del conector MIDI THRU.

    • CONEXIONADO EN PARALELO: se necesita un elemento llamado “Caja de Enlace Directo”. Consiste en una caja derivadora con varias entradas y salidas MIDI. De esta forma, se pueden alimentar los teclados o elementos esclavos en paralelo.

    3.7.5. Mensajes M.I.D.I. Aunque no es necesario conocer en profundidad todos los mensajes MIDI unas nociones

    generales sirven para utilizar con más aprovechamiento los programas secuenciadores. Un mensaje MIDI está formado por:

    • Un byte de estatus que tiene siempre el bit más significativo a 1. Los tres siguientes bits

    codifican el tipo de mensaje, y los cuatro bits menos significativos codifican el canal. • Uno o dos bytes de datos, según el tipo de mensaje, con el bit más significativo siempre a

    cero.

    En esta tabla se describen los ocho tipos de mensajes MIDI:

  • Tema 3.- Audio.

    Tecnologías para los Sistemas Multimedia – Curso 2004/05 - 27/65

    Nº Nombre Estatus (hex.) Datos 1 Datos 2 1 Note On 8c Altura Velocidad 2 Note Off 9c Altura Velocidad 3 Polyphonic Aftertouch Ac Altura Presión 4 Control Change Bc Tipo de Control Intensidad 5 Channel Aftertouch Cc Presión --- 6 Pitch Bend Dc MSByte LSByte 7 Program Change Ec Programa --- 8 System Message Fc ---

    Los siete primeros se llaman genéricamente mensajes de canal, porque actúan sobre un único

    canal a la vez (el codificado en los cuatro bits menos significativos del byte de estatus. Los mensajes de sistema tienen una estructura diferente y no se aplican a ningún canal en concreto.

    Un dispositivo MIDI no tiene porqué generar o entender todos los mensajes. Cuando un

    dispositivo MIDI recibe un mensaje que no entiende, simplemente lo ignora, y lo reenvía por el puerto MIDI THRU. A continuación se describen las características más importantes de los mensajes de canal:

    • Note On: se genera al pulsar una tecla en el teclado, e indica que debe comenzar la

    reproducción de esa nota. El primer byte de datos indica la altura, desde 0 (la nota más grave) hasta 127 (la más aguda). Así pues el estándar MIDI tiene una extensión de más de 10 octavas (un piano tiene poco más de 7). La nota 60 corresponde al Do central del piano. El segundo byte de datos indica la velocidad de ataque, que depende de la fuerza con la que se pulsa la tecla. Este parámetro se asocia normalmente con la intensidad sonora. La velocidad cero se usa para desactivar la nota si está sonando. Los teclados que no detectan la velocidad de ataque generan siempre un valor de velocidad de 64.

    • Note Off: sirve para desactivar una nota que está sonando, y se genera al soltar una tecla

    del teclado. El primer byte de datos contiene la nota soltada, y el segundo la velocidad de liberación, pero se usa más el mensaje Note On con velocidad cero.

    • Polyphonic Aftertouch: algunos teclados detectan la presión ejercida sobre cada tecla en

    cada momento. Cuando se produce un cambio de presión se produce este mensaje. En el primer byte de datos se almacena la nota, y en el segundo, la presión. El sintetizador suele utilizar el parámetro de presión para modificar el nivel sonoro y el timbre. Como este mensaje se genera en grandes cantidades (varias decenas por segundo por cada tecla pulsada) es habitual poder desactivarlo para evitar exceso de tráfico.

    • Channel Aftertouch: es una versión simplificada del Polyphonic Aftertouch. En vez de

    generar un mensaje por cada nota, se genera un solo mensaje para todo el canal, cuyo valor es la mayor presión de todas las detectadas.

    • Pitch Bend: con este mensaje se desafinan momentáneamente las notas (± 2 semitonos

    según el estándar General MIDI). El control que suele generar estos mensajes (varias decenas por segundo) en los teclados es una rueda giratoria que vuelve sola a su posición inicial. Lo