aplicacion de descriptores de sonido
TRANSCRIPT
Aplicacion de metodos de descripcion de sonidos
Universidad Nacional de TrujilloIngenierıa informatica
Orlando Salazar Campos
Daniel Cam [email protected]
Palabras claves
Multimedia, metodos, descriptores, sonido, texturas
1 Introduccion
El objetivo del resumen es revisar los metodos de medicion conocidos y descriptores objetivasexistentes para la cuantificacion de campo de sonido. Se vera algunos conceptos, los meritos,las deficiencias y el uso potencial. La aplicacion de los descriptores sera: la construccion dedescriptores de audio perceptiva de alto nivel para los sonidos de textura.
Para hacer musica en la era digital, las tecnicas para la navegacion eficiente en el vastouniverso de almacenar digitalmente sonidos se han vuelto indispensables.
Se detallara tambien la construccion de descriptores computables capaces de modelarcualidades perceptivas relevantes de sonido.
2 Metodo
La idea general de este trabajo es construir descriptores perceptuales de una representacionsubyacente uniforme para los datos de audio digitales con unos pocos pasos de procesamientoy un numero pequeno (para evitar el peligro de exceso de ajuste desde el principio) deparametros ajustables. Estos parametros se pueden ajustar para que coincida con puntua-ciones de percepcion de sonidos de un cuerpo representativo.
3 Tipos de metodos de descriptores
3.1 Descriptor de alto-bajo
Esta caracterıstica de audio esta bastante bien representado por el descriptor de audio Per-ceptualSharpness existente, que es el ”equivalente perceptual al centroide espectral perocalcula utilizando la sonoridad especıfica de las bandas Bark”. Este ultimo ya esta pro-porcionado por nuestra representacion tiempo-frecuencia elegida, por lo que solo tienen quecalcular los centroides espectrales, pero no sin la aplicacion de algunos coeficientes de defor-macion sintonizables.
3.2 Descriptores para ordenado-caotico
Tenemos la sospecha de que la percepcion del orden contra el caos no es sensible con respectoa la intensidad, sino mas bien para temporal estructura. Por lo tanto, lo primero quitamosla direccion de la ecografıa con respecto al volumen de filtrado de paso alto a lo largo del ejede tiempo. Esto se hace mediante la sustraccion de una convolucion el volumen medio (entodas las frecuencias)
1
Figure 1: Mapa mosaico interactivo para navegar por los sonidos de textura
3.3 Descriptor de lisa-gruesa
Es intuitivo para identificar la nocion de grosor con cambios bruscos en la intensidad masamplias gamas de frecuencia. Por lo tanto, calculamos las diferencias absolutas a lo largodel eje de tiempo e integrar a lo largo del eje de frecuencia. Por esa usamos una mediageneralizada la maxima exponente ε, con lo que apretando las diferencias de magnitud entrelas bandas de frecuencia individuales.
3.4 Descriptor de ruido-tonal
La nocion de pitchedness se expresa comunmente por el presencia espectral fuerte, aisladoe inmovil componentes. Esto se opone a un continuo espectral fluctua en el tiempo, lo queindica el ruido.Como prueba de concepto, una aplicacion de navegador sonido prototıpico 8se ha desarrollado que proporciona una adecuada visualizacion de las cualidades perceptivasbajo examen, mediante el uso de valores de descriptor calculados para el conjunto de los100 sonidos de textura. La figura 1 muestra una captura de pantalla de las principalescorrelaciones apenas degrada, las correlaciones laterales son notablemente mas reducido.
4 Conclusiones
Hemos detallado la construccion de descriptores de audio capaz de modelar cualidades de altonivel, metaforicas de sonido de textura que se han identificado como perceptivamente rele-vantes en la investigacion anterior. Cada uno de del descriptores contiene un pequeno numerode parametros ajustables que se han sintonizado a un corpus de 100 texturales-sonidos ensu mayorıa abstracto y del medio ambiente. La evaluacion ha dado las correlaciones dePearson entre los descriptores de audio y valoraciones humanas obtenidas de pruebas de es-cucha de arriba 0,74 para las construcciones ordenado-caotico, suave gruesa, tonal-ruidoso,homogeneo-heterogeneo y hasta 0,90 para la construccion de maximos y mınimos.
5 Referencia
5.1 webgrafıa
• Diemo Schwarz, DESCRIPTOR-BASED SOUND TEXTURE SAMPLING,2010. Disponibleen: urlsmcnetwork.org/files/proceedings/2010/75.pdf
• Stanislav Barton, Qualitative Comparison of Audio and Visual Descriptors Distribu-tions ,2011. Disponible en: urlhttp://www.xtec.cat/ pmarques/uabtranp/sld032.htm
2