voz forense

Voz ForenseAndrs Flores

Tratamiento del HablaSe refiere al desarrollo de sistemas concernientes con la cualidad humana del habla.

IntroduccinEl Habla es:La principal forma de comunicacin de los seres humanos.Es eficiente y natural para expresar ideas, intenciones y deseos.Se requiere que este proceso sea imitado, desarrollado por sistemas electrnicos

Tratamiento del Habla El objetivo principal del TH es :Cuantificar, representar y extraer la informacin contenida en una seal de voz.Generacin del Habla: Crear voz sinttica, mquinas parlantes.Codificar la seal de voz para ser transmitida de forma eficiente.

Clasificacin del THModelado del Proceso del hablaSntesis de VozCodificacinReconocimiento del Habla, Mejoramiento de la voz, Modelado del Lenguaje OralLingstica Computacional.

El Proceso del HablaLa seal de voz es una forma de onda acstica producida por un mecanismo fsico.El mecanismo fsico corresponde al movimiento voluntario estructuras anatmicas que forman parte del Sistema de Tracto Vocal del ser humano.

Caractersticas de la Seal de VozUna seal de voz es un forma de onda acstica originada por un mecanismo fsico provocado en el tracto vocal.Ondas de Presin de aire.Se registra mediante un micrfono.Ancho de banda de 300 a 10khz.

Tracto Vocal

Representacin esquemtica del Proceso de produccin del Habla

Representacin de la seal de voz

Palabra ceroDigitalizacin:Frecuencia de muestreo 16Khz a 16 bits

Porcin de seal s

Porcin de vocal e

Porcin r

Porcin o

Tipos de sonidos en la seal de vozSonidos voclicos: se originan cuando las cuerdas vocales se tensionan y el aire que fluye desde los pulmones provocan su vibracin. Vocales a, e, i, o, etc.Sonidos no voclicos: cuando las cuerdas vocales estn relajadas y el aire fluye a travs del tracto. Pueden ser:Fricativas: s, sh, f, etc.Plosivas: t, p, k

Sonidos VoclicosObtenido de: http://www.indiana.edu/~hlw/index.html

ConsonantesObtenido de: http://www.indiana.edu/~hlw/index.html

Modelo Source-Filter del Tracto VocalEl modelo contempla el proceso del habla en tres partes:La fuente, puede ser peridica (Pitch) o ruido.La funcin de Transferencia, modela las resonancias Caracterstica de Radiacin de los labios.

Hoja1

F0(Hz)Promediominmax

Hombres12580200

Mujeres225150350

Nios300200500

Hoja2

Hoja3

Importancia del AnlisisDiscriminacin de porciones sonoras (voclicos) y no sonoras. Voiced and Unvoiced Speech.Determinacin de aspectos espectrales. FormantesDeterminacin de Energa espectral y temporal.Determinacin de Frecuencia Fundamental tambin conocido como Pitch (F0).

Tipos de AnlisisAnlisis Temporal (Short Time Analysis)Anlisis EspectralAnlisis LPCAnlisis Cepstral

Anlisis TemporalAnlisis de EnergaAnlisis de cruces por ceroAutocorrelacin

Anlisis de Energa

Anlisis temporal usando diversas tamaos de ventanas

Anlisis EspectralAnlisis espectral de tiempo cortoImportancia en el uso de ventanasUso de Periodograma de WelchEspectrogramaAnlisis de formantes

Espectro de una seal de VozTono Fundamental

Espectrograma de VozBANDA ANCHAVentana de anlisis: 6,7 ms

Espectrograma de VozBANDA ANGOSTAVentana de anlisis: 45ms

Anlisis LPCConsidera un modelo todo polos para el proceso de generacin del habla.El modelo considera las resonancias que se generan en el tracto vocal.

Modelo del Sistema Fonador Seal de Pulsos PeridicoRuido AleatorioSistema LinealV(z)vozExcitacin / Fuente de sonidoSonoridad, tonoTracto VocalFonemas / AlfonosPitch F0ParmetrosU(z)H(z)S(z)

FormantesFrecuencias que corresponden a las resonancias de un sonido voclico en particular.Caracterizan a un filtro que modela la voz en una porcin de tiempo.Tiempo mnimo 20 ms.

F1F2F3F4

Estimacin de Formantes

El proceso del habla es la principal forma por medio del cual se comunican los seres humanos. Es eficiente y natural para nosotros expresar nuestras ideas, intenciones y deseos por medio de la voz. Es por ello que actualmente se quiera que esta cualidad tan nica sea imitada por sistemas informticos. Hemos sido testigos del desarrollo de sistemas tales como la telefona bsica y ahora estn comenzando a surgir sistemas de reconocimiento y sntesis de voz que eventualmente darn cabida a sistemas de dialogo automtico. Un sistema de dilogo automtico funcional ser la principal interfase que se tendr con las mquinas. Para lograr esto hace falta la integracin de diversas disciplinas. En esta charla se darn a conocer las distintas tecnologas que conforman el estado del arte en el tratamiento del habla. Herramientas matemticas, software especializado, Reconocimiento, sntesis y codificacin de voz estarn entre los temas que se expondrn.

voz forense

Documents