voz forense

35
Voz Forense Andrés Flores

Upload: juan-carlos-lizana-flores

Post on 10-Sep-2015

224 views

Category:

Documents


2 download

DESCRIPTION

voz forense

TRANSCRIPT

  • Voz ForenseAndrs Flores

  • Tratamiento del HablaSe refiere al desarrollo de sistemas concernientes con la cualidad humana del habla.

  • IntroduccinEl Habla es:La principal forma de comunicacin de los seres humanos.Es eficiente y natural para expresar ideas, intenciones y deseos.Se requiere que este proceso sea imitado, desarrollado por sistemas electrnicos

  • Tratamiento del Habla El objetivo principal del TH es :Cuantificar, representar y extraer la informacin contenida en una seal de voz.Generacin del Habla: Crear voz sinttica, mquinas parlantes.Codificar la seal de voz para ser transmitida de forma eficiente.

  • Clasificacin del THModelado del Proceso del hablaSntesis de VozCodificacinReconocimiento del Habla, Mejoramiento de la voz, Modelado del Lenguaje OralLingstica Computacional.

  • El Proceso del HablaLa seal de voz es una forma de onda acstica producida por un mecanismo fsico.El mecanismo fsico corresponde al movimiento voluntario estructuras anatmicas que forman parte del Sistema de Tracto Vocal del ser humano.

  • Caractersticas de la Seal de VozUna seal de voz es un forma de onda acstica originada por un mecanismo fsico provocado en el tracto vocal.Ondas de Presin de aire.Se registra mediante un micrfono.Ancho de banda de 300 a 10khz.

  • Tracto Vocal

  • Representacin esquemtica del Proceso de produccin del Habla

  • Representacin de la seal de voz

  • Palabra ceroDigitalizacin:Frecuencia de muestreo 16Khz a 16 bits

  • Porcin de seal s

  • Porcin de vocal e

  • Porcin r

  • Porcin o

  • Tipos de sonidos en la seal de vozSonidos voclicos: se originan cuando las cuerdas vocales se tensionan y el aire que fluye desde los pulmones provocan su vibracin. Vocales a, e, i, o, etc.Sonidos no voclicos: cuando las cuerdas vocales estn relajadas y el aire fluye a travs del tracto. Pueden ser:Fricativas: s, sh, f, etc.Plosivas: t, p, k

  • Sonidos VoclicosObtenido de: http://www.indiana.edu/~hlw/index.html

  • ConsonantesObtenido de: http://www.indiana.edu/~hlw/index.html

  • Modelo Source-Filter del Tracto VocalEl modelo contempla el proceso del habla en tres partes:La fuente, puede ser peridica (Pitch) o ruido.La funcin de Transferencia, modela las resonancias Caracterstica de Radiacin de los labios.

    Hoja1

    F0(Hz)Promediominmax

    Hombres12580200

    Mujeres225150350

    Nios300200500

    Hoja2

    Hoja3

  • Importancia del AnlisisDiscriminacin de porciones sonoras (voclicos) y no sonoras. Voiced and Unvoiced Speech.Determinacin de aspectos espectrales. FormantesDeterminacin de Energa espectral y temporal.Determinacin de Frecuencia Fundamental tambin conocido como Pitch (F0).

  • Tipos de AnlisisAnlisis Temporal (Short Time Analysis)Anlisis EspectralAnlisis LPCAnlisis Cepstral

  • Anlisis TemporalAnlisis de EnergaAnlisis de cruces por ceroAutocorrelacin

  • Anlisis de Energa

  • Anlisis temporal usando diversas tamaos de ventanas

  • Anlisis EspectralAnlisis espectral de tiempo cortoImportancia en el uso de ventanasUso de Periodograma de WelchEspectrogramaAnlisis de formantes

  • Espectro de una seal de VozTono Fundamental

  • Espectrograma de VozBANDA ANCHAVentana de anlisis: 6,7 ms

  • Espectrograma de VozBANDA ANGOSTAVentana de anlisis: 45ms

  • Anlisis LPCConsidera un modelo todo polos para el proceso de generacin del habla.El modelo considera las resonancias que se generan en el tracto vocal.

  • Modelo del Sistema Fonador Seal de Pulsos PeridicoRuido AleatorioSistema LinealV(z)vozExcitacin / Fuente de sonidoSonoridad, tonoTracto VocalFonemas / AlfonosPitch F0ParmetrosU(z)H(z)S(z)

  • FormantesFrecuencias que corresponden a las resonancias de un sonido voclico en particular.Caracterizan a un filtro que modela la voz en una porcin de tiempo.Tiempo mnimo 20 ms.

  • F1F2F3F4

  • Estimacin de Formantes

    El proceso del habla es la principal forma por medio del cual se comunican los seres humanos. Es eficiente y natural para nosotros expresar nuestras ideas, intenciones y deseos por medio de la voz. Es por ello que actualmente se quiera que esta cualidad tan nica sea imitada por sistemas informticos. Hemos sido testigos del desarrollo de sistemas tales como la telefona bsica y ahora estn comenzando a surgir sistemas de reconocimiento y sntesis de voz que eventualmente darn cabida a sistemas de dialogo automtico. Un sistema de dilogo automtico funcional ser la principal interfase que se tendr con las mquinas. Para lograr esto hace falta la integracin de diversas disciplinas. En esta charla se darn a conocer las distintas tecnologas que conforman el estado del arte en el tratamiento del habla. Herramientas matemticas, software especializado, Reconocimiento, sntesis y codificacin de voz estarn entre los temas que se expondrn.