i148.206.53.84/tesiuami/uam8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas...

67
i: DE

Upload: phungnhu

Post on 10-Dec-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

i : DE

Page 2: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

2 2

1, Transmisibn serial a la PC, utilizando el Buffalo. GuBrdBr en memoria RAM el mu$!streo de voz.

@ Manejar correctamente la tarjeta digitdl del 68HCll. Manejo correcto de las banderas a utilizar. xmplemnentar ad circuikekía auxiliar de i a tarjeta. Desarrolla de la t eo t í a matealhtica a utilizar. Investigacibn m5 qbundqnte $obre las características de la voz en espectros, frecuencia, arm6nicos etc.

e Ebtregar el reporte Wicnico. Realizacibn del algoritmo para el anhlísis en frecuencia.

o RcalizaCi6n d e l antiliais en frecuencia. Grafic&ibn de la voz como variaciones de la presión en e l t icmpo . Graficaci6s del mpectxo de la voz tanto en amplitud como en frecuencia.

O Conclusiones y tesultados.

a Identificación electr6nica de los diferevtes sonidos

* Ejecución de 10s comandos a partir de su decodificacibn vocSlicos.

Page 3: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

3

El deseo de hacer un proyecto nuevo para nosstr~s, nos llev6 a escoger el mismo. Iniciamos leyendo bibliografía referente a la VOZ, para determinar la frecuencia de muestre0 y de transmisidn, así, realizamos los cSlculos mediante los cuales deseamos muastrear nuestra sefial (voz) se desarro&lo un sistem mínimo que nos permite el guardado en memoria y la transmisidn serial de datos a la PC. El sistema rninfmo fue armado y probado, se realizd el programa que efectda la transmisib, ademas, de que se tuvo que investigar y analizar la minera como se llevaria a cabo la transmisidn del sistema rninimo a la PC, utilizamos el manual del 68HCll y el apoyo de personas que tenfan experiencia en este rubro.

Leimos qti& banderas se activan en cada registro interno del Micro, ya que depende en gran medida de conocerlas para que funcione adecuadamente nuestra transmisi6n. Implementamos un circuito que conecta a la entrgda del 68HCl1, el cual consiste en un SISTEMA de A " Q P que realiza una amplificwibn de la seaal de la VOZ de 4 volts pico pico y anade un offset de 2 volts,eSto es debido a que la digitalización de la sefial se da en de 0 a 4 volts.

SOFTWARE El softwZrre que apoyo nuestro trabajo, fue realizado

mediante el programa Bfifalo,realiaamas un programa. en ansamblador para el 68HCll con transmisih serka1,un programa en lenguaje C con graffcacibn de sefiales.

HAR1)WARE El hardware u28ado fu4:un Rticr6fono cotno transductor de las

seeales sonoras a elktricas, un circuito de amplificaci6n y suma de offset mediante amplificadores operacionales un M68HCllEVBU, una PC 486.

Se , pretende! enviar a l a PC: la seiral de la voz una vea digitalizada para procesar la infmmacibn contenida en esta y mediante el uso de la transformada de Fourier coLl~cer los camponentea en Erecuencia y las amplitudes relativas entre frecuencia fundamental y armóalicos, a fin de que nos pezmita identificar la8 diferentes vocales para una seAaL determinada y de esta forma poder ejecutar comandos mediante el uso de la VQZ.

Page 4: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

4

El $onidO es la percepcibn de onqa3 rnechnicas que por SUS características en intensidad y en frecuencia puederi ser percibidas por el old0 humano, Las frecuepcias mas bajas de la$ percibidas por el oído humals~ $on consideradad como infra$onidoSI mientras que las frecuencias mas a l t a que las que puede percibir el oido humano son ccme;iderg&S corn0 ultrasanidos,

tJn oído perqibe $Onid05 desde watt/m2 equivalente a O & hasta un m5xima de .1 watt/ ma equivalente B 120 dB; para donidos mas intensos el Oído no los percibe como ma3 intensos pues a partir de los 120 dB empieza el umbral del doloE.

En cuanto a intensidad, el sonido mas intensa es un millón de millones de veces, esto es 1 ~ 1 0 ~ ~ mayor que el sonido mas QC3bil apenas perceptible,.

La percepci6n psicolCrgica de la intensidad @e un sonido 8s aproximadamente propdrcional al logaritmo de la intensidad fisica. (Ley de Fechner: la sensaci6h crece como el logaritmo tiel estímulo) .

El cambio en intensidad miniLao capaz d4 registrar un oído es aproximadamente del 25% de ahí qua 8ea tzrc &ibd

equivalente a 1fln = l f i = 1,2585125 la unidad para med$r intensidades, bride un aumento de 10 dB equivale a 10 vece@ la intensidad, ae 20 dl3 equiva:te a 100 veces l a intensidad de

n dB equivale a 1 0 6 = vec,es la intensidad; as i :

1

Page 5: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

5 5

El oido hwano normal percibe sonidos a partir de los 20 HZ hasta 10s 20 W z i este ancho de banda disminuye con la edad. Frecuencias mas bajas CcXreSpQnden a los infrasonidos y frecuencias has altas a los ultiasonidos, ambos inaudibles para el ser humano. En cuanto a freaudhcia, el simido perceptible mas agudo es 1000 veces la frecuencia del mas grave, habiendo tres ordenes d.e magnitud equivalentes a 9.96 octavas entre e l sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido (tono) I es proporcional al logaritm) de la frecuencia (Ley de Fechrier) .

El oído humano normal es capaz de percibir f8cilmsntc diferencia$ de un semitono, Oídos sensibles, cuartos de tono, y solo oidos de &uy a l t a sensibilidad, intervalos Be una octava de tono o menores.

Dado que las octavas $e dividen en 12 semitonos:

La tabla anterior representa el factor a multiplicar de una frecuencia gue aumenta en el timo mencionado.

Page 6: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

6

2b = 20

Page 7: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

7

Teorema del muestrjeo, cormcímiento del microcontrolador 68RC11AIP, lenguaje de 1 ensamblador de dicho microcontroladox,

Por medio dQl Gistema mínimo del 68HC11ATP se apoyó la realización del proyecto. La voz se transforma de onda lmecknica a onda elkctrica por medio de un transquctor, se s u a a un voltaje offset y polsteriormente es amplificada para enviarla al convertidor mal6gico digital y una vez digitalizada se guarde .en la m.emoria RAM del 68HC11.

El puerto ser ia l asíncrono en una IBM PC, PC/XT, y PCIRT convierten datos de forma paralela a format serial para la comunicación entre la computadora y un dispositivo externo-. La cmexi6n fisica consiste e:n un cable RS-232C-e~tandar que enlaza los dos dispositivos. El servicio de comunicacibn aerial ROM BIOS es invocado via IHT14h, el cual desempeAa varias operaciones para la transmisión y recepción serial.

En una conexi6n en paralelo, todos los bits de un Byte de datos serhn transmitida5 simu.ltánemente sobre e1 puerto en paralelo.

Cuando al dato es transmitid6 serialmente, todas los bits de un Byte de información s e r h transBitidos de forma secuencia1 es decir de manera consecutiva uno por uno, mediante una sincroni~aci6n el objeto receptor ordena las b i t s que recibe en forma serial y los almacena de nuevo en Bytes,

Originalmente dcseabpnos transmitir en tiempo real a la PC los datos digitalizados,esto n.o fue posible debido a que la maxima u'ploeidad de transmisitln serial del 68HGll a la PC es de 9600 bits/seg y siendo cada &to de un Byte ( 8 b i t s ) , nuestra frecuencia m&xima de nlueetreo sería de 9600/8 = 1200 Hz con eeta frecuencia de rnuestreo captariamos micaraente componentes eh freauencia de wh maximo de 600 Hz,y como la voz tiene componentes en frecuLencia de 50 a 1000 Hz no sería auficieritk para captar los componentes en frecuencia de la voa.Para resolver este problema, se opt6 p(3r digitalizar los datos con una frecuencii de muestre0 de 5000 Hz y almacenar los datos en &a RAM del 68HCll para posteriormente transmitirlos a 9600. baudios a: la PC.

Page 8: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

8

El sistema transdactor con:siste bn un micr6fono que al recibir el sonida genera un voltaje pequefio, que es sumado mediante un sistema de amplificadores operacionales con un voltaje offset para despuks ser amplificado de tal modo que la sefial tuviera un voltaje offset de 2 volts y una maxima amplitud pico pico de 4 VOltS,eStg S@ hace debido a que el 68HC11 digitaliza seaales de 0 a 4 volts. El diagrama de estas amplificadores operacionales se muestra en las ditimas phiginas de este reporte, esta seAal. entra. al cmvertidor analbgico digital mediante el puerto EO.

Tddas las operaciones de cottversi6n A/D estan controladas pot algunos b í t s del kegistro ADCTL y se compara c6n un vc?Lthje de referencia de O voltg y 4 volts, $a salida de 8 bits del convertidor A/D se almacena en la localidad de rnwria inicial especificada en el programa como QlOOH se realiza un cidlo de retardo a fin de que la ftecuencia de muestseo sea de 4 kHz, se butiliza una frecuencia de muestrea de 4 kHz a fin de obtener al espectro en frecuencia hasta del sexto armbnico, se incrementa el valor de la dirqcci6n de la memoria, se le cQmpara con Zh memoria 'final y sino es asi se reanuda el ciclo de escritura, se almacenan 192 datos de los cuales los @rimeros 64 datos son de sefial transitoria y los 128 restantes son los que se van a procesar. Despues se direcciona la memoria inicial, se lee el dato y se manda al registro de transmisi6n serial 8C1, el transmisor S@X es activado, la teratinal. PDl/TXD se convierte en una salida dedicada a Oransmisi6n (TXD) , el program continda y qe incrementa el valor de la dirección de la memoria, se le Compara con la memoria final y si no es as1 se reanuda el ciclo de lectura y la tranqmisibn serial continua hasta llegar a la memoria final.

De los diferentes fonemas que emi-te la voz en los humnos, los mas f6ciles de identificar son las vocales, e1 sonido de una vacal consiste en una frecuencia fundamental y múltiplos enteros de esta frecuencia fundamental, que son los elementos armdnicos .La diferencia entre una vocal y otra se encuentra exclusivamente en el timbre, esto es en la amplitud relativa de los diferentes coh-tponentes arm6nicos. En los sonidos no vocblicos se da generalmente 12:n espectro en frecuencia que no es amdnico y que los podemos cqndiderar como die;tintas

Page 9: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

9 9

formas de \'ruidosN, $S por e : ~ o que al tratar de reconocer patrones en la voz, es mas loqble hacerla a gactir de las vocqles. El proyecto consiste en conocer loa componentes en frecuencia al r6,cibirse ynh sefial y analizar niediante un algoritmo las intensidades relativas de sba &iferentes arm6nicos para que al. ubicarse estos en c$ertos rangosr se identifiqqen con una vocal y pueda desarrollaras a partir de esta identificacih, la ejecuc:i6n de un comando.

&da vocal al ser emitida tiene una frecusncia fundamental y un tiqhre caracteristico consistente en una amblitud relativa de los múltiplos enteros de la frvcuencia fundaental, es decir sus armónicos esta es lo que marca la diferencia entre el sonido de una vocal y otra, asimismo, aun trat6ndose de la misma vocal: existan diferencias en cuanto al timbre al ser emitida por diferentes personasr un sonido vocálicb al ser emitido tiene tanto un tinibre caracterfstico de lar vocal. que se trata como un timbre person.91 del sujeto que lo emite, por 10 que el programa de skconocimiento de sonidos vocdlicos debe tener primero una adquisicibn de las características del timbre tantq vochlicas como p@rsbnales de la persona que va a utilizar e l proggataa.

* Se le pregunta a la persona su nombre. * Se abre up archiuo on su nombre y con los datos quq a

Se le pregunta a la persona cuantas veces debe registrarse cada vocal. * Se emite el siguiente asnsa:je: "EN WTO W LA VWAh EiJ

contintmcibn se van a registrar.

L?4 PAN-, p m e w LA MJ[ma i4WmA QUE QptlsRAs SEA wpmrfiA P Q & m u ~ m @ .

Page 10: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

io

ESFA PARW 8E W T a A EN E& 6SRCli Aparece en pantalla la vocal *?V.

a Se guardan los datos del C.A./D en la RAM del 68HCll can una frecuencia de muestre0 de 4 kHz siendo el periodo de muestre0 de 0.25 ms, se tomarAn 128 muestras vqlfdas que nos dan un tiempo de muestre0 valido da 32 m, lo cual nos da un ancho de banda de 3l.25 Rz a 2 O00 Hz. -S ondas sonoras se han convertido a seAal eléctrica can un offset de 2 v o l t s y una excursibn laiximg de 4 volts pico-pico, la conversibn analógic2:is digital. es de un Byte l o cual resulta en 256 estados que corresponden a O para O volts, 128 parB los 2 volts del voltaje offset y 255 pasa el voltaje mciximo de 4 volts.

@ Si d Z I Seguir, si no, esperar. \ * El programa espera a que exista una intensidad sonofa suficiente para adquirir las Wegtras v62idas para su ptocesamie~to, ''dm son lo$ datos que llegan del C.A/D e ''1'' es la intensidad suficiente para prepararse pafa tomar muestras vSlidas.

XSi92=&Q) 2 s

a Cuenta K muestras / * Cuando existe ya intensidad suficiente de sonido, se necesita dar un retardo a fin de eliminar los sonidos transitorios de lid .%Íla1 y ContBr COR el estado permanente, el valor de K puede ser de 5 periodos de una fsecqencia fundamental de la voz! de 300 Hz esto es 5 X 3 . 3 m s = 16.6 ms que a una frecuencia de muestre0 de 4 O 0 0 Hz nos da un valor: de Ka66 * / . Toma 128 datos.

* Almacena l o s 228 datos en la RAM del 68HCll. a Transmite serialmente los datos a la PC

FSTA Sg 0.itEdLtIZA EN ZA X

Grafica los datos obtenidos. * Realiza la FFT de los 128 datos, m Encuentra F[m]>F{n'] Vn 1 1 I n S 64 / * De los 128 datos se encuentran 128 magnitudes en frecuencia de las cuales son validas de n-O a n=64 donde n=O es el offset , ne1 es 31.25 Hz, la frecuencia de n es rr*31.25 Hz y 11-64 es 2 O 0 0 Hz, se encuentra el valor de m comprendido entre 1 y 6 4 t a l que 1s pat- la fmmacia dQ m er la dx&ma en todo el intervalo que emprende 1 I n I 64. * /

Page 11: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

11 11

Se almacenan las siguientes variables:

Page 12: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

12

Las 50 datos registrados (promedios y desviaciones) represerltap las caracteristieas personales en la pronvnciaeibn de cada vocal que no$ brindan los intervalos para de su identifícacibn,

Se pide a quien quiere que al programa reconozca y obedezca su voz que escriba el nombre de su registro para comparar los sonidos que se van a registrar.

ESTA PAR'pE BE ')t$&bZZ& EN BL 68€%2l, * Se envían datos del C,A/D a La PC con un& frecuencia de muestre0 de 4 kHz siendo el periodo de muestreo d.e 0.25 ms, se tomr0n 128 muestras validas que no$ dan un tiempo de muestre0 valido de 32 ms, 10 cual nos da un ancho de banda de 31.25 Hz a 2 000 Hz. Las on@& $onoras se han convertido a sena1 electrica con un offset de 2 volts y una excursi¿m máxima de 4 volts pico-pico, la conversi6n anal6gica digital es de un Byte 10 cual resulta en 256 estados que corresponden a O para O vcllts, 128 pasa los 2 volts del voltaje offset y 255 para el voltaje m6ximo de 4 volts.

e Si d 2 I seguir, si no, esperar. \ * El programa espera a que exista una intensidad mnora suficiente para adquirir las muestras v61idas pera su procesamiento, "d" son los datos que llegan del C..A/D e "1" @S la intensidad suficiente para prepararse para tomar muestras vdlidas,

Xal92= ('/a) 256

* Cuenta K muestras / * Cuando exista ya intensidad suficiente de Sonido, se necesita dar un retardo a fin de eliminar los sonidos transitorios de la seilal y cohtar con el estado permanente, el valor de K puede ser de 5 periodos de una frecuencia fundamental de la voz de 300 Hz esto es 5 X 3 . 3 m5 = 16.6 ms que a una frecuencia de muestre0 de 4 O00 Hz nos da un valor de K*66 */ . Toma 128 datos y gwimdalos e m fa FtAM del 68HCll.

* Transmite serialmente los 128 datos a la PC.

Page 13: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,
Page 14: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,
Page 15: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

/ * Las variables n ( W , V=(a,e,i,o,u) se incrementan en eL valor absoluta de 1s diferencia de cada armdnico con el promedio de los valores registrados de armonicas de cada vocal, si esta diferencia es mayor que una desviacirjn estandar de diqho componente amnónico,

4 Encuentra nV 5 nX V V== (a, e, i,o,u) y si nX 1 S , a V = X /* SE! busca cual de las c i n c o vocales fue la que tuvo qenor diferencia determinando a s i de que vocal se trata y ejecutando la acción correspondiente B dicha vocal.

* Regresar al CICLO #$E RECOmiMI$mo VWALICo.

Se realiz6 en el laboratori'o de electrbnica be la WbfZ una inveatigacibn práctica de aniilisis e& frecuencia de la voz mediante el uso del analizador de espectros y el dsciloscapio, se investigó la voz de dos de los integrantes del equipo d fin de comprobar la teoría de los sonidos vocálicos como integtados de una frecuencia fundamental y diferentes companentes arn6nips, se encantrtj las características esperadas y se estudiaron las similitudes y diferencias entre timbre voc4lico y timbre persopal.

Las siguientes tablas y grAficas nas muestran la amplitud relativa dada en porcentaje del segundo al sexto arm6nico con respecto a la frecuencia fundamental, al hablar del segundo

Page 16: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

16 16

armbnico nos referimos a el doble de la frecuencia fupdmental, el tercer agm6nic:o el t r iple de la frecuencia fundamental y a s i Sqcesivamente hasta el sexto armbnico equivalente 8 seis veces la frecuencia funcb%tmhtal, $1 hablar de porcentaje nankmlizamos la frecuepcia fundamental asign6ndoaele un valor de 100%.

al amlieador de espectros se us6 con una r a s o l u c i b n de 30 Hz y un barrido hasta de 5000 Hz.

Se anotaran los datos observados y las gr&ficas que se muestran mas adelante de 121:s sefiales y del espectro en frecuencia se hicieron de manera simulada mediante e l programa DSPLAY. Las sefiales $;irnuladas se disefiaron a partir de la suma 4e siete seAales senoidales coh una amplitud igual a la que observamos en el analizijrdsl; de espectros y en el oseiloscopio; a esta suma de las sefiales de le realiz6 la FFT (TRANSFORMADA RAPIDA DE FOURIElR) y se despleg6 en coordenadas polares esto 0 s en magnitud y fase . Se imprimi6 la gr6fica de la seRal simulada que result6 ser similar a la que observarno$ en el oseiloscopio e igualmente las gráficas de la FET. son Similares a l a s que se observaron en el ahaliaador de espectros ya que fue disefiada de acuerdo a los datos que obtuvimos de &aneta empírica con el analizador de espectros,

La siguiente tabla nos muestra las amplitudes relativas en porcentaje del segundo al sexta armónico de .cada una de las vocales emitidas por N O M , s i e n d o su frecuencia fundamental de 400 Hz.

La siguienke tabla nos muestra las amplitudes relativa3 en porcentaje del segundo al sexto arm6nico de cada una de las vocales emitidas por SeRGIO, siendo s u frecuencia fundamental de: 300 Hz,

Page 17: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

. ". _._. , . , ~ . .̂ , ~ " -r*".""------ : "IC." ""

17 17

De l a s tablas y grdficas anteriores podemos Observar que las desominadas vocales fuertes ( A, E, 0 1 tienen compomsntes armbnicos cuya inteasidad relativa con respeeo a la fundamental es sigBificat iva , a diferencia de las vocgles dCbiles ( I , tr ) cuyos armbnicos son débiles y de loa mas altbs carecen de ellos, 11 vocal con rads contenido arinbrtico es la "At', en l a investigación de laboratokio se observb incluso que en la vocal 'A" el shptimo arm6nico tenia una intensidad significativa lo cual SR manifest6 en e l anbliSiS espectral de las dos voces estudiadas. Para la vocal "E'' se observd tener arm6nicos significativos

hasta e1 cuarto en el caso de! NORMA y hasta el quinto en el caso de $ERG10 en casos el sexto arm4nieo de la letra "E" 00 fue significativo.

La vocal ''1'' se obserTt6 un bajo contenido en aratbnicos observtintiosa en el oscilsscopi-o como una sefial casi puramente senoidal, siendo ligeramente significativo el segundo armbnico en ambos casos, en el caso de NORMA se da un peguefio pSco en el tercer grmdnico.

La vocal "O" al ser una vocal f'uerte tuva altQ contenido en armbnicos y se puede percibir en ambas 'VOCQS que e s

Page 18: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

I8 18

significativo hasta el quinto armbnico en este caso se puede notar que en SERGI-O el se'gundo arm6nico fue de gran intensidad relativa cari respecta a la fwdanental, La vocal "U'' al ser una vocal. &bil tuvo pocos am6nicos en

ambos CBSOS, y solamente se aprecien el segundo y el tercer armbnico.

Asimismo de las grhficas y tablas anteriores puede uno darse cuenta de las semejanzas en las. características espectrales de las diferentes vocaxes lo que se cOinocCS como el tirnbre vocálico y las diferencias en lo qwe se refiere a la amplitud relativa de los armónicos lo que nos praporcioaa el timbre personal siendo en es te estudio de mayor i,nteqsidad relativa los emitidos por SERGIO que los emitidos por NCSVdA, s i n embargo al tratarse de :las mismas vocales se da uno cuenta que tienen los mismos cQmponcr-ntes arfnónicos (timbre vocA1ico) pero de diferente intensidad relativa con re$pccto a la fundamental (tinibre personal) .

El habla en el. ser humano podemos dividirlo en consonantes y vocdles; los sonidos voc6licos tienen como cargcteristiea particular el ser sonidos de tipo armbnico, esto es que su espedtco an frecuencia se coqpone de una nota fundamental y de frscuencias que son múltiplos enteros de la nota fundamental siendo estos los clomponentes de tipo armbhico.

En la UNImRSIDAD AUT0:NOMA METROPOLITAf-JA IZTAPEu31PA des8srollamos COB la asesoría del maestro Víctor Hugo Tellez Arrieta, corn parte del Seminario de PrQyectos, un prdgrama capaz de identificar los diferentes sonidos voc4Iicos emitidos ai hablar.

La primera parte del pfoyecto consisti6 en adquirir una señal a travba de un micrbfono, de digktalizarla, almacenarla y de transmitirla a una PC a través del puerto serial; esta prixndra parte se hizo wslndo el microcontroladdr 68HCll. La segunda etapa fue un programa de computadora en lenguaje

C en donde se reciben 256 datos digitalas de las vocales emitidas con valores de O a 255 (un Byte) en amplitud, a los cuales se les realiza su espectro en frecuencia mediante la FFT y considerando solamente e;u amplitud se encuentra la nota fundamental normaliz&ndo$a con un valor de 100 y encontrando la anplítud relativa de l o s diferentes armónicos con respecto a esa nota fundamental.

Se registra la voz da una persona para cada una de sus vocaled tantas veces como se desee y se almacena en un registro, e l pronedio y la desviacibn estSndar de cada armónico del segundo al sgptimo be cada una de sus vocales.

Se ideritifican los sonidos comparSndolos estadisticamente con las valores de ataplitud promed4o y desviación est6ndar que previamente se han registrado.

Page 19: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

19

El pragratna tuvo mayor r2;agacidad de &cierto en. la identificacibn de la voz mientras mayor Fue el nClmero de veces que se regis trd cada vocal para su posterior identificacihn.

Un registro en el gue fueron 4 el nmero de ve& de cada vocal, tuvo un aeierto del 87 % er~ su posterior identificación, mientras gue para un registro de 10 veces por vocal la capacidad de acierto subib al 93 %.

El proyecto continúa y seguimos trabajando en el mejoramiento del algoritmo. Las p&igdnas siguientes, muestran el programa en ensamblador del 68Itcl1, el programa en C de la PC, así eaqo las graficas de las seAales sonoras vac6lbcas en el tiempo, en la fEecuencia y en su6 amplitudes relativas de los armbniccrs con respecto a la frecuencía fundamental.

Page 20: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

20

Page 21: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,
Page 22: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

VOZ ASM 68HCll * * * * + * * * * * * * * * * * * * * * * * * ~ ~ ~ ~ ~ * * * * ~ * * * * * * * ~ * * * * * * * * ~ ~ ~ * ~ * * * * * * ~ ~ * * ~ * * * ~ * * *

7 TION m& v

PkST DR

SR CR1 ITSEX m2

UP GMSE

WID:

NFIG:

LENCIQ:

ABAR 2

:Configura el A/r) para guartdado de datos y :aut.ivb &a entrada PEO.

Page 23: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

PE :

; ESCRX : LDY # $ O 0

?PRfN: STAA C1,Y t LDAA #$sa

t CPY #$O04 : BEQ Cum t f N Y r’ JMP PRlH

MIS :

:

H

2 ;Retar& lenar de frecuenaia de muesCxeo.

; Marca el inicio de gotlado sstab1,e.

Page 24: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

PROGRAMA EN

Page 25: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,
Page 26: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

.d

.d

.d -9 .a -4 :a -a Ld

Ld id id id id id id id id id id :d L-d Id

inigtyafft (void); gtafiga-(void) i TDF(void):

2

Page 27: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

.aid w p t u (void)

Page 28: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

%e", v) t Y

Page 29: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

td i c h n t i f k d r (void)

Page 30: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

.

case (1): V= fE ' ; break ;

dsLault: breaK;

6

Page 31: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

rSwitch(mn)

case ' O ' : exit( 1) ; bredk;

7

Page 32: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

lista (voi&)

Page 33: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

"

Y Y

Y n

A A - 3

a x # ooz

S X

N

4 Y

w r-

Q U 1.

Page 34: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

Id inigrafica()

clearviewgort( ) t wtcolor ( ED) I ine(0,2*l(m /6,S*xm /6,8*ym / 6 j ;

Page 35: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,
Page 36: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

/* #E X */ /* EJE Y * J

y *m*F[ij+br

Zineto(x,y); x+=S*%m/(tant+b)r y =b:

lineto(x,b)t

Page 37: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

if (el& - 27) e*it( 1) t

id datfrec(void)

systqm ("CIS)") i ele = gatcht): if (el8 - 23) exit( 1 ) ;

Page 38: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,
Page 39: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

*/

Page 40: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

i B registrar (void)

SE VA A REGfSTR u;C UNA VQcAL?w);

Page 41: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

puts("\n\n\n4\n\t\t\t pulsa una tecla para continuar"); 17 if (sal - 27) exit(1);

sal * get&();

for (d = O ; d<=l9;d++) W [ d ] * O ;

. . . .... " _"_ "._* .-.- __ _." j"I""""̂" *,."_.. -

Page 42: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

guardar()t if (els ==- 27) enit( 1) t

Page 43: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

i f (

Page 44: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

/*inicia lsctttlta de disco+/

KI datarmo (void)

Page 45: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

cam ( 4 ) 2 v= ‘U3:

break;

Page 46: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

>id analisis(void)

.a fuarte(void1

.d debil(void)

Page 47: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

FUNCIONES EN EL

FRECUENCIA Y EN AMPLITUDES

RELATIVAS DE ARMONICOS CON

RESPECTO A LA FUNDAMENTAL

TI@ME)O, EN

Page 48: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

t92

32

Page 49: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

I

_c. -

Page 50: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

20 30 4 0 49 59 69 79 90 99

I19 110

62s 55 888.96

X222.04 1024 .O8 1502. o9 360,;17 lt5.40 299 . 69 138.42 444.78

2395.83

a 3 4 S 4 7 8 9 10 7.1 3.2

72,932093 103,643957 279,328155 142.477452 119,396?48 175.127939 42.992135 20.449394 34.940727 20.802313 53, a56669

Page 51: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

Q

o

w N

P b2 Q3

I!!

<

II ,,.”” “”“-”. i .

Page 52: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,
Page 53: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

20 29 41 49 60 76

89 98 107 117

7 8

2997 a 06 1004, t3Q 348.99 235.41 1&U, 94 202.56 158 54 736.63 229.80 5Q8.92 526.81

2 3 4 5 6 7 8 9 io 11 $ 2

I 10 p 20 FUN =2493.4901+6

120,195263 40+3OO874 13.996077 9.44SO72 7.256314 8 , $23732 6.357989 9,490086 9.215840 20.40,8826 21.62,750'4

Page 54: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

a Id O

S 8

5

E

E

M

B P P

< O

Page 55: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,
Page 56: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

23 35 45 65 78 78 200 114 180 107 2lP

1729 0 4 362.32 177 24 154 10 192.54 199.54 348.58 390.21 503.04 507.92 525 93

2 3 4 5 6 7 8 9 10

12 il

J = 12 m = 12 FUN 4630.306491

Page 57: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

Y

G 4

6 Y

t

w E

n

< O P 3 r-

0- /

?

Page 58: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

i ' i

L_

Page 59: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

18

37 46 51 66 68 82 €46 102 108

aa 1916.01

1297 .?3 1331.73 274. b4 292.33,

4771.. J.?

253 55 274 0 36 176 04

133.40 126 97

2 3 4 S 6 7 8 9 10 11 12

? = 9 m * 2 8 pWl# 4" . 77~~147

87.239271 217,190212, 54dQ7458X 60.d22339 12.474963 13.333396 1 1 . 5 4 ~ 0 5 1 12,489Q23 8 01'35@4 5.324727 6.072466

Page 60: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

o N W

U

e

x

Y

8

B

P

<

C . -.

Page 61: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

. ... .

1

<

Page 62: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

24 36 44 56 76 86 92 1$4 122 102 108

2 3 4 5 6 7 8 9 10 11 12

i 1 12 m = 12 Pm =5537.003913

52.335937 39,610333 5 .S94173 5.209468

1.962845) I d 669&69 1.672637 l. 769425 5.324727 6.072466

2.558353

Page 63: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,
Page 64: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,
Page 65: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,
Page 66: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

HARDWARE PARA LA AMPLJFICACZON DE LA SERAL A UN VOLTAJFJ MAXIM0 DE 4 VOLTS

PICO-PICO Y UN DC DE 2 VOLTS

Page 67: i148.206.53.84/tesiuami/UAM8168.pdf · 2004-03-04 · octavas entre el sonido m65 grave y el mas agudo; la percepcibn pgicol6gica de la frecuencia de un sonido ... esta identificacih,

" -.-

O * 7 F

' L - I-

. .

b O w M vl O M

.O

.O

-

.. .

"-