la percepcion del habla

Upload: montse-noteimporta-miapellido

Post on 13-Oct-2015

39 views

Category:

Documents


0 download

TRANSCRIPT

  • Tema 2. LA PERCEPCIN DEL HABLA.

    1. Introduccin. El uso del lenguaje se apoya en la habilidad de los hablantes para traducir sus representaciones a un cdigo fontico, acsticamente perceptible, o en el caso de la escritura a signos grficos. Al receptor, por su parte, le corresponde reconocer en los sonidos, en los grafemas, elementos identificables cuya combinacin remite a significados (Clark y Clark, 1977; Foss y Blank, 1980; MacKay et al., 1987; Miller, 1987). Consecuentemente, la identificacin de las unidades fsicas (acsticas o grficas, en el caso del lenguaje escrito) desempea un papel relevante tanto en la comprensin como en la adquisicin del lenguaje (Jusczyk et al., 1992).

    La actividad perceptiva presenta caractersticas especficas cuando se trata de lenguaje hablado o escrito. Estas diferencias derivan de que el sistema de anlisis ha de adaptarse a las propiedades del estmulo de entrada. Dicho de otro modo, los recursos de necesarios para el anlisis de estmulos acsticos son necesariamente distintos de los utilizados para el anlisis de estmulos visuales. A continuacin, sealaremos las principales diferencias (Para un resumen de las diferencias vase la Tabla 2.1.).

    a) El habla es un estmulo continuo que slo presenta pequeas pausas entre unidades sintcticas, mientras que la escritura presenta elementos discretos, cuyas unidades son separadas por espacios en blanco o los signos de puntuacin.

    b) En la escritura puede aparecer una correspondencia entre categoras sonoras y signos grficos, en la percepcin del habla es el propio individuo quien tiene que detectar la categora a la que pertenece el estmulo.

    c) Por ltimo el habla se desvanece rpidamente. La lectura, en cambio permite detenerse o volver atrs (Massaro, 1987).

    Habla Lectura Canal auditivo: tiempo Canal visual: espacio Fonemas Grafemas Continuidad Elementos discretos Dependencia de la prosodia Dependencia signos de puntuacin. Desvanecimiento Rpido: alta demanda de la memoria

    Estabilidad: Baja demanda de memoria

    Formato negociado Formato fijado por el hablante Determinado por el contexto Descontextualizado

    Tabla 2.1. Diferencias Lenguaje escrito y oral.

    En esta parte del temario nos vamos a referir a los mecanismos de la percepcin del habla porque rene los rasgos esenciales del proceso perceptivo y porque forman un sistema integrado con el de produccin del habla (Studdert-Kennedy, 1987; Porter, 1987). Ms adelante introduciremos las propiedades especficas de la percepcin del lenguaje escrito.

    2. La percepcin del habla. Sorprende que, pese a su complejidad, la percepcin del habla se realice sin esfuerzo y el individuo, en circunstancias normales, tenga la impresin subjetiva de estar atendiendo al significado, pero no a los sonidos. Slo cuando la calidad sonora es deficiente o est distorsionada, como sucede cuando se escucha a personas con acento o no se puede acceder

  • fcilmente al significado como sucede cuando nos comunicamos con personas que hablan en otro idioma (Perlman y Meara, 1989), se presta atencin explcita a las pautas sonoras del habla.

    Un fenmeno caracterstico es que los hablantes percibimos el habla un conjunto de elementos discretos, sonidos constantes y discriminables, cuando en realidad la emisin hablada es un estmulo continuo que ha de ser segmentado por el oyente. Los oyentes identificamos palabras, elementos concretos, cuando la emisin consiste en una cadena de sonidos encadenados. Es decir, el oyente tiene la impresin subjetiva de escuchar algo como:

    /oy/ /ace/ /un/ /buen/ /da/, cuando la emisin del hablante est ms prxima a:

    /oyaceun/ /buen/ /da/

    En el habla los fonemas se encadenan formando grupos sonoros que no siempre se corresponden con palabras. Es el propio oyente quien ha de segmentar esta cadena para identificar unidades lxicas y, as, poder acceder al significado de la emisin. Para hacerse una idea ms clara de este fenmeno basta con escuchar a una persona que habla en un idioma que no dominamos perfectamente. La primera impresin que provoca es que habla muy deprisa. Inmediatamente, nos damos cuenta de que se emiten grupos de sonidos, pero no siempre somos capaces de identificar las palabras expresadas porque se hayan contaminadas con otros sonidos procedentes de las palabras anteriores o posteriores. Qu es lo que produce este fenmeno?

    Hemos sealado anteriormente que el habla se emite de forma continua. Al hablar, los fonemas que forman una palabra no se emiten de modo aislado, sino que en cada gesto articulatorio se producen todos los sonidos que admite el golpe de voz. Esto es lo que hace que cuando hablamos no digamos #la# #ma# #de# #ra#, sino que las slabas se unen dando lugar a un conjunto sonoro continuo como /lamadera/.

    An existe otra propiedad relevante del habla que repercute de modo decisivo en el modo en que se lleva a cabo el procesamiento perceptivo. Dado que los fonemas se articulan de forma continua, el individuo ha de realizar algunos ajustes de acoplamiento con el fin de que la transicin entre los sucesivos gestos articulatorios sea fcil y rpida. Volviendo al ejemplo anterior, cuando el emisor pronuncia la slaba #la#, sus rganos articulatorios deben adoptar una posicin tal, que permitan encadenar fcilmente el gesto articulatorio de la siguiente slaba, en el ejemplo #ma#. A esta modificacin adaptativa del gesto articulatorio se le llama coarticulacin (Porter, 1987). La coarticulacin implica que los gestos no se articulan independientemente, sino que cada gesto est condicionado por las caractersticas del gesto que le precede y el que le sigue. El lector puede comprobar

    La repercusin ms interesante de la coarticulacin es que las variaciones de la posicin de los rganos articulatorios, a su vez, provocan modificaciones sonoras importantes. El lector puede comprobar como el fonema [s] suena distinto cuando se pronuncia dentro de la secuencia sopa, que si la palabra a emitir es siglo. Esta propiedad se conoce con el nombre de ausencia de invarianza, ya que la caracterstica que define a los fonemas es precisamente su falta de constancia, es decir su variabilidad. Por tanto, una de las tareas del sistema perceptivo consiste, tal como seala Gibson (1986), en reconocer los rasgos de los estmulos que se mantienen constantes o invariantes. De tal modo que los hablantes reconocemos como un mismo fonema a un conjunto variable de configuraciones sonoras con diferentes propiedades acsticas.

  • El reto que la coarticulacin plantea al sistema perceptivo se resuelve organizando la informacin en categoras. Puesto que el fonema no dispone de una correspondencia nica con el sonido, el sistema incorpora un repertorio de sonidos que se interpretan como un mismo fonema. Tal vez al lector le resulte ms sencillo comprender este patrn si toma como ejemplo algo que ocurre con el lenguaje escrito. Todas las grafas que se presentan en el siguiente prrafo se reconocen como representaciones del grafema /a/

    A a a a a a A Se podran agregar multitud de ejemplares ms si incluyramos representaciones escritas manualmente. A pesar de las diferencias, todas estas grafas mantienen algunos rasgos constantes que permiten identificarlas como representantes de la letra a. Igual ocurre con los sonidos de habla. Los fonemas presentan variaciones acsticas, alfonos, originadas por el contexto articulatorio en el que se emiten. Por tanto, el sistema perceptivo no puede utilizar como criterio para identificar cada fonema un conjunto fijo de rasgos, sino un patrn de rasgos que admite cierto margen de variabilidad. Este procedimiento de categorizacin es el mismo que nos permite identificar a un Pastor Alemn y a un chihuahua como ejemplares de la misma categora animal.

    Continuidad Segmentacin

    Coarticulacin Categorizacin

    Figura 2.1. Caractersticas del habla y recursos del sistema perceptivo

    De lo sealado hasta ahora se desprende que la percepcin se logra mediante un conjunto de claves que se analizan en paralelo y que corresponden con diferentes segmentos del gesto articulatorio (Clark y Clark, 1978).

    En resumen, la primera etapa de la comprensin est dedicada al anlisis e identificacin de las unidades acsticas que componen una emisin de habla. El anlisis procede mediante la segmentacin de la seal y la identificacin de las unidades que lo componen como elementos pertenecientes a alguna de las categoras sonoras, es decir los fonemas, utilizadas en la lengua del hablante. No hace falta profundizar mucho para descubrir que un recurso clave para los hablantes es el disponer de una representacin del sistema fonolgico de la lengua. Esto pone de manifiesto, como veremos ms adelante, la relevancia de las primeras etapas del aprendizaje del lenguaje, durante las que los bebs adquieren el repertorio sonoro propio de su lengua materna y adquieren los patrones motores que permiten producirlos (Jusczyk et al., 1992). Abundan las cuestiones respecto a la naturaleza de la percepcin del habla, muchas de las cuales slo han recibido una respuesta parcial. Hasta qu punto la percepcin del habla es una capacidad especfica de la especie y, por tanto, reposa en la dotacin innata de los seres humanos? Cmo y cundo se adquieren caractersticas especficas asociadas a la lengua del hablante?

    En este captulo nos ocuparemos de los interrogantes que plantean los fenmenos de la percepcin del habla y de las formas en que se han abordado emprica y tericamente.

    3. El estmulo sonoro. La percepcin del habla consiste en reconocer en la emisin de otro hablante unidades o segmentos que constituyen estmulos discretos. Las disciplinas que se encargan del estudio de los sonidos de habla son dos: la fonologa y la fontica. La fonologa estudia el funcionamiento del sistema de sonidos de una lengua. Es la encargada de especificar el

  • conjunto de reglas que indican cmo se combinan los sonidos, cmo se modifican, qu diferencias se producen en funcin del contexto en el que aparece un determinado fonema y si estas modificaciones dan lugar a cambios significativos. Los fonemas son representaciones abstractas de sonidos, son categoras, y se representan entre corchetes []. La fontica, por su parte, se interesa por los sonidos y sus pautas de emisin, por lo que no necesariamente es especfica de una lengua concreta. Es decir, estudia las caractersticas acsticas y los movimientos de los rganos articulatorios que originan cada sonido. Las clasificaciones clsicas de los sonidos consonnticos se organizan de acuerdo a tres criterios: a) el punto articulatorio: segn el lugar en el que reposa la lengua y la posicin de los labios durante la emisin del sonido. Los sonidos son: bilabiales, labiodentales, linguodentales, linguointerdentales, linguoalveolares, linguopalatales o linguovelares. b) el modo de articulacin: la forma en que se expele el aire: oclusiva, fricativa, africada, nasal, lateral, vibrante simple y vibrante mltiple. Y c) el tiempo de inicio de la emisin de la voz: El tiempo que transcurre desde el inicio de la periodicidad de la voz hasta la liberacin de la consonante (Miller, 1987). Este parmetro permite discriminar entre consonantes, estableciendo la distincin entre consonantes sordas y sonoras. En la emisin de las consonantes sordas [p] el movimiento labial coincide con el inicio de la vibracin de las cuerdas vocales, mientras que la vibracin se inicia antes de la apertura de los labios en las consonantes sonoras [b], como se indica en la figura 2.2.

    [pa] ---- voz [ba] -------------------- voz 0 -0,05 -0,1 Apertura de los labios emisin de voz

    Figura 2.2. Tiempo de emisin de la voz. Adaptado de Clark y Clark (1977).

    Debido a que este criterio es difcil de observar para su estudio se trabaja con representaciones grficas que registran las frecuencias de la voz al emitir diferentes sonidos. Estas representaciones se llaman espectrogramas. Cada voz tiene una frecuencia bsica (Fo) que viene dada por la vibracin media de las cuerdas vocales. La vibraciones de la voz producen armnicos o diferentes bandas de frecuencia, medidas en hercios (Hz), a partir de la Fo, que se modifican segn pasan por la cavidad oral. Esto es lo que produce el sonido caracterstico de cada voz (Foss y Hakes, 1978).

    El TEV es un continuo de sonoridad. Por ello los lmites entre categora fonticas no son precisos ni discretos, sino que los lmites entre categoras fonticas son borrosos. Prueba de esta borrosidad son los hallazgos de Lisker y Abramson (1970; Miller, 1987). Estos autores sintetizaron 31 slabas artificiales a partir de los fonemas bilabiales [p] y [b] ms la vocal [a], variando el TEV. Cuando a los sujetos se les pidi que identificaran las slabas encontraron una frontera consonntica en un TEV de 0,03 sg. Si el TEV era menor la slaba era identificada como /pa/, si lo sobrepasaba era identificado como /ba/. Es decir, los hablantes logran identificar cortes categoriales transformando as un continuo acstico en rasgos claramente diferenciados: consonantes sonoras vs consonantes sordas. Tambin Liberman y cols., (1957) utilizaron slabas que variaban en el punto de inicio y transicin del segundo formante (F2), estableciendo una secuencia que va de las pautas espectrogrficas de /ba/ a las de /ga/. Como tarea propusieron a los sujetos clasificar las slabas como /ba/, /da/ o /ga/. Los

  • sujetos denominaron /ba/ a las slabas situadas en el extremo del continuo, /ga/ a las situadas en el otro extremo y /da/ a las slabas situadas en la zona intermedia. Slo haba unos puntos de transicin donde las respuestas no siempre coincidan. De nuevo estos resultados demuestran que los sujetos identifican fronteras que delimitan el reconocimiento de los sonidos como si se tratase de elementos discretos, pertenecientes a diferentes categoras.

    El estudio de los espectrogramas ha mostrado varios fenmenos interesantes. En primer lugar, no parece existir un espectrograma tpico de cada fonema. Al contrario, los espectrogramas varan de acuerdo a la combinacin resultante en cada slaba o gesto articulatorio. Lo que sugiere que la identificacin de los fonemas consonnticos depende de las claves acsticas que acompaan a la vocal que le sigue. Es decir el espectrograma pone de manifiesto la ausencia de invarianza y que el fonema es una categora integrada por un rango de sonidos.

    En segundo lugar, mediante cortes en una grabacin, es posible aislar la parte correspondiente a la vocal de una slaba, obteniendo un sonido voclico limpio. Sin embargo, si aislamos la consonante el resultado es notablemente diferente. El sonido que nos queda es una especie de chasquido (Foss y Hakes, 1978). Adems, se ha observado que los hablantes pueden estimar con asombrosa precisin la vocal que ha sido eliminada en una cinta trucada. De lo que se concluye que la percepcin del habla no es una traduccin directa de los segmentos que componen la emisin, sino que la informacin proviene de las claves acsticas que transmiten en paralelo los diferentes constituyentes de la slaba.

    Existen, no obstante, algunas claves que se mantienen constantes, independientemente de su contexto de emisin. Estas claves se corresponden con algunas caractersticas derivadas del punto de articulacin o con el tono caracterstico de fricacin que se produce en consonantes como /s/, /z/ o /ch/.

    Finalmente, se ha comprobado que se puede inducir a los sujetos a percibir fonemas sordos introduciendo breves pausas entre los fonemas que componen una palabra. Por ejemplo, si entre la [s] y la [l] como en slit se introduce una pausa, los sujetos perciben split. Igualmente, se consigue que los sujetos perciban [p] donde haba sido emitida una [b]. De nuevo se comprueba que la percepcin de un fonema depende del conjunto de las claves del contexto articulatorio y que el canal auditivo tiene una alta discriminacin sobre las propiedades de los aspectos acsticos que actan en paralelo.

    Tomados conjuntamente los datos acerca de la estructura del estmulo acstico del habla se entiende que una de las incgnitas es cmo explicar que se perciba como un conjunto de elementos discretos y segmentables, pese a que las claves acsticas se transmiten en paralelo. Otro problema, asociado con el anterior, es cmo se identifican los segmentos si no existen claves estables que definan a cada uno de ellos (Porter, 1987).

    4. Etapas de la percepcin del habla. Una de las caractersticas ms destacables de la percepcin del habla es su naturaleza categorial. A pesar de que el habla es un estmulo continuo y de que los segmentos no presentan propiedades especficas y aisladas, para los hablantes es fcil identificar los fonemas que se escuchan y hacer finas discriminaciones entre ellos. En vista de lo que se puede asumir que la percepcin del habla reposa tanto en mecanismos auditivos, como en habilidades perceptivas especializadas en el habla.

  • Se han sealado cuatro etapas en la percepcin del habla. La primera etapa se corresponde con la recepcin y anlisis perifrico de la emisin sonora. En la segunda, se realiza el anlisis de las propiedades acsticas del sonido. La tercera est dedicada al anlisis fontico, es decir se analizan las propiedades sonoras y se identifican lo segmentos fonticos. En la cuarta etapa, anlisis fonolgico, se adaptan los segmentos percibidos a las propiedades y restricciones impuestas por la lengua del oyente (Clark y Clark, 1977; Klatt, 1989). Una representacin de las etapas puede verse en la Figura 2.3.

    4.1. Anlisis perifrico: la estructura sonora es transformada en rasgos acsticos. La entrada acstica estimula los rganos perifricos. El resultado del anlisis es una representacin del espectro de los patrones de descarga y la sincrona temporal que presentan. El sistema auditivo realiza un filtrado de las seales acsticas que contribuyen a identificar los patrones bsicos de la seal de habla.

    onda de habla ANALISIS AUDITIVO PERIFERICO

    representacin espectral

    DETECTORES DE LAS PROPIEDADES ACUSTICAS detectores de rasgos y patrones temporales

    DETECTORES DE RASGOS FONETICOS detectores de invarianzas

    ANALISIS SEGMENTAL matriz ordenada de segmentos

    BUSQUEDA LEXICA

    Figura 2.3. Diagrama de las etapas de anlisis perceptivo. Adaptado de Klatt (1989).

    4.2. Anlisis acstico: Se permite el anlisis de la estructura fontica. En este estadio se analizan las claves acsticas del habla. Una de estas claves es la banda de frecuencias de la seal auditiva. Lo caracterstico del habla, como hemos apuntado anteriormente, es que cada fonema presenta unas claves acsticas definidas por el contexto en el que se emite. Otra clave es el tiempo de emisin de la voz (TEV), que suele oscilar entre los 0 y 0,1 segundos. Una vez analizadas, las claves acsticas son retenidas durante escasos segundos en la memoria auditiva (Ruiz-Vargas, 1991).

    4.3. Anlisis Fontico: la seal se prepara para identificar fonemas. En este estadio se analizan los patrones acsticos que forman los segmentos del habla y se identifican de acuerdo a patrones fonticos. Se analizan las constancias perceptivas que permiten identificar los segmentos como elementos de categoras fonolgicas discretas.

    Algunos autores sitan en esta etapa unos detectores de rasgos especializados en la identificacin de las caractersticas de sonoridad, duracin, punto de articulacin, etc. Los fonemas identificados se almacenan en la memoria fonolgica. Se distingue de la memoria

  • auditiva en que retiene el fonema categorizado, no sus rasgos formantes, por tanto no se distinguen entre alfonos (variantes sonoras de un mismo fonema). Se ha demostrado que en la memoria fontica, los fonemas categorizados contienen conjuntos de rasgos que se van desvaneciendo independientemente unos de otros. As, cuando los sujetos tienen que recordar una lista de slabas cometen errores entre fonemas que difieren slo en un rasgo por ejemplo, [pa] por [ba] o [ba] por [va] (Wikelgren, 1966).

    4.4. Anlisis Fonolgico: Ajuste normativo a los patrones de la lengua. En el ltimo estadio, los segmentos son traducidos a formas abstractas de representacin de sonidos. Se efecta, adems, un acoplamiento a las reglas fonolgicas de la lengua en uso, de modo que los hablantes identifican cadenas de fonemas legales en la lengua que hablan. Este proceso es el responsable de un fenmeno tan curioso como el que palabras expresadas en una lengua extranjera pueden ser identificadas, e interpretadas, como emisiones de la propia lengua. Las personas oyen combinaciones de fonemas que son admisibles en el sistema fonolgico de su lengua, aunque el estmulo real sea diferente. Tras el anlisis fonolgico se obtiene una estructura jerarquizada de los constituyentes fonolgicos de la slaba. Cada slaba est compuesta por varios elementos que se organizan jerrquicamente.

    a) El inicio (i) generalmente est integrado por una consonante (/ba/) o un grupo consonntico (/cra/), pero tambin puede quedar como ncleo vaco (/is/).

    b) La rima (r) forma el resto de la slaba. A su vez, est subdividida en dos partes, -b.1. el ncleo (n) constituido siempre por la vocal de la slaba y -b.2. la coda (c), que puede estar ocupada por una consonante /las/ o grupo consonntico /cons/, aunque puede ser un ncleo vaco (Levelt, 1989). Vese como ejemplo la figura 2.4.

    Slabas s s s s / \ / \ / \ / \ i r i r i r i r | / \ | / \ | / \ | / \ i n c i n c i n c i n c | | | | | | | | | | | | | | | | | | | | | | | | V A - - O - TR A S T O -

    Figura 2.4. Estructuras silbicas de las palabras vaho (#va#o#) y trasto (#tras#to#).

    Hemos visto que en las etapas de anlisis del habla el estmulo acstico se analiza con el fin de detectar los rasgos que lo forman. Tras este anlisis, puede comenzarse a categorizar los segmentos de habla que, en la ltima etapa, sern traducidos a representaciones abstractas, que a su vez, pueden ser asimiladas dentro de los lmites impuestos por las reglas fonolgicas de la lengua del hablante.

    Para explicar cmo es transformado el input en combinaciones legales se ha propuesto una teora llamada de Anlisis por Sntesis. La teora supone que los oyentes poseen la representacin de una gama de sonidos. Al recibir la entrada acstica tratan de emparejarla con los sonidos que poseen, identificndola con el ms semejante. As, los sonidos se reconocen por asimilacin o sntesis con las estructuras de fonemas conocidas por el oyente. La ventaja de esta teora es que puede explicar por que los hablantes perciben categorialmente a pesar de las variaciones de tono, calidades de voz, gesto articulatorio, etc., con que se

  • presentan los fonemas. Por otra parte, explica como, las alteraciones de la entrada acstica debidas a la pronunciacin del hablante o la baja calidad del sonido son corregidas mediante ajuste por el oyente y no afectan a la categorizacin de los fonemas. Adems, esta hiptesis es compatible con la incorporacin de informacin ms compleja correspondiente a las propiedades del contexto en el que aparecen los fonemas (Kruelet et al., 1983). La comprensin es un proceso integrador: los oyentes no interpretan los sonidos, ni las palabras de forma aislada, sino de acuerdo al contenido de la oracin a la que pertenecen.

    Hasta aqu hemos visto las propiedades del proceso de percepcin del habla. Ahora vamos a tratar algunas de las teoras acerca del proceso.

    5. TEORAS DE LA PERCEPCIN DEL HABLA.

    5.1. Teora Motora de la percepcin del habla. Esta teora asume que la percepcin del habla es una forma especializada que presenta caractersticas diferenciales con otras modalidades de anlisis de entradas acsticas (Liberman, 1982; Mattingly y Liberman, 1985; Porter, 1987). Dicho de otro modo, el circuito neuronal especializado en el procesamiento del habla sera distinto del dedicado a otro tipo de seales acsticas. Lo que tiene de especial la percepcin del habla es que supone la coordinacin de los procesadores de la seal auditiva con la representacin de los esquemas motores para la produccin de sonidos de habla. En este sentido, produccin y comprensin se interpretan como un sistema integrado por dos subsistemas, cuya coordinacin contribuye tanto a la identificacin de los sonidos del habla, como al ajuste del programa motor de la emisin del habla. As, la teora asume que la representacin de cada fonema no slo contiene informacin acstica, sino que recoge informacin acerca de los movimientos que los rganos articulatorios realizan con el fin de emitir dicho fonema. En otras palabras, la estructura acstica de los fonemas se corresponde con los movimientos articulatorios que la originan (Studdert-Kennedy, 1987) y, en ese sentido, el oyente posee una especie de representacin de los gestos articulatorios que realizan otros hablantes. En definitiva lo que la teora motora propone es la existencia de un cdigo comn para el sistema perceptivo y articulatorio (Prinz, 1987; Klatt, 1989).

    Consecuentemente, la teora motora apoya la hiptesis de que la percepcin del habla obedece a mecanismos de anlisis (de la seal acstica) y mecanismos de sntesis (con la representacin sonora y motora). De la emisin se extraen los segmentos que componen el conjunto de sonidos y estos se comparan y acoplan a los patrones motores o articulatorios que originan el sonido. Las pruebas que sirven de apoyo para esta hiptesis son de tres tipos:

    a) La primera de ellas proviene de la naturaleza categorial de la percepcin del habla. Los fonemas son identificados como elementos de la misma categora fontica, a pesar de que acsticamente presentan patrones muy distintos. Algunos autores han interpretado este fenmeno afirmando que, pese a las diferencias sonoras, los fonemas siguen una misma secuencia articulatoria, lo que permite a los sujetos reconocerlos como elementos que pertenecen a la misma categora.

    b) Otros autores se han basado en las expectativas de los sujetos sobre la correspondencia entre los movimientos de los labios y el sonido emitido (McGurk y McDonald, 1976; Massaro y Cohen, 1983). Cuando los oyentes observan a un hablante esperan que el movimiento de los rganos articulatorios se adecue al sonido que ste emite. Esto mismo es lo

  • que lleva a que al escuchar a un ventrlocuo que hace hablar a un mueco, se produzca un desplazamiento de la atencin hacia el falso emisor.

    Por su parte, MacGurk y McDonald (1976) comprobaron que cuando se presenta informacin visual-auditiva incongruente, los sujetos tienden a dar una interpretacin que sintetiza y da coherencia a los datos divergentes. Estos autores pidieron a sus sujetos que miraran una pelcula de una persona que emita la slaba /ga/, pero el sonido que se escuchaba era la slaba /ba/. Sin embargo, lo que los sujetos del experimento afirmaban haber escuchado era la slaba /da/. Pareca que daban una solucin que disolva el conflicto perceptivo. Este acoplamiento entre la informacin visual y auditiva recibe el nombre de aprehensin visual. Igualmente, los bebs pasan ms tiempo atendiendo a un modelo que emite un sonido congruente con los movimientos articulatorios que cuando ambas percepciones son conflictivas (Miller, 1990).

    Todos estos datos demuestran que la informacin visual es una fuente poderosa de informacin incluso cuando la estimulacin acstica no es ambigua, por lo que la integracin entre ambas modalidades puede considerarse un proceso fundamental en la percepcin del habla (Massaro y Cohen, 1983).

    Las crticas que ha recibido la teora se apoyan en que se esperara que la percepcin del habla debera verse disminuida en pacientes con lesiones que les impiden producir los movimientos articulatorios, lo que no se comprueba en la mayor parte de los casos (Clark y Clark, 1977). El que se reconozcan los patrones de articulacin no significa que en la representacin se especifiquen todos los movimientos articulatorios concretos, sino que se refiere a una serie de operaciones articulatorias funcionalmente equivalentes (Studdert-Kennedy, 1987).

    5.2. Teora auditiva de la percepcin del habla. Esta teora sostiene que la percepcin del habla es semejante a la percepcin de cualquier estmulo auditivo, por lo que no requiere de ningn sistema especializado. Como consecuencia este enfoque rechaza el carcter especfico de la percepcin del habla. Tampoco asume que sea una capacidad especfica de la especie humana, aunque se apoye en rasgos de carcter innato (Lieberman y Blumstein, 1988; Miller, 1991), sino que la discriminacin de los sonidos de habla deriva de las propiedades auditivas caractersticas de los mamferos. Por consiguiente, los autores suponen que la seal acstica posee rasgos invariantes que son detectados por el sistema auditivo mediante los patrones espectrales y estimulatorios que afectan a los rganos receptores.

    Los datos favorables a esta teora provienen de la semejanza en la respuesta discriminativa a diferentes tipos de estmulos y en diferentes especies.

    Es de sobra conocido que algunas aves, como los loros, son capaces de producir, y, por tanto discriminar, sonidos semejantes a los producidos por los humanos. Si pueden segmentar y discriminar las entradas acsticas se espera que utilicen parmetros semejantes o, cuando menos equivalentes, a los de la especie humana.

    Por otra parte, algunos trabajos experimentales llevados a cabo por el grupo de Kulh (Kulh y Miller, 1978) ha mostrado como las chinchillas son capaces de percibir categorialmente fonemas oclusivos. Lo ms interesante es que las fronteras categoriales eran muy semejantes a las de los humanos (Miller, 1990). Estos resultados llevan a pensar que la discriminacin se

  • debe a las caractersticas del sistema auditivo comn a los mamferos, ms que a propiedades especficas de los humanos.

    Otros autores han destacado que el procesamiento perceptivo del habla es muy semejante al de estmulos musicales. Las notas son tambin categoras, que, como los fonemas, presentan fronteras borrosas. Adems, existen variaciones provocadas por las propiedades acsticas del instrumento a las que los oyentes deben ignorar para reconocer una pauta sonora. La conclusin que permite extraer el estudio comparado de la percepcin musical y del habla es que en ambos casos la alta discriminabilidad puede depender tanto de las cualidades del sistema auditivo como del entrenamiento.

    Lo que se despende de estos y otros estudios es que, al menos en lo que se refiere a la percepcin categorial, ni parece ser una propiedad exclusiva de los seres humanos, pues otros animales pueden discriminar fonemas (Taylor y Taylor, 1990), ni del habla, puesto que la msica plantea demandas muy semejantes.

    No obstante, este modelo deja varios puntos oscuros debido a que resta importancia a los segmentos del habla (Foss y Gernsbacher, 1983): las segmentaciones rtmicas, el manejo de rimas, etc. comunes a sujetos letrados y analfabetos y que constituyen una prueba de la realidad psicolgica de los fonemas. Por otra parte, supone un anlisis global de la entrada acstica, sin aclarar cmo se pasa de una estimulacin continua a una representacin discreta.

    Un interrogante que es transversal a la mayor parte de los estudios sobre el sistema de procesamiento del lenguaje es dnde reside el motor principal de la aparicin y desarrollo de la aparicin de las habilidades lingsticas en las condiciones biolgicas de la especie o en la oportunidad para el entrenamiento que ofrece el contexto social en el que somos educados? Los bebs son sujetos idneos para profundizar en estas cuestiones debido a su escasa experiencia lingstica por lo que sus habilidades pueden ser atribuidas a los recursos disponibles desde el nacimiento.

    6. La percepcin del habla en bebs. En muchos libros de texto se puede observar como se aluden a criterios de tipo semntico-conceptual para establecer los requisitos previos a la aparicin del lenguaje (Clark, 1983; Nelson, 1985; Bates y MacWhinney, 1987). Sin embargo, parece evidente que para que el nio reproduzca los sonidos del habla emitidos por otros hablantes y reconozca las palabras que producen, es preciso que haya sido capaz de representarse las estructuras sonoras de su lengua (Jusczyk, 1986; Aslin, 1987; Jusczyk et al., 1992).

    Parte de los estudios realizados con bebs se han dirigido a constatar sus habilidades discriminativas. Uno de los procedimientos diseados para este fin se basa en la medicin del ritmo de succin. Se sabe que los bebs aumentan el ritmo de succin ante estmulos nuevos o interesantes. Por ello Eimas y cols. (1971) idearon un chupete, cuya tetina tiene un sensor que, conctado a un ordenador, permite registrar el ritmo de succin. Si al beb se le presenta un estmulo comenzar a succionar hasta que, como consecuencia de la habituacin, el ritmo decaiga. Si, a continuacin se le presenta otro estmulo y lo reconoce como distinto, el ritmo de succin aumentar, si, por el contrario, lo percibe como idntico al anterior no se registrarn cambios de ritmo. Este procedimiento, no obstante, tiene la desventaja de que slo puede ser utilizado con bebs muy pequeos por lo que se han diseado otras tcnicas como la orientacin visual hacia el punto de procedencia del estmulo o el giro condicionado de la cabeza.

  • Para no extendernos slo citaremos los principales hallazgos obtenidos mediante estas tcnicas:

    a) Los bebs poseen una percepcin categorial: - Discriminan entre fonemas. - Fijan las fronteras categoriales en los mismos lmites que los adultos. - Como los adultos, no manifiestan discriminacin entre estmulos que se sitan

    dentro de dos lmites. b) Aprenden a ignorar elementos no significativos

    - Discriminan entre voces, pero ignoran estas propiedades en tareas de discriminacin fonemas (Jusczyk et al. 1992).

    - Entre 4 y 6 meses empiezan a dar muestras de adaptacin a la lengua materna, ignorando rasgos no significativo (Werker y Tees, 1984; Best, McRoberts y Sithole, 1988).

    c) Reconocen su lengua materna - Discriminan entre su lengua materna y otra lengua, pero no discriminan entre

    dos lenguas no familiares (Mehler et al., 1988). d) Su discriminacin se apoya en los rasgos prosdicos.

    - Prefieren muestras de habla en lenguaje dirigido a nios (Fernald, 1989). - Discriminan mejor en muestras e hablas con lenguaje dirigido a nios (Karzon,

    1985).

    Los hablantes tienen que resolver dos problemas que derivan de las caractersticas del habla. Es preciso segmentar una seal continua e identificar los fonemas (Miller y Jusczyk, 1989). Desde esta perspectiva, una parte considerable de los requisitos necesarios para adquirir el lenguaje depende de los mecanismos perceptivos. Antes de que el lenguaje se convierta en un instrumento simblico y las emisiones sean interpretadas semnticamente, los bebs han de desarrollar las habilidades perceptivas que les permitan identificar los elementos que componen el habla para as reconocer las secuencias emitidas por los adultos y poder reproducirlas (Jusczyk et al., 1992).

    Un buen nmero de las investigaciones que hemos citado ponen de manifiesto que poco tiempo despus del nacimiento, los bebs disponen de un sistema perceptivo sofisticado y altamente sensible a los estmulos del habla. Discriminan sonidos consonnticos, distinguen las vocales que los acompaan y su percepcin es, como la de los adultos, categorial. La temprana aparicin de estas habilidades y la rapidez con que los bebs asimilan las propiedades especficas de su lengua materna llevan a la conclusin de que estas habilidades dependen de las condiciones que forman parte de su herencia biolgica. Resulta difcil explicar la rapidez del aprendizaje y la aparicin temprana si no se acepta la existencia de mecanismos innatos sensibles a las propiedades acsticas del habla y de cuya maduracin depende el desarrollo de las habilidades perceptivas (Jusczyk y Bertoncini, 1988; Miller y Jusczyk, 1989).

    No obstante, las habilidades perceptivas son complementadas por la tendencia de los adultos a exagerar las pautas prosdicas para dirigirse a los nios. Como cabra esperar, dado que esta forma de comunicacin aparece en todas las culturas (Fernald, 1989), los rasgos que caracterizan al lenguaje dirigido a los nios (LDN) tienen consecuencias adaptativas nada desdeables. En primer lugar, da forma a la intencin comunicativa y en segundo lugar, sirve al oyente como indicador de los aspectos a los que debe prestar atencin si quiere interpretar el contenido de la emisin.

  • 7. La percepcin del habla continua. La dificultad de estudiar el proceso de percepcin estriba en que supone el anlisis en trminos de unidades discretas de un estmulo continuo. De hecho, la produccin del habla se caracteriza por el acoplamiento, o coarticulacin, de los gestos articulatorios lo que produce una transicin fluida de un gesto a otro. Adems, los oyentes no slo perciben la continuidad del lenguaje, sino que resulta indispensable para comprender la emisin. Es difcil comprender, incluso percibir, palabras aisladas, sin embargo, dentro de un contexto los defectos de calidad de la seal acstica pueden ser subsanados fcilmente sobre la marcha sin que se altere la inteligibilidad del discurso.

    Miller, Heise y Lichten (1951, en Clark y Clark, 1977) presentaron a los sujetos segmentos de una conversacin. Cuando se presentaban palabras aisladas los sujetos slo eran capaces de reconocer el 40% de las palabras, mientras que cuando aparecan integradas en oraciones, el reconocimiento alcanzaba el 70%. Dentro del contexto las palabras son ms predecibles y los defectos de la seal son corregidos por medio de la informacin que aportan los otros elementos del enunciado. Un dato que confirma la influencia de factores adyacentes es el que dentro del contexto las palabras se reconozcan incluso antes de que haya habido tiempo de terminar de analizarlas auditivamente (Marslen-Wilson, 1987). El input sensorial es insuficiente para reconocer los segmentos del habla, se precisa informacin del contexto al que pertenece.

    Otros autores han aportado datos acerca de las correcciones que realizan los oyentes durante el discurso. Los oyentes corrigen, sin advertirlo, errores fonticos que han sido cometidos por el hablante o creados artificialmente para la tarea experimental (Elman y McClelland, 1988). En una tarea de seguimiento, Marslen-Wilson (1975; y Welsh, 1978) encontr que los sujetos corregan sobre la marcha palabras que en su presentacin original contenan un error. Es ms, los sujetos corregan no slo aspectos fonolgicos sino lxicos, p.e. sustituan palabras, o hacan correcciones sintcticas.

    Que la integracin es un fenmeno natural en la percepcin y comprensin del habla queda demostrado por estudios de atencin selectiva que utilizan el paradigma de escucha dictica. Cuando la informacin bi-aural que reciben los sujetos est relacionada, en la tarea de recuerdo posterior sus respuestas muestran que el sujeto ha integrado la informacin pertinente recibida por el odo no atendido. As mismo, los sujetos utilizan informacin del odo no atendido para desambiguar los enunciados presentados por el canal atendido (Eysenck y Keane, 1990).

    Evidencias como la proporcionada por el estudio que acabamos de describir sugieren que la comprensin del lenguaje lleva asociados dos tipos contrapuestos de procesos: procesos de segmentacin y anlisis de elementos, que tienen por objetivo detectar los constituyentes de la emisin hablada (o escrita), y procesos de sntesis que retoman y reanalizan la emisin para extraer el contenido del mensaje. Mientras que el primero de los procesos depende de las caractersticas del input, el proceso de sntesis integra informacin sensorial con informacin procedente del contexto o del conocimiento del sujeto (Marslem-Wilson, 1989). Es decir, es un proceso interactivo, que integra componentes que actan de arriba-abajo.

    8. Especificidad de dominio.

  • Volviendo a cuestiones de tipo general, aludamos antes que una cuestin que subyace a los trabajos sobre percepcin del habla es hasta qu punto son habilidades para las que la especie humana ha desarrollado unos procesos especficos, y en ese sentido modulares. Los resultados obtenidos hasta ahora sealan, por una parte, que en la percepcin del habla intervienen mecanismos especficos que permiten realizar discriminaciones muy finas utilizando parmetros para categorizar segmentos de habla, como el TEV. Sin embargo, tambin se han encontrado datos que indican que el mismo procedimiento sirve para analizar y categorizar otros sonidos no pertenecientes al habla.

    Una cuestin sobre la que deber interrogarse el lector concierne a la especificidad de los mecanismos implicados en la adquisicin y uso del lenguaje. Si se acepta que forman un conjunto de procesos especficamente diseados para el lenguaje y diferenciados de otros mecanismos de finalidad general, habr de asumir que forman parte de las caractersticas distintivas de la especie humana y, por tanto, asentados sobre constituyentes de base innata. Si, por el contrario se concede mayor valor a la influencia de la prctica sobre la especializacin en el dominio de las funciones lingsticas a partir de procesos de finalidad general, se situar en una posicin no innatista.