apuntes de tcm a
TRANSCRIPT
1
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. FACULTAD DE PSICOLOGÍA
TEORIA COMPUTACIONAL DE LA MENTE .
Mtra. María Elena Ramos Aceves.
TEMA 1. INTRODUCCIÓN.
1.1 ¿Qué es la psicología cognoscitiva?.
La Psicología Cognoscitiva es un área de la Psicología que se ocupa del estudio
del “conocimiento humano y sus procesos”.
1.2 La teoría computacional de la mente como una perspectiva teórica dentro del
campo de la psicología cognitiva.
1.3 Relaciones Interdisciplinarias de la Psicología Cognitiva de Corte
Computacional.
Hemos visto que la Teoría Computacional de la Mente (de aquí en adelante TCM)
es una teoría que se ubica dentro del campo de la llamada “psicología
cognoscitiva”, consecuentemente está interesada en dilucidar la naturaleza del
conocimiento humano y sus procesos. Siendo un poco más específicos, TCM está
interesada en dilucidar cuestiones como las siguientes: ¿cómo funciona nuestro
sistema perceptual? ¿cómo seleccionamos la información relevante de nuestro
medio y cómo ésta se almacena en nuestra memoria? ¿en qué tipo de código o
formato se almacena esta información (cuasi-lingüístico, imágenes, etc.)? ¿cómo
hacemos para recuperar la información de nuestra memoria cuando la
necesitamos? ¿cuáles son las capacidades de almacenamiento de nuestra
memoria? ¿por qué olvidamos? ¿cuáles son los principios subyacentes a nuestras
capacidades para el razonamiento, y cómo ellos nos confieren la habilidad de
solucionar los problemas que enfrentamos en la vida cotidiana? ¿cómo evaluamos
las distintas opciones cuando tenemos que tomar decisiones, de manera que
podamos elegir las vías de acción apropiadas, en aras de alcanzar los objetivos
que deseamos? ¿cómo somos capaces de planear y producir las secuencias de
2
oraciones que conforman nuestro discurso cuando hablamos un lenguaje y cómo
hacemos para decodificar el discurso cuando comprendemos las emisiones de los
otros? ¿cómo se relacionan la emoción y el pensamiento? ¿cómo la cultura y el
grupo social al que pertenecemos pueden modelar nuestro pensamiento?, etc, etc.
Por supuesto, llegar a entender cómo nuestra mente-cerebro hace todas estas
cosas no es una tarea fácil. Requiere, por ende, de la colaboración de distintas
disciplinas, las cuales, al aportar elementos provenientes de diferentes
perspectivas, contribuyen a la construcción de un panorama más certero y
completo de los procesos cognitivos humanos.
Según el psicólogo Howard Gardner, la psicología cognitiva de corte
computacional mantiene relaciones interdisciplinarias con las siguientes áreas de
estudio:
Tomado de Gardner, 1985, p. 53
3
Veamos cada una de estas disciplinas por vez.
FILOSOFIA.
Se sabe que la filosofía es la madre de todas las ciencias. Bueno, pues la
psicología cognoscitiva en general y TCM en particular no son una excepción.
Podemos decir que TCM mantiene vínculos con la filosofía, en primer lugar,
porque los problemas de los que TCM se ocupa le fueron heredados por la
filosofía.
Si, como ya se ha dicho, el objeto básico de estudio de TCM es el conocimiento
humano y sus procesos, este interés es un legado de la preocupación de los
filósofos (específicamente de los epistemólogos) por el conocimiento. Las
primeras indagaciones sobre la naturaleza del conocimiento datan de la
antigüedad griega y han sido el objeto de discusión filosófica por siglos hasta la
actualidad.
¿Cuál es el interés que los filósofos, específicamente los llamados epistemólogos,
tienen en el conocimiento?
La epistemología es un área de la filosofía cuyo objeto de estudio es justamente el
conocimiento y sus condiciones de validez. Expliquemos esto.
El filósofo René Descartes (1596-1650) consideró un día lo siguiente: “me
he dado cuenta de que muchas de mis creencias, las cuales yo tenía por
verdaderas, estaban equivocadas”, eso lo llevó a cuestionarse cuántas de sus
creencias eran en realidad ciertas ¿qué tal si había vivido tanto tiempo engañado
creyendo puras falsedades? ¿cómo podía él estar seguro de la verdad de sus
creencias? Estos cuestionamientos le llevaron a preocuparse por los fundamentos
últimos de todo conocimiento, entendiendo él por conocimiento, todo aquello que
podemos dar por cierto, por verdadero, infalible, incorregible, de tal manera que no
pueda ser refutado por ninguna evidencia posterior.
Descartes, en su deseo de determinar cuáles eran los fundamentos del
conocimiento propuso, como una estrategia metodológica, lo que él llamó la “duda
metódica” la cual consistía en dudar de todo aquella creencia para la que existiese
la mínima sospecha de falsedad. Siguiendo este método Descartes llegó a poner
4
en duda toda aquella creencia que se apoyara en los sentidos, para él “del que
alguna vez nos ha engañado no debemos fiarnos” y es claro que los sentidos nos
engañan. Si no podemos confiar en que el mundo sea cómo nos es dado a los
sentidos ¿de qué otra manera podríamos fundamentar el conocimiento?
Descartes, después de una larga serie de consideraciones, llega a la conclusión
de que el fundamento de todo conocimiento se encuentra en la facultad de la
razón. La facultad de la razón es la que nos permitirá corregir los errores a que
pueden conducirnos nuestros sentidos.
Esta posición cartesiana, la cual ha sido clasificada como una forma de
“racionalismo”, no fue aceptada por otro grupo de filósofos llamados “empiristas”.
Para estos últimos, la fuente y fundamento de todo conocimiento debía hallarse en
la experiencia sensorial. Surge así un debate entre los partidarios de la razón por
un lado, y los partidarios de la experiencia sensorial, por el otro. Mientras que los
primeros ponían énfasis en la capacidad de razonamiento humano y en el carácter
innato de algunas de nuestra ideas, como la de Dios o ciertos principios lógicos y
geométricos; los segundos rechazaban tajantemente la existencia de ideas innatas
y postulaban que “nada puede haber en el pensamiento que no haya pasado
antes por los sentidos”.
Immanuel Kant (1724-1804) fue un filósofo muy famoso que intento poner fin a
esta polémica adoptando una posición mediadora. El sostenía que en el proceso
de conocimiento tanto el sujeto, como el objeto de conocimiento, tienen una
aportación que hacer. De tal manera que el conocimiento es el producto, tanto de
lo que es puesto en nuestra mente tras la percepción del objeto, como de lo que
es puesto por el sujeto en el objeto, dadas sus propias facultades cognoscitivas,
pues la mente del sujeto no es una tabula rasa.
Estas discusiones ocuparon por mucho tiempo a los filósofos, el problema
es que ellas estaban basadas en la especulación. Los psicólogos han retomado
estas cuestiones pero intentando darles una respuesta empírica, valiéndose de la
observación y de la investigación experimental de los hechos.
5
Otra razón por la que el quehacer filosófico es relevante para la psicología
cognitiva se deriva del hecho de que la reflexión filosófica nos ayuda a aclarar y
comprender los conceptos complejos de los que se vale TCM. Tarea que no
podría realizarse echando mano de ningún tipo de observación o de investigación
de laboratorio. Para ilustrar el punto, consideremos como ejemplo las
investigaciones realizadas en el ámbito de la psicología del razonamiento. Estas
investigaciones consisten en aplicar a los sujetos todo tipo de tareas de
razonamiento, para después, tras un análisis de sus respuestas, tratar de
descubrir los principios o reglas subyacentes que conforman la competencia
humana para el razonamiento. Un remarcable resultado de estas investigaciones
es que los seres humanos razonamos de maneras que se desvían de ciertos
principios o reglas de “buen razonamiento” establecidos por la Lógica, que es la
disciplina que nos dice cuando un razonamiento es correcto o incorrecto. Este
resultado ha llevado a algunos autores a concluir que la irracionalidad humana ha
quedado experimentalmente demostrada. Otros, en cambio, han defendido la idea
de que, a pesar de los resultados de los experimentos, los seres humanos somos
racionales. La estrategia de estos autores ha sido apelar a nociones de
racionalidad distintas de la noción tradicional que se deriva de la Lógica. Ellos han
tenido que buscar una respuesta alternativa a la pregunta acerca de qué significa
ser racional.
Como podemos darnos cuenta, una cuestión de este tipo no puede ser respondida
haciendo algún tipo de observación o realizando algún experimento en el
laboratorio. Una cuestión como esta requiere, más bien, de un análisis reflexivo
acerca de la forma en que nosotros hemos decidido usar nuestros conceptos. Y es
en este momento en el que la filosofía puede sernos de gran ayuda.
INTELIGENCIA ARTIFICIAL.
¿Qué puede aportar la Inteligencia Artificial (IA) a la comprensión del conocimiento
humano y sus procesos?
Sabemos que TCM presupone que la computadora digital es un buen modelo del
pensamiento. La aparición de las computadoras a mediados de los 50´s fue un
6
factor clave para el surgimiento del enfoque cognitivo en la psicología. La
sorprendente capacidad exhibida por estas máquinas en la solución de problemas
que hasta entonces eran sólo de competencia humana, dio sustento a la
concepción de que toda inteligencia implicaba el uso y manipulación de símbolos
de acuerdo a reglas susceptibles de representación lógica o matemática.
Esta concepción nos lleva entonces a establecer una analogía entre las
computadoras y las mentes en el sentido de que ambas son “procesadores de
información”. Consecuentemente la computadora se convierte en un instrumento
fundamental para modelar (simular) los procesos cognitivos del ser humano. Es
aquí en donde entra la participación de la IA. Ella nos da las herramientas para
construir programas cada vez más complejos que nos permitan modelar procesos
psicológicos y someter así a prueba hipótesis psicológicas. Pero no sólo eso, los
programas desarrollados dentro de la IA –que pueden incluso ser creados con
fines muy diferentes del de simular procesos cognitivos humanos-- pueden llegar
a sernos útiles como una fuente de inspiración para la generación de hipótesis
sobre la cognición humana.
NEUROFISIOLOGÍA.
TCM asume que hay un nivel de investigación de lo mental que puede ser
estudiado con total independencia del nivel neurofisiológico y que es el que
propiamente compete a los psicólogos cognitivos. Una forma simple de explicar
cuál es ese nivel es apelar a la distinción entre hardware y software en una
computadora. El hardware es la estructura física de la máquina, los cables, los
circuitos integrados, los microprocesadores, etc. El software es el conjunto de
instrucciones que sigue la máquina para realizar una cierta función. Este conjunto
de instrucciones no es otra cosa que el programa que corre la computadora.
Extrapolando esta terminología computacional al ámbito de lo mental podría
entenderse a la mente misma como el software del cerebro, el cual vendría a ser
el hardware o estructura física en que se realiza el programa. Es entonces el nivel
de software el que le compete investigar al psicólogo cognitivo, para quien el
objetivo fundamental sería dilucidar cuál es el “programa que corre el cerebro”. Y
7
claramente, parece ser que esta tarea puede ser realizada sin consideraciones
sobre la estructura física que da soporte a este programa. No obstante, el aceptar
esto no implica que los psicólogos cognitivos consideren que la neurofisiología es
totalmente irrelevante a su quehacer. Si bien es cierto que la psicología cognitiva y
la neurofisiología se mueven en niveles muy diferentes de análisis los cuales son
irreductibles, también es cierto que el conocimiento de muchas de las
características de un nivel de análisis puede resultar útil para obtener
conocimiento acerca del otro. Permítaseme aquí retomar un ejemplo muy
ilustrativo que dan Smith y Kosslyn en su libro Procesos Cognitivos:
“Puede reemplazarse una descripción de la función de unas tijeras por una
descripción de la disposición de los átomos de sus hojas? Está claro que
no. ¿Qué decir de la mano humana? ¿podría reemplazar una descripción
de huesos, tendones y músculos las descripciones de asir, acariciar y
remover? No. El ordenador y el cerebro no son diferentes de estos
ejemplos. Para entenderlo del todo se ha de distinguir entre un nivel
funcional de análisis (las acciones que unas tijeras y una mano realizan) y
un nivel físico de análisis (en el que se describen las propiedades físicas de
las partes que componen estos objetos)...............Aunque no se puede
reemplazar un nivel de análisis por otro, se pueden obtener conocimientos
de las características de un nivel a partir de los otros. Probablemente no se
podrían fabricar unas tijeras que funcionaran con cartón mojado: es
importante conocer las características físicas de los materiales para
comprender cómo una hoja puede tener un borde cortante (y porqué
algunos materiales son más apropiados que otros). Del mismo modo, la
estructura física de la mano es lo que le permite todas esas cosas
maravillosas: sin palma, ni dedos, ni pulgar no hay prensión caricia o
movimiento..........para entender completamente la actividad mental es
necesario considerar los mecanismos neurales que la originan lo que en
última instancia requiere comprender cómo el cerebro da lugar a la
actividad mental.”
8
Concretando, puede decirse que la psicología cognoscitiva y la neurofisiología se
vinculan en el sentido de que esta última impone restricciones a la clase de teorías
cognoscitivas que pueden ser construidas, lo cual quiere decir que las teorías
cognoscitivas construidas deben ser neurofisiológicamente plausibles. Pero la
dirección de la influencia entre estas dos disciplinas también se da en el sentido
inverso: las teorías sobre procesos cognoscitivos también pueden llegar a orientar
y restringir a las teorías neurofisiológicas.
LINGÜÍSTICA.
La capacidad para el lenguaje es una de las capacidades superiores del ser
humano. Además, el lenguaje es el medio mismo en el que se expresa y comunica
todo conocimiento posible. Y puesto que la lingüística es una disciplina que se
ocupa de estudiar el lenguaje, es obvio que tiene mucho que aportar al estudio de
la capacidad humana para el lenguaje.
Es importante destacar que en algún tiempo las relaciones interdisciplinarias de la
lingüística y la psicología no fueron muy estrechas. La lingüística se ocupaba, ante
todo, de estudiar las distintas lenguas, haciendo estudios comparativos y tratando
de encontrar universales lingüísticos. Específicamente, la lingüística buscaba
identificar y clasificar los elementos componentes de la distintas lenguas: sujeto,
verbo, pronombres, artículos, etc. así como dilucidar sus respectivas gramáticas,
esto es, el conjunto de reglas que regulaban la concatenación de símbolos
(palabras) para la construcción de oraciones bien formadas. En realidad los
psicólogos y los lingüistas no tenían mucha comunicación. Fue a partir de Noam
Chomsky que este panorama cambió.
Chomsky es un lingüista que se preocupó por dar cuenta de la “productividad” del
lenguaje natural. Él se preguntaba cómo era posible que un individuo fuera capaz,
en principio, de comprender y producir un número infinito de oraciones, a partir de
un vocabulario finito. En oposición al conductismo, consideraba que la
productividad no podía ser explicada en términos de la exposición a un conjunto
limitado de contingencias de reforzamiento. Propuso entonces que la única
manera de explicar la productividad era apelar a un conjunto de reglas
9
representadas en nuestra mente. De este modo, al considerar que las habilidades
lingüísticas humanas pueden ser explicadas por referencia a un sistema complejo
de reglas y principios representados en la mente de los hablantes, Chomsky
asume una posición mentalista, ubicando a la teoría lingüística dentro del ámbito
objetual de la psicología. Fue así que la psicología y la lingüística empezaron a
estrechar sus lazos.
ANTROPOLOGÍA.
Asumiendo que la “cultura” es el principal objeto de estudio de la antropología y
considerando la siguiente definición de cultura: “La cultura es la totalidad compleja
que incluye los conocimientos, creencias, artes, moral, leyes, costumbres y
cualesquiera otras capacidades y hábitos adquiridos por el hombre como miembro
de la sociedad” (Tylor), es claro que la antropología también se ocupa del
conocimiento humano.
Podemos mencionar varios temas o tópicos que interesan tanto al psicólogo
cognitivo como al antropólogo y en el que la cooperación de ambos resulta
provechosa.
- Unidad psicológica de la especie humana.
En algún tiempo los antropólogos (por ejemplo Lévy-Bruhl) consideraron que la
mente de la gente “primitiva” era muy diferente de la del europeo civilizado y que
se encontraba algunos niveles atrás en la escala evolutiva. Se creía que los
hombres primitivos tenían una mentalidad pre-lógica, consecuentemente eran
insensibles a la contradicción y eran incapaces de pensamiento abstracto. Fue
tras largas discusiones y estudios empíricos que los antropólogos (como Tylor y
Boas) se dieron cuenta de que las diferencias entre los primitivos y los civilizados
eran una cuestión de grado y que no había diferencias fundamentales....”la
estructura fundamental de la mente humana es la misma en todas partes”. Llegar
a una conclusión como esta fue fundamental para la psicología cognoscitiva, en
tanto que ésta, como ciencia, busca descubrir “principios universales” que den
cuenta del funcionamiento mental de la especie humana.
10
- Lo universal y lo particular.
Los estudios transculturales de índole psicológica realizados por los antropólogos,
han aportado elementos valiosísimos para determinar hasta qué punto ciertos
procesos mentales son universales o idiosincrásicos.
- Conocimiento Innato vs. Adquirido.
El antropólogo Edward Taylor “declaraba que las capacidades humanas no
formaban parte de lo que cada individuo traía al nacer, sino que más bien
derivaban de su pertenencia a un grupo, y presumiblemente podían modificarse si
el individuo era criado en un grupo distinto, o si el grupo mismo modificaba sus
prácticas o sus valores. Este énfasis en el aprendizaje asestó un rudo golpe a la
noción de que los seres humanos se conducen como lo hacen debido a rasgos
heredados o al lugar que ocupan en la escala evolutiva”.
Por supuesto, esto que acaba de mencionarse enfatiza la perspectiva de Tylor y
de la mayoría de los antropólogos. Y es justo señalar que esta no es una posición
generalizada que acepten todos los psicólogos cognitivos. Sin embargo, es
innegable que estos discernimientos de los antropólogos, han contribuido a abrir el
debate sobre la importancia de la cultura en el moldeamiento de nuestras
capacidades cognoscitivas y han aportado elementos fundamentales para intentar
clarificar qué aspectos de nuestra cognición pueden ser atribuidos a nuestra
herencia biológica y cuáles deben ser atribuidos, más bien, a nuestra herencia
cultural.
- La relación entre pensamiento y lenguaje.
Los estudios antropológicos también han aportado elementos imprescindibles para
dirimir la cuestión, que todavía sigue siendo polémica, de si nuestro pensamiento
determina nuestro lenguaje --de modo tal que éste último no es más que un mero
reflejo del primero-- o si, por el contrario, el lenguaje que hablamos determina
nuestro pensamiento –de modo tal que los conceptos que aprendemos al
aprender un lenguaje condicionan nuestra manera de percibir y de pensar sobre el
11
mundo. En relación a este punto son interesantes los estudios antropológicos
sobre las maneras en que los seres humanos de distintas culturas categorizan la
realidad (por ejemplo, los colores, las plantas, los animales, etc.)
BIBLIOGRAFÍA
Smith, E. & Kosslyn, S. (2007): Procesos Cognitivos: Modelos y Bases Neurales.
España, Pearson Prentice Hall, 2008.
Clasificación: BF311 / S57518
Gardner, Howard; (1985): La nueva ciencia de la mente. Historia de la revolución
cognitiva. Barcelona, Paidós, 1987.
Clasificación: BF311 / G373
12
TEMA 2. CONTEXTUALIZACIÓN HISTÓRICA: FACTORES QUE
CONTRIBUYERON AL SURGIMIENTO DE LA VISIÓN COMPUTACI ONAL DE
LA MENTE.
La psicología cognitiva de corte computacional surgió a mediados del siglo pasado
(década de los 50’s) como resultado de la confluencia de tres factores
fundamentales:
- La inviabilidad del Conductismo.
- La Revolución de Noam Chomsky en el ámbito de la Lingüística.
- Desarrollos en Lógica y Computación.
2.1 Inviabilidad del Conductismo.
La teoría conductista, que hasta entonces había dominado el campo de la
investigación psicológica, empieza a mostrarse como una teoría inviable. Aquí
nos ocuparemos básicamente de tres argumentos que tuvieron fuerte influencia en
la desacreditación del conductismo. Pero antes de adentrarnos en ellos es
conveniente dar una breve perspectiva sobre cuáles son los principales postulados
con los que se compromete el conductismo.
El periodo de auge de la Teoría Conductista comprende las décadas de 1920,
1930 y 1940.
Principales exponentes:
-John B. Watson (1878-1958). Sus principales obras son: “La Conducta.
Introducción a la Psicología Comparada” de 1914; “La Psicología desde el punto
de vista Conductista” de 1919; y “Conductismo” de 1925.
-Burrhus F. Skinner (1904-1990). Sus principales obras son: “La Conducta de los
Organismos” (1939); “Walden Dos” (1948); “Ciencia y Conducta Humana” (1957);
“Conducta Verbal” (1957); “Más allá de la libertad y la dignidad” (1971).
Postulados Básicos del Conductismo:
- Rechazo de la Introspección.
- Rechazo de conceptos mentalistas tales como: mente, imaginación, plan,
deseo, propósito, representación mental..etc
13
- Considera a los fenómenos mentales como epifenómenos.
- Métodos públicos de observación.
- Se centra exclusivamente en la conducta.
- Creencia en la supremacía y poder determinante del medio ambiente.
- Intento de imponer un rigor comparable al de la Física, la Química o la
Biología, en el estudio de la conducta humana (este intento se da como un
resultado directo de la influencia del “empirismo lógico” o “positivismo
lógico” en el ámbito de la filosofía de la ciencia).
- Rechazo total a la Teoría Psicoanalítica.
Críticas a la Introspección. (Manuel de Vega, p. 42)
- “El observador debe concentrarse al máximo en la observación y
seguimiento del fenómeno; esto no es posible en la introspección pues el
individuo debe dividir sus recursos mentales entre el fenómeno psíquico de
interés y su observación”.
- “Es preciso que cada observación se pueda repetir varias veces
(replicabilidad), y esto no es posible en las observaciones introspectivas”.
- “La introspección es siempre retrospección ya que ocurre cierto tiempo
después de la experiencia mental; es posible que esta demora produzca
olvidos o distorsiones de dicha experiencia”.
- “Muchos datos de interés psicológico simplemente no son accesibles a la
conciencia del sujeto y por tanto no son susceptibles de auto-observación”.
Pasemos ahora sí a los argumentos en contra del conductismo:
A. El Argumento de Karl Lashley. El problema del orden serial en la conducta.
“En septiembre de 1948, en el simposio de Hixon (en el Instituto de Tecnología de
California, en Pasadena), el psicólogo Karl Lashley pronunció un discurso titulado
“El problema del orden serial en la conducta”. En dicho discurso Lashley se opone
al conductismo y expresa su convicción de que cualquier teoría acerca de la
actividad humana debía dar cuenta de conductas organizadas complejas, como
14
las de jugar al tenis, tocar un instrumento musical y, sobre todo, expresarse en un
lenguaje cualquiera. Para él, el conductismo no era capaz de dar cuenta de
ninguna de las conductas anteriores y en general de ninguna conducta ordenada
en forma secuencial. La razón es que estas secuencias de acciones se
desenvuelven con tanta rapidez que ningún eslabón de la cadena puede basarse
en el precedente; por ejemplo, cuando un pianista toca un arpegio, simplemente
no hay tiempo para la retroalimentación, para que un tono dependa del anterior o
refleje de algún modo su efecto, Análogamente, los errores que cometen los
individuos (por ejemplo, los deslices en el habla) suelen incluir anticipaciones de
palabras que se profieren sólo mucho después en la secuencia. Y también estos
fenómenos desafían toda explicación en términos de cadenas lineales del tipo “A
produce B”…..Según Lashley, estas secuencias de conductas deben estar
planeadas y organizadas de antemano. La organización más verosímil es de tipo
jerárquico…” (Gardner, 1985, p. 28,29)
B. La revisión de Noam Chomsky del libro de B. F. Skinner “Conducta Verbal”.
“En Conducta Verbal, Skinner defiende la idea de que la conducta verbal puede
predecirse y controlarse tras la observación y manipulación del ambiente físico del
hablante. Skinner considera que factores externos tales como la estimulación
presente y la historia de reforzamiento son de fundamental importancia.
Considera, además, que los principios generales revelados en los estudios de la
conducta animal en el laboratorio proveen las bases para entender las
complejidades de la conducta verbal. De manera confiada, Skinner sostiene haber
demostrado que la contribución del hablante es completamente trivial, y que la
predicción precisa de la conducta verbal involucra solamente la especificación de
los pocos factores externos que él ha aislado experimentalmente en organismos
inferiores.
Sin embargo, un cuidadoso análisis de este libro revela que estas asombrosas
declaraciones distan mucho de estar justificadas.
Tras un análisis de los conceptos básicos de la teoría conductual, tales como:
estímulo, respuesta, reforzador y condicionamiento, puede concluirse lo siguiente:
si nosotros tomamos esos términos en un sentido literal (es decir, como teniendo
15
los significados técnicos dados en las definiciones de Skinner), entonces la
descripción que hace Skinner no abarca casi ningún aspecto de la conducta
verbal. Por otro lado, si nosotros tomamos esos términos en un sentido metafórico,
la descripción no ofrece ninguna ventaja (no es ni más científica ni más clara) en
relación con otras formulaciones tradicionales, toda vez que dichos términos
pierden su significado objetivo y caen en la vaguedad e imprecisión del lenguaje
ordinario. Expliquemos esto.
Si bien parece cierto que las nociones de estímulo, respuesta, reforzamiento, etc,
están relativamente bien definidas con respecto a los experimentos de presionar
barras y a otros similarmente restringidos, también ocurre que la extrapolación de
estas nociones a la explicación de la conducta verbal genera dificultades que
deben encararse.
Primero que todo, debe establecerse si algún evento físico al cual el organismo es
capaz de reaccionar en una ocasión dada debe ser llamado un “estímulo”, o
solamente aquel al cual el organismo de hecho reacciona. Del mismo modo, debe
establecerse si cualquier parte de la conducta debe ser llamada una “respuesta” o
solamente aquella que está conectada con el estímulo de manera legal.
En La conducta de los organismos Skinner se compromete con las definiciones
estrechas de estos términos. Una parte del ambiente y una parte de la conducta
son llamados estímulo (elicitador, discriminativo, o reforzador) y respuesta
respectivamente, pero solamente si ellos están legalmente relacionados, esto es,
si la leyes dinámicas que los relacionan muestran curvas llanas y reproducibles.
Sin embargo, el problema es que no se ha mostrado que estímulos y respuestas,
así definidos, figuren muy ampliamente en la conducta humana ordinaria. De
cualquier modo, siempre podemos tratar de mantener la legalidad de la relación
entre estímulo y respuesta, pero solamente al precio de privarlos a ellos de su
carácter objetivo.
Veamos cómo ocurre esto en el caso del concepto de “estímulo”: Skinner asume
que las respuestas verbales de un individuo están bajo el control de propiedades
extremadamente sutiles de un objeto físico o de un evento. Imaginemos, por
ejemplo, las respuestas que pueden ser dadas ante la presentación de una
16
pintura: “da Vinci”, “yo pensé que a ti te gustaba el arte abstracto”, “nunca había
visto esto antes”, “hermoso”, “desentona con el tapiz”, “está inclinado”,
“¿recuerdas nuestro campamento del verano pasado?”, o cualesquiera otra cosa
que pueda venir a nuestra mente al mirar la pintura. Skinner solo podría decir que
cada una de estas respuestas está bajo el control de alguna propiedad diferente
del estímulo o del objeto físico. Si nosotros miramos una silla roja y decimos rojo,
la respuesta está bajo el control del estímulo “rojez”; si nosotros decimos silla la
respuesta está bajo el control del conjunto de propiedades “sillez” y similarmente
para cualquier otra respuesta. Este recurso es simple, pero vacío, pues aunque
nosotros podemos dar cuenta de una amplia variedad de respuestas tras la
identificación del estímulo que controla la respuesta, la palabra “estímulo” pierde
toda objetividad en este uso. El “estímulo” no es más una parte del mundo físico,
sino que éste es ubicado dentro del organismo, pues nosotros podemos identificar
el estímulo hasta que escuchamos la respuesta. Sobre la base de este ejemplo
queda claro que el término “estímulo controlador” simplemente disfraza una
completa retirada hacia una psicología mentalista. Nosotros no podemos predecir
la conducta verbal en términos del estímulo en el ambiente del hablante, ya que no
conocemos cual es el estímulo controlador hasta que el individuo responde.
Además, ya que nosotros no podemos controlar la propiedad de un objeto físico a
la cual un individuo responderá (excepto en casos sumamente artificiales), la
afirmación de Skinner de que su sistema (en tanto opuesto al tradicional) permitirá
el control práctico de la conducta verbal es completamente falso.
Otros ejemplos de estímulo controlador nos muestran esta pérdida de objetividad
del concepto y nos muestran cómo éste deja de usarse en su sentido literal para
usarse en un sentido más bien metafórico. Así, se sostiene que un sustantivo
propio es una respuesta “bajo el control de una persona o cosa específica” (como
estímulos controladores). Frecuentemente yo he usado las palabras Eisenhower y
Moscú, las cuales yo presumo son sustantivos propios si es que algo lo es, pero
yo nunca he sido estimulado por los objetos correspondientes. ¿Cómo puede
hacerse a este hecho compatible con esta definición? Supóngase que yo uso el
nombre de un amigo que no está presente ¿es éste una instancia de un sustantivo
17
propio bajo el control de mi amigo como estímulo? En algún otro lado se ha
afirmado que un estímulo controla una respuesta en el sentido de que la presencia
del estímulo incrementa la probabilidad de la respuesta. Pero obviamente no es
verdad que la probabilidad de que un hablante mencione un nombre se
incremente cuando el portador de ese nombre encara al hablante. Además ¿cómo
puede el propio nombre de uno ser un sustantivo propio en este sentido? Una
multitud de cuestiones similares surgen inmediatamente. Parece que la palabra
control aquí es meramente una paráfrasis equívoca del tradicional denotar o
referir. La afirmación de que en lo que concierne al hablante, la relación de
referencia es “simplemente la probabilidad de que el hablante emita una respuesta
de una forma dada en la presencia de un estímulo con propiedades especificadas”
es seguramente incorrecta si nosotros tomamos las palabras presencia, estímulo,
y probabilidad en su sentido literal.
Y parece que en realidad no se intenta que dichas palabras sean tomadas
literalmente, lo cual se hace evidente en muchos ejemplos: Cuando un enviado
observa los eventos en un país extraño y los reporta a su regreso, su reporte está
bajo un “estímulo controlador remoto”; la oración Esto es la guerra puede ser una
respuesta a una “situación internacional confusa”; el sufijo –ed es controlado por
esa “sutil propiedad del estímulo de la cual nosotros hablamos como acción-en-el-
pasado” al igual que –s en The boy runs [El muchacho corre] está bajo el control
de características específicas de la situación tales como su actualidad. Ninguna
caracterización de la noción de estímulo controlador que esté remotamente
relacionada con el experimento de presionar la barra (o que preserve la mínima
objetividad) puede hacerse para cubrir ejemplos como estos......”
C) Noam Chomsky: el argumento de pobreza de estímulo.
Chomsky nos hace ver que la capacidad humana para entender y emitir nuevas
expresiones del lenguaje es infinita (productividad), aún cuando, durante el
proceso de aprendizaje, la exposición efectiva a contingencias lingüísticas es
limitada. Este hecho lleva a Chomsky a proponer que una explicación completa de
la capacidad humana para el uso del lenguaje debe ir más allá de los datos (o
inputs) a los que ha estado expuesto el individuo y más allá de su conducta
18
efectiva. Para él, una explicación completa de la capacidad humana para el uso
del lenguaje debe además, indagar cuales son las reglas, representadas en
nuestra mente, que subyacen a la producción del lenguaje, pues sólo apelando a
estas reglas puede explicarse la productividad del lenguaje sobre la base de un
vocabulario finito.
2.2 La Revolución de Noam Chomsky en el ámbito de la Lingüística.
Otro hecho importante que sentó las bases para el surgimiento del
cognoscitivismo y en particular de la visión computacional, fue la revolución que la
teoría gramatical de Noam Chomsky impulsó en el ámbito de la Lingüística tras la
publicación de Estructuras Sintácticas en 1957.
Se considera que las razones por las que la teoría de Chomsky pudo trascender el
ámbito de la lingüística y llegar a tener tan marcada repercusión en disciplinas
como la psicología y la filosofía, son básicamente las siguientes:
• Al considerar que las habilidades lingüísticas humanas pueden ser explicadas
por referencia a un sistema complejo de reglas y principios representados en la
mente de los hablantes, Chomsky asume una posición mentalista, ubicando a
la teoría lingüística dentro del ámbito objetual de la psicología. Esto fue muy
importante en una época en que el mentalismo apenas empezaba a ganar
espacio como una empresa viable.
• Chomsky mostró la posibilidad de hacer una caracterización lógico-formal del
lenguaje. El hecho de que una facultad cognoscitiva humana tan compleja
como lo es el lenguaje, fuera susceptible de descripción lógico-formal fortaleció
la convicción en la posibilidad de una descripción lógico-formal de todas las
facultades cognoscitivas e intelectuales humanas.
2.3 Desarrollos en Lógica y en Computación.
¿QUE ES LA LOGICA? Estudio del razonamiento desde el punto de vista de si este es correcto o incorrecto.
19
Durante casi dos milenios había imperado la lógica del razonamiento silogístico
desarrollada por Aristóteles. Fueron lógicos y matemáticos como Frege,
Whitehead y Russell (entre otros), quienes buscando los fundamentos de las
matemáticas, llegaron a desarrollar una nueva lógica. Esta nueva lógica implicaba
la manipulación de símbolos abstractos, lo que la convirtió en una herramienta
más rigurosa, más precisa y de mayor alcance para modelar las operaciones del
pensamiento.
Poco después, cuando empezaron a diseñarse las primeras computadoras, la
lógica jugó un rol de fundamental relevancia, pues llegó a constituirse en el
lenguaje básico de operación (y lo sigue siendo en la actualidad) de estas
máquinas. La aparición de las computadoras a mediados de los 50´s fue un factor
clave para el surgimiento del enfoque cognitivo en la psicología. La sorprendente
capacidad exhibida por estas máquinas en la solución de problemas que hasta
entonces eran sólo de competencia humana, dio sustento a la concepción de que
toda inteligencia implicaba el uso y manipulación de símbolos de acuerdo a reglas
susceptibles de representación lógica o matemática.
Desarrollos en Computación. Norbert Wiener & Julian Bigelow
Llegaron a la conclusión de que existían importantes analogías entre las características de retroalimentación de los dispositivos de la ingeniería y los procesos homeostáticos mediante los cuales el sistema nervioso de los seres humanos sustenta una actividad intencional. Al trabajar en servomecanismos (sistema electromecánico que se regula por sí mismo al detectar el error o la diferencia entre su propia actuación real y la deseada (Diccionario de la lengua española)), Wiener reflexionó sobre la naturaleza de la retroalimentación y de los sistemas de autocorrección y de autorregulación, ya fueran mecánicos o humanos En un artículo de 1943, “Conducta, propósito y teleología”; Wiener, Bigelow y Rosenblueth expusieron la idea de que los problemas de la ingeniería de control y de la ingeniería de las comunicaciones son inseparables; además, de que su eje no son las técnicas de la ingeniería eléctrica, sino algo mucho más trascendental: el mensaje, “ya sea transmitido por medios eléctricos, mecánicos o nerviosos”. Los autores incorporaron una noción entonces revolucionaria: si una máquina posee retroalimentación, es legítimo decir que “persigue metas”, y si
20
es capaz de calcular la diferencia entre esas metas y su desempeño efectivo, puede luego reducir tales diferencias. Así pues, para ellos las máquinas estaban “dotadas de propósitos”. En 1948 Wiener publica Cybernetics, allí presentaba su ciencia en estos términos: “Hemos resuelto denominar “cibernética” a todo el campo de la teoría del control y la comunicación, ya se trate de la máquina o del animal”
Alan Turing (1912-1954). Matemático británico.
En 1936, Turing propuso la idea de una máquina simple capaz de realizar, en principio, cualquier cálculo concebible. Las nociones en que se fundaba esta máquina “teórica” eran muy elementales. Todo lo que se necesitaba era una cinta de longitud infinita que pudiera pasar por la máquina, donde un dispositivo de escrutinio (scanner) “leería” lo que había sobre la cinta. Esta se dividía en cuadros idénticos, cada uno de los cuales contenía o bien un espacio en blanco, o alguna especie de marca. La máquina podía desarrollar cuatro clases de movimiento con la cinta: desplazarla a la derecha, desplazarla a la izquierda, borrar la marca o imprimirla. Con sólo estas operaciones sencillas, era capaz de ejecutar cualquier clase de programa o de plan que se expresara en un código binario (por ejemplo, un código de espacios en blanco y de marcas). En términos más generales, cualquier tarea, en la medida en que uno pudiera explicitar con claridad los pasos necesarios para llevarla a cabo, podría programarse y ejecutarse en la máquina de Turing. Turing sugirió que era posible programar de tal modo una máquina de esta índole, que nadie diferenciaría sus respuestas a un interlocutor, de las que brindaría un ser humano; esta idea quedó inmortalizada como “la prueba de la máquina de Turing”, que se utiliza para refutar a cualquiera que dude de que una computadora puede realmente pensar: se dice que una máquina programada ha pasado la prueba de Turing si un observador es incapaz de distinguir sus respuestas de las de un ser humano.
John Von Neumann
Se empeñó en crear un programa para instruir a la máquina de Turing de modo tal que se reprodujera a sí misma. Estaba aquí contenida la potente idea de un programa almacenado, así, la computadora podría controlarse mediante un programa almacenado en su memoria interna, de modo que no tuviera que ser laboriosamente reprogramada para cada nueva tarea. En 1958 publica La Computadora y el Cerebro. En dicha obra
21
von Neumann desarrolla temas como: el examen de diversos tipos de computadoras, la idea de programa, la operación de la memoria en las computadoras y la posibilidad de fabricar máquinas que se reprodujeran a sí mismas.
Warren McCulloch & Walter Pitts
En 1943 McCulloch y Pitts demostraron que las operaciones de una célula nerviosa y sus conexiones con otras (la llamada red neural) podían ser representadas mediante un modelo lógico. Los nervios eran equiparables a enunciados lógicos, y su propiedad de ser activados o no activados (“todo” o “nada”) era comparable a las operaciones del cálculo proposicional, donde un enunciado es o bien verdadero o bien falso. Según este modelo, la neurona era activada, y a su vez activaba a otra neurona, del mismo modo que un elemento o proposición de una secuencia lógica puede implicar alguna otra proposición. Así, ya se tratase de enunciados lógicos o de neuronas, la entidad A más la entidad B puede implicar la entidad C. Además, era verosímil establecer una analogía entre las neuronas y la lógica en términos de electricidad, vale decir, con referencia a señales que pueden pasar o no a través de un circuito. El resultado final de la demostración de McCulloch y Pitts se resume en esta frase: “Todo lo que pueda describirse de manera exhaustiva e inequívoca…es materializable mediante una red neural finita adecuada”. Merced a la demostración de McCulloch y Pitts se abrían ahora dos caminos para la máquina de Turing: uno que apuntaba hacia el sistema nervioso, compuesto de innumerables neuronas que se atuvieran al principio de “todo o nada”; y otro que apuntaba hacia una computadora capaz de materializar cualquier proceso que pudiera ser descrito de manera inequívoca. Algunos críticos de McCulloch y Pitts señalaban que, en lugar de tratar de construir máquinas que imitaran al cerebro en un plano fisiológico, debían postularse y examinarse analogías en un nivel muy superior –por ejemplo, entre el pensar que tiene lugar en la actividad humana de resolución de problemas y las estrategias encarnadas en un programa de computadora.
Claude Shannon Ingeniero electricista.
Se le acredita la creación de la teoría de la información. El observó que podían utilizarse los principios de la lógica (en lo que respecta a la verdad y a la falsedad de las proposiciones) para describir los dos estados (abierto y cerrado, o encendido y apagado) de las llaves relés electromecánicas. En su tesis de
22
maestría “Análisis simbólico de los circuitos de relé y conmutación” Shannon sostuvo que los circuitos eléctricos (del tipo de los que existen en una computadora) podían abarcar operaciones fundamentales de pensamiento. En la década siguiente, en colaboración con Warren Weaver, Shannon llegó a establecer la noción clave de la teoría de la información: que puede concebirse a esta última en forma totalmente independiente del contenido o la materia específica de que trate. Esto último dio pie para considerar a los procesos cognoscitivos con independencia de toda materialización particular de los mismos. La unidad básica de información, el bit (dígito binario), es la cantidad de información requerida para seleccionar un mensaje entre dos alternativas equiprobables.
Allen Newell & Herbert Simon
Ambos inventaron un programa (el teórico lógico. TL) para probar teoremas lógicos tomados de los Principia de Whitehead y Russell y, en 1956 hicieron la primera demostración completa de un teorema en una computadora (la “Johnniac”). Posteriormente, TL mostró 38 de los primeros 52 teoremas del capítulo dos de los Principia. Gardner cuenta que incluso una de las demostraciones de TL resultó más elegante que la ofrecida por Whitehead y Russell medio siglo antes. Newell y Simon afirmaban que sus demostraciones no se referían meramente a un pensamiento de tipo genérico sino a la clase de pensamiento que practican los seres humanos. Para ellos TL operaba mediante procedimientos que eran análogos a los utilizados por los seres humanos. Simon, en su libro “Las ciencias de lo artificial” sostiene que tanto la computadora como la mente humana debían concebirse como sistemas simbólicos, entidades materiales capaces de procesar, transformar, elaborar y manipular de diversas maneras, símbolos de diversas especies. En 1972 ambos publican su magna obra “La solución del problema humano” donde describen los programas del “resolvedor general de problemas” (RGP). El programa RGP era capaz de efectuar tareas de índole diversa como: demostrar teoremas, jugar ajedrez, o resolver acertijos como el de la Torre de Hanoi, el de misioneros y caníbales y los de la criptoaritmética (en los que las letras
23
representan números, y su suma o producto da otras palabras). RGP puede considerarse como el primer programa que simuló toda una gama de comportamientos simbólicos humanos.
John McCarthy
En 1957 es el fundador y primer director de los laboratorios de IA en el Instituto de Tecnología de Massachussets, y en la Universidad de Stanford en 1963. Según testimonios, él fue el que acuñó el término inteligencia artificial Uno de sus mayores logros fue la creación de LISP (list processing), el lenguaje de computadora más difundido en el campo de la inteligencia artificial. Creía que el camino para volver inteligentes a las máquinas pasaba por un enfoque formal riguroso, en el cual los actos que componen la inteligencia son reducidos a una serie de relaciones o de axiomas lógicos que pueden expresarse en forma precisa en términos matemáticos.
BIBLIOGRAFÍA - Gardner, Howard; (1985): La nueva ciencia de la mente. Historia de la revolución cognitiva. Barcelona, Paidós, 1987. - Chomsky, N. (1959): “A Review of B. F. Skinner´s Verbal Behavior”. In: Readings in Philosophy of Psychology. Block, Ned (editor). Cambridge, Mass., Harvard University Press.
24
TEMA 3. LOS PRESUPUESTOS BÁSICOS DE LA TEORÍA COMPU TACIONAL
DE LA MENTE.
María Elena Ramos Aceves.
La teoría computacional de la mente (TCM) es una concepción que emergió a
mediados del siglo XX, en gran medida, gracias al desarrollo de las computadoras.
Según esta concepción teórica, la computadora digital resulta un buen modelo de
la mente, toda vez que, concebir a la mente como una computadora ha abierto
una vía que parece promisoria para entender cuál es la naturaleza de los estados
mentales.
Podemos decir que la teoría computacional de la mente se compromete con tres
presupuestos básicos:
1) Una solución funcionalista al problema mente-cuerpo.
2) La existencia de un código de representación interno o lenguaje del
pensamiento.
3) La tesis de que los procesos mentales son computacionales.
Veamos cada uno por vez.
1. EL FUNCIONALISMO.
Se ha dicho que TCM se compromete con una solución funcionalista al problema
mente-cuerpo, por tanto, antes de entrar de lleno en la explicación de lo qué es el
funcionalismo, aclaremos cuál es el problema mente-cuerpo.
El problema mente cuerpo es básicamente el problema de explicar la naturaleza
de eso que llamamos “mente”: ¿qué es la mente? ¿existe realmente algo que
podamos llamar “la mente”? ¿se trata de una sustancia material o es inmaterial?
¿cuál es su lugar en el mundo material? ¿puede o no ser explicada en los mismos
términos en que se explican las propiedades de los objetos materiales?, etcétera.
Este tipo de preguntas han ocupado y preocupado a los seres humanos desde
hace bastantes siglos, pero es claro que estas no son preguntas fáciles. Por lo
25
tanto, no debe sorprendernos que las tentativas de solución, aportadas
fundamentalmente por filósofos, disten mucho de constituir soluciones
satisfactorias capaces de generar acuerdos amplios entre los estudiosos de la
mente.
En el presente apartado revisaremos las principales soluciones al problema mente
cuerpo. Esto nos dará el contexto apropiado para comprender en qué consiste la
solución funcionalista, que es la que principalmente nos interesa.
1.1 DUALISMO SUSTANCIAL.
Podría asegurarse que la solución al problema mente cuerpo más ampliamente
difundida y aceptada por el sentido común, y especialmente por las personas con
fuertes convicciones religiosas, es la que se conoce como dualismo sustancial o
cartesiano.
El dualismo cartesiano –que como su nombre nos indica, fue propuesto por el
filósofo René Descartes (siglo XVII)— sostiene que la mente es una sustancia
inmaterial, y por lo tanto, no espacial, que está temporalmente unida al cuerpo. El
cuerpo, en tanto que sustancia física o material tendrá que perecer; en cambio, la
mente, en tanto que sustancia inmaterial, tiene una existencia independiente del
cuerpo y podrá sobrevivir a la muerte de éste. La mente puede entonces vivir sin
el cuerpo, pero no al revés. La mente, que es la sustancia propiamente pensante,
es la que controla al cuerpo, lo cual implica que la primera interactúa con el
segundo de una manera causal y sistemática. Descartes pensaba que esta
interacción se daba a través de la glándula pineal en el cerebro. De cualquier
manera, Descartes no nos explica en realidad cómo es que algo no físico (la
sustancia pensante) puede ser causa de algo físico (el movimiento del cuerpo) y, a
la inversa, cómo las estimulaciones de nuestros órganos sensoriales (que son algo
físico) pueden causar pensamientos (que son no físicos).
En la actualidad el dualismo cartesiano sigue siendo una visión ampliamente
aceptada en el ámbito religioso, no obstante, en el ámbito de la psicología es una
postura que no se puede tomar seriamente. ¿Por qué? Hay varios argumentos:
26
A) Impotencia explicativa del dualismo.
El dualismo sustancial no va más allá de decirnos que la mente es una sustancia
inmaterial que no puede ser explicada en los mismos términos en los que se
explica la dinámica de la materia. ¿Qué nos queda entonces por hacer?
¿Debemos renunciar a cualquier tipo de explicación de lo mental? O si una
explicación de lo mental es posible ¿sobre la base de qué términos debe darse
dicha explicación? ¿tendría sentido, por ejemplo, preguntarnos sobre los
componentes no materiales que constituyen a la mente, o sobre la naturaleza de
los principios que regulan su comportamiento y su interacción con el cuerpo?
¿puede el dualismo sustancial dar cuenta de las capacidades cognoscitivas
humanas y explicar las patologías mentales? En realidad, el dualismo sustancial
nos deja con las manos vacías, pues de hecho no aporta explicación alguna.
B) Argumento de la dependencia nerviosa de todos los fenómenos mentales
conocidos.
Si en verdad nuestras capacidades cognoscitivas tales como la capacidad para el
lenguaje, para el razonamiento, la conciencia, nuestra vida emocional y afectiva,
etc. dependen de la existencia de una sustancia inmaterial independiente del
cuerpo, entonces tales capacidades tendrían que ser relativamente invulnerables a
los daños cerebrales, o a la acción de ciertos tipos de estimulación del cerebro
como es el caso cuando se estimula a éste con electrodos o mediante cierto tipo
de sustancias. Sin embargo, está más que mostrado que tales funciones
cognoscitivas sí son vulnerables al daño o a la manipulación cerebral. Parece ser
un hecho, hasta donde ahora conocemos, que todos los fenómenos mentales
dependen de funciones cerebrales.
C) Argumento de la historia evolutiva.
Si los seres humanos somos un producto de la evolución por selección natural,
entonces nuestra mente debe ser el producto de modificaciones graduales y
sutiles que fueron ocurriendo en criaturas infinitamente más simples (bacterias,
protozoarios, reptiles, etc.) que fueron evolucionando hasta llegar a nosotros. Este
27
proceso evolutivo es un proceso puramente físico que no implica otra cosa que la
combinación y recombinación de moléculas. Somos entonces, como dice Paul
Churchland, “criaturas hechas de materia y no hay necesidad de postular la
existencia de sustancias inmateriales para explicarnos a nosotros mismos”.
El dualista sustancial no parece tener una manera satisfactoria de responder a las
objeciones anteriores, las cuales parecen ser contundentes en contra del dualismo
sustancial. Debemos entonces buscar otras respuestas a nuestros
cuestionamientos sobre la naturaleza de lo mental.
1.2 CONDUCTISMO FILOSOFICO.
Cotidianamente nosotros explicamos la conducta de otras personas
atribuyéndoles creencias, intenciones, motivos, y muchos otros tipos de estados
mentales. Lo que el conductismo filosófico sostiene es que ésta es una manera de
hablar equívoca en el sentido de que nos lleva a postular la existencia de
entidades mentales “fantasmales”. Sin embargo no hay necesidad de postular
estas entidades, basta con que sustituyamos nuestro lenguaje mentalista por un
lenguaje objetivo que refiera exclusivamente a las disposiciones que una persona
tiene para comportarse en situaciones observables específicas.
Pensemos, por ejemplo, en la propiedad del azúcar de ser soluble en agua.
Cuando nosotros hablamos de la solubilidad del azúcar, nosotros no pretendemos
que exista dentro del azúcar “la solubilidad” como una entidad fantasmal; más
bien, lo que queremos decir es simplemente que el azúcar tiene la disposición a
disolverse cuando ésta es puesta en agua.
Para el conductismo filosófico, lo mismo debe ser cierto de nuestro lenguaje
mentalista, cuando nosotros hablamos sobre creencias, deseos, etc. no debemos
pretender que ellos son entidades internas realmente existentes, debemos de
reconocer que lo que nosotros queremos hacer realmente cuando nos valemos de
esa clase de términos, es simplemente decir que si una cierta persona se
encontrara en una determinada circunstancia, ella actuaría de cierta manera.
Veamos un ejemplo aportado por Churchland (1984):
28
Según el conductismo filosófico, cuando se dice que “Ana desea pasar sus
vacaciones en el Caribe”, en realidad se quiere decir algo como:
1. Si se le pregunta a Ana si ella desea pasar sus vacaciones en el Caribe,
ella diría que sí.
2. Si se le entregaran folletos turísticos sobre China y Jamaica, ella leería
primero los de Jamaica.
3. Si se le diera un boleto de avión para viajar el sábado a Jamaica, ella lo
aceptaría.
Así pues, para el conductismo filosófico “la mente” no es algo que cada uno de
nosotros posee, sino que se trata simplemente de un conjunto de disposiciones
para la conducta. Por lo tanto, el problema mente-cuerpo es en realidad un falso
problema.
Veamos ahora la objeciones al conductismo filosófico.
Pueden señalarse básicamente tres razones para rechazar la viabilidad de esta
postura:
1) El conductismo filosófico niega el aspecto cualitativo de nuestros estados
mentales internos, pero innegablemente ellos tienen un aspecto cualitativo, ellos
se sienten de una determinada manera. Estar triste, por ejemplo, no se reduce a
comportarse de manera pasiva y a que rueden lágrimas desde nuestros ojos.
Estar triste tiene una cualidad intrínseca, es un estado desagradable que
buscamos evitar. Una teoría apropiada de la mente no puede negar este hecho.
2) Retomando el ejemplo de Ana, es claro que las disposiciones 1, 2 y 3 arriba
señaladas no agotan todas las disposiciones para actuar que Ana puede tener
dado que ella desea pasar sus vacaciones en el Caribe. A 1, 2 y 3 podrían
agregarse un sin fin de disposiciones más. Por ejemplo, que si ella va a comprar
ropa, ella comprará ropa ligera y no ropa de invierno; o que si ella recibe una
invitación para viajar a Canadá, ella no la aceptará; o que si ella tiene viejos
amigos en Jamaica, ella buscará contactarlos nuevamente; y muchas
disposiciones más podrían ocurrírsenos. El punto es que esta lista podría ser
demasiado larga e incluso infinita. Y si en realidad no podemos contar con una
29
lista finita y claramente especificable de disposiciones que agoten el significado de
“Ana desea pasar sus vacaciones en el Caribe”, entonces no es cierto que lo
expresado en nuestro lenguaje mentalista pueda traducirse completamente a un
lenguaje disposicional.
3) Siguiendo con el mismo ejemplo de Ana, si consideramos las disposiciones 1, 2
y 3 nos damos cuenta de que ellas no son necesariamente verdaderas. Para que
cada una de ellas pueda ser verdadera necesita ser complementada con
requisitos adicionales. Por ejemplo,1 arriba, es verdadera si Ana no mantiene en
secreto sus fantasías sobre las vacaciones; 2 es verdadera si Ana no está
aburrida de los folletos sobre Jamaica; 3 es verdadera si Ana no cree que el vuelo
del sábado será secuestrado. Pero recomponer de esta manera las oraciones
disposicionales implica reintroducir una serie de elementos mentales, de modo
que ya no estaríamos definiendo lo mental exclusivamente en términos de
circunstancias y conductas observables.
1.3 MATERIALISMO.
El materialismo es la alternativa general al dualismo. La postura materialista es en
esencia una postura monista, esto es, una postura que rechaza la idea de la
existencia de dos sustancias: por un lado el cuerpo (cerebro) y por otro lado la
mente. El materialismo considera a la mente como el producto resultante de la
existencia de una única sustancia material que es el cerebro. En otras palabras, el
materialismo postula que los estados mentales no son otra cosa que estados
cerebrales.
Dentro de la concepción materialista es posible distinguir tres posiciones
principales: 1) la teoría de la identidad psicofísica, 2) el materialismo eliminativo y,
3) el funcionalismo.
1.3.1 LA TEORIA DE LA IDENTIDAD PSICOFÍSICA.
La tesis fundamental de la teoría de la identidad psicofísica es la siguiente:
a) Cada tipo de estado mental es idéntico a un tipo de estado cerebral.
30
A fin de entender cabalmente esta tesis debemos aclarar el significado del término
“tipo” en contraste con el significado de “caso particular” (en inglés token). Antes
de que hablemos de lo que se quiere decir cuando se habla, ya sea de un tipo de
estado mental o ya sea de un tipo de estado cerebral, permítaseme explicar el
término en un contexto diferente y más simple.
En la vida corriente, cuando nosotros hablamos de un tipo de objeto, estamos
haciendo alusión a una clase general, es decir, a un conjunto de objetos que por
sus características semejantes han sido agrupados juntos. Por ejemplo,
imaginemos que Gansito es el nombre de mi mascota e imaginemos que Gansito
es un perro dálmata. En este caso es sumamente claro que Gansito es un término
que refiere a un individuo particular, mientras que dálmata es un término que
refiere a un tipo de perro, es decir, a una clase de perros que dadas ciertas
características en común (y dadas también sus diferencias con respecto a otros
perros), han sido clasificados dentro de una misma categoría a la que llamamos
“dálmata”; y puesto que Gansito posee las características apropiadas puedo decir
que él pertenece al tipo de los dálmatas. Bueno, justamente de esta misma
manera es posible hablar de casos particulares de estados mentales y de tipos de
estados mentales (al igual que de casos particulares de estados cerebrales y de
tipos de estados cerebrales). Un caso particular de un estado mental es un estado
mental específico ocurriendo en la mente de una persona en particular y en un
tiempo en particular. Por ejemplo, si usted activa por un momento su creencia de
que “la Luna es el satélite natural de la Tierra” (espero que efectivamente esa sea
una creencia que el lector tiene) entonces usted se encontrará en este momento
particular en el estado mental de creer que la Luna es el satélite natural de la
Tierra, y este estado mental suyo será un caso particular de un estado mental. No
obstante, este estado mental particular puede ser considerado como un tipo de
estado mental, lo cual quiere decir que, dadas ciertas características1 se le puede
1 Específicamente, la característica relevante, en este caso, sería el contenido del estado mental y la actitud del sujeto hacia ese contenido. De este modo, se considera que dos estados mentales son del mismo tipo si instancian proposiciones con el mismo contenido (o significado) y si además, la actitud del sujeto (o de los sujetos) hacia la proposición en cuestión es idéntica. Por “actitud” hemos de entender cosas como las siguientes: creer que P (donde P es una proposición cualquiera), desear que P, esperar que P, temer que P, etc.
31
considerar como perteneciendo a una clase general de estados mentales. Si en un
salón de clase el maestro pregunta por el satélite natural de la Tierra,
posiblemente varios estudiantes evocarán la creencia de que la Luna es el satélite
natural de la Tierra. En una situación así podría decirse que, no obstante que cada
estudiante se encuentra en un estado mental que le es propio, todos esos
estudiantes se encuentran en el mismo tipo de estado mental; a saber, en el de
creer que la Luna es el satélite natural de la Tierra.
Una vez aclarada la distinción entre caso particular y tipo estamos en condiciones
de comprender qué es lo que la teoría de la identidad afirma. Lo que la teoría de la
identidad afirma es que una clase general de estados mentales (un tipo) es
idéntica a una clase general de estados cerebrales (un tipo). Por ejemplo, que
creer que llueve es idéntico a disparo de las fibras C en cierta región X del
cerebro.
Podríamos representarlo así:
b) S cree que llueve ↔ disparo de las fibras C en la región X del cerebro de S.
Esto significa que, para cualquier sujeto (S), si él cree que llueve entonces sus
fibras C en la región X de su cerebro están disparando, y a la inversa, si las fibras
C en la región X del cerebro de S están disparando, entonces él cree que llueve.
Analizando (b), es importante notar que la oración en el lado izquierdo del símbolo
bicondicional (↔) está expresada en el lenguaje de la psicología popular2,
mientras que la oración en el lado derecho del bicondicional está expresada en el
lenguaje de la neurofisiología. Lo que (b) establece entonces es lo que se conoce
como una reducción interteórica. Una reducción interteórica busca explicar un
hecho, ya explicado por una teoría, en los términos de una teoría nueva,
presuponiendo que:
2 La psicología popular es la psicología intuitiva o de sentido común que todos los seres humanos poseemos. Se trata de un conjunto de conocimientos y principios explicativos, legados por nuestro grupo social, de los cuales nos valemos para explicar las acciones de los demás en nuestras interacciones cotidianas. Las explicaciones propias de la psicología popular apelan fundamentalmente a la atribución de creencias, deseos, esperanzas, temores, emociones, etc. como las principales fuentes causales de nuestro comportamiento.
32
• La estructura de la nueva teoría refleja casi perfectamente la estructura de
la vieja teoría en el sentido de que para cada principio explicativo de la vieja
teoría, hay un principio explicativo correspondiente en la nueva teoría.
• Los principios explicativos correspondientes a ambas teorías se aplican
exactamente en los mismos casos.
• Los términos de la vieja teoría y los términos de la nueva se aplican a los
mismos objetos y/o propiedades.
• Tanto la teoría vieja como la nueva nos permiten dar cuenta de la misma
realidad, no obstante, la nueva teoría nos permitirá una descripción mucho
más clara, completa y precisa de esa realidad. Por lo tanto, la nueva teoría
será preferible a la vieja teoría.
En la ciencia las reducciones interteóricas son frecuentes y algunas de ellas nos
son más o menos familiares: por ejemplo: “la luz son ondas electromagnéticas”, “la
temperatura es promedio de energía cinética molecular”, “el sonido es un tren de
ondas de presión que se propagan por el aire” son casos de reducciones
interteóricas (ver Churchland, 1984. pp. 51-52).
Retomando nuestro punto, puede decirse que a lo que la teoría de la identidad
aspira es a una reducción interteórica, donde la “teoría” que se pretende reducir es
la psicología popular, mientras que la teoría reductora es la neurofisiología. De
este modo, siendo congruente con su tesis de que los estados mentales (tipo) son
estados cerebrales (tipo), el teórico de la identidad pretende descubrir –en la
medida en que los avances en la neurofisiología hagan esto posible-- cuáles son
las identidades entre tipos de estados mentales y tipos de estados cerebrales, lo
cual implicaría descubrir un sin fin de identidades análogas a la identidad
hipotética expresada en (b).
La teoría de la identidad psicofísica es sin duda una postura mucho más
plausible que el dualismo sustancial, en tanto que es una posición materialista (lo
cual significa que no presupone en ningún momento la existencia de sustancias
espirituales o fantasmales); en tanto que es congruente con la tesis de la
dependencia nerviosa de los fenómenos mentales; y en tanto que no desafía al
argumento evolutivo. No obstante, la teoría de la identidad enfrenta una dificultad
33
que nos llevará finalmente a rechazarla. Dicha dificultad se pone de manifiesto en
el siguiente argumento:
D) Argumento de la realizabilidad múltiple de los estados mentales.
Es un hecho que los estados mentales se realizan en estructuras físicas, pero un
mismo tipo de estado mental puede ser realizado en diferentes estructuras físicas;
por lo tanto, un tipo de estado mental no tiene necesariamente que ser idéntico a
un tipo de estado físico (o en su caso cerebral).
Expliquemos esto. La mayoría de nosotros acepta que los chimpancés, los gorilas,
los perros y otras criaturas no humanas tienen estados mentales, algunos de los
cuales pueden ser del mismo tipo que los nuestros. Por ejemplo, imagine el lector
que hay un plátano frente a usted y que, de igual modo, hay un plátano frente a un
chimpancé que se encuentra sentado a un lado suyo. El estímulo visual del
plátano puede causar en usted una creencia como “ahí hay un plátano” y no es
implausible pensar que lo mismo ocurrirá en el caso del chimpancé de modo que
él crea, al igual que usted, que “ahí hay un plátano”.3 En este caso podemos
afirmar que usted y el chimpancé se encuentran en el mismo tipo de estado
mental, no obstante que su cerebro y el del chimpancé son algo diferentes. Si en
realidad los chimpancés, los perros y los gatos pueden tener creencias, entonces
sus estados de creencia deben realizarse físicamente en estructuras diferentes de
las nuestras, toda vez que hay diferencias estructurales entre sus cerebros y los
nuestros. Si esto último es correcto, entonces puede ocurrir que dos criaturas se
encuentren en el mismo tipo de estado mental, pero en un diferente tipo de estado
cerebral. Contrario a lo que postula la teoría de la identidad.
Otra manera de plantear la objeción en contra de la teoría de la identidad versa
así: si nosotros aceptamos que cada tipo de estado mental es idéntico a un tipo de
estado cerebral, entonces debemos aceptar la inaceptable consecuencia de que
3 Por supuesto que nadie pretende que la creencia del chimpancé se encuentre codificada en un código lingüístico como el español. Como veremos más delante, cuando veamos la tesis de Fodor sobre el lenguaje del pensamiento, se trataría de un tipo de código diferente –y seguramente mucho más básico--.
34
sólo criaturas con estructuras físicas idénticas (o muy similares) a las de nuestro
cerebro, pueden tener estados mentales. Esto excluiría, como criaturas con
pensamiento, a muchos animales e incluso a criaturas extraterrestres en las que la
química de la vida podría no estar basada en el carbono, el hidrógeno y el
oxígeno, como lo está en la Tierra; sino, pongamos por caso, en el silicio.
A la luz de las consideraciones precedentes, podemos además darnos cuenta de
que la posibilidad de construir las identidades interteóricas a las que aspira el
teórico de la identidad es realmente poco probable. En realidad es muy poco
probable, dado lo ya dicho, que el teórico de la identidad pueda establecer
correspondencias uno a uno entre las descripciones mentalistas de la psicología
popular y las descripciones físicas y estructurales de una teoría universal que
abarcara a todos los sistemas físicos posibles (cerebros humanos y no humanos,
e incluso hay quienes consideran máquinas).
1.3.2 MATERIALISMO ELIMINATIVO.
En el caso de la teoría de la identidad vimos que ella intenta hacer una reducción
interteórica, de la psicología popular a la neurofisiología. El materialista eliminativo
rechaza rotundamente que esto sea posible. El teórico de la identidad nunca podrá
construir los enunciados de identidad a que aspira, simplemente porque los
principios y postulados de la psicología popular constituyen una falsa teoría. De
ahí que la psicología popular no pueda nunca ser reducida a ninguna otra teoría y
deba, más bien, ser eliminada. Por lo tanto, la únicas explicaciones de nuestra
vida mental que debemos esperar, serán aportadas cabalmente por la
neurofisiología.
No abundaré más en esta posición, baste decir que la eliminación de la psicología
popular me parece del todo implausible.4
1.3.3 FUNCIONALISMO.
El funcionalismo es una postura fuertemente comprometida con la tesis de la
realizabilidad múltiple de los estados mentales, consecuentemente rechaza la
4 Una interesante defensa de la psicología popular puede verse en Bruner, 1990.
35
identidad tipo-tipo entre estados mentales y estados cerebrales. En su lugar, el
funcionalista se compromete con una identidad entre estados mentales y estados
cerebrales mucho más modesta y por ende más plausible: la identidad caso
particular-caso particular, la cual podemos enunciar así:
c) Cada caso particular de un estado mental es idéntico a un caso particular
de un estado cerebral.
lo cual significa que, por ejemplo, creer que llueve puede ser idéntico a disparo de
las fibras C en la región X del cerebro de Pedro, pero no así en el cerebro de
María. Creer que llueve en el caso de María es idéntico a, digamos, disparo de las
fibras B en la región Z de su cerebro.
Además de (c) el funcionalismo sostiene la siguiente tesis central:
d) Cada tipo de estado mental es idéntico a un tipo de estado funcional.
Tenemos ahora una noción nueva que aclarar, esa de estado funcional. Un buen
punto de partida será nuevamente dilucidar la noción en un contexto más simple,
para después comprender cómo se aplica en el terreno de lo mental.
Pensemos, por ejemplo, en un órgano como el corazón de una persona sana, en
comparación con un corazón artificial y en comparación con el corazón de un
pollo. Aún cuando estos tres órganos son estructuras físicas diferentes (o no del
todo idénticas), nosotros los identificamos a todos ellos como corazones,
¿porqué? bueno, pues básicamente porque todos ellos cumplen con la misma
función dentro del organismo, que es bombear la sangre. Un ejemplo análogo se
obtiene si consideramos las diferencias físicas que puede haber entre un motor de
combustión interna, un motor eléctrico y un motor de vapor. No obstante, a pesar
de estas diferencias físicas, todos estos objetos son identificados como motores
en tanto que cumplen una misma función dentro del mecanismo al que sirven.
Otro ejemplo puede ser el siguiente: pensemos en tres tipos de ratoneras: 1)
aquella consistente en una pequeña jaula en la que el ratón entra motivado por la
presencia de un pedazo de comida suspendido en un mecanismo, que al ser
movido, cerrará la puerta; 2) aquella consistente en una placa con pegamento en
la que las patas del ratón quedan adheridas, y; 3) aquella en la que el ratón, al
tratar de tomar un pedazo de comida, activa un mecanismo que liberará una barra
36
que lo aplasta por la mitad. Otra vez, al igual que en los dos ejemplos previos,
tenemos tres estructuras físicas diferentes (diferentes incluso en su grado de
crueldad); sin embargo todas ellas son identificadas como un mismo tipo de
objeto. Todas ellas son ratoneras en la medida en que cumplen una misma
función que es la de atrapar ratones.
Lo que se intenta mostrar con estos ejemplos es que un objeto puede ser
individuado como el tipo de objeto que es, más que por su estructura física, por su
función; y que a un cierto nivel de descripción, nosotros podemos dar cuenta de la
función sin apelar a la estructura física.
Ahora, llevemos esto al terreno de lo mental para aclarar qué es lo que se quiere
decir cuando se habla de un estado mental como un tipo de “estado funcional”.
Básicamente, esto significa que un caso particular de un estado mental puede ser
individuado como siendo el tipo de estado mental que es, y no otro, sobre la base
de consideraciones meramente funcionales. Esto es, sobre la base de
consideraciones sobre el rol funcional -o rol causal-5 que ese estado mental
particular juega en el sistema total de creencias, deseos y demás, del individuo.
En términos más precisos, el funcionalismo propone que un caso particular de un
estado mental se define como un tipo de estado mental, dadas las relaciones
causales que este estado mantiene con:
1) otros estados mentales
2) entradas al sistema, es decir, estimulación externa actuando sobre el
organismo.
3) salidas del sistema, es decir, acciones del organismo.
Ilustremos el punto con un ejemplo:
Supongamos que una persona se encuentra en el estado mental de creer que va a
llover (ver esquema en la siguiente página). Lo que el funcionalismo nos dice es
que esta creencia particular cuenta como la creencia de que va a llover (y no como
ninguna otra) dadas las relaciones causales que ella mantiene, por un lado, con
5 El funcionalismo identifica las nociones de rol funcional y de rol causal, ya que la función de un estado mental específico en el sistema total de estados mentales de un organismo, consiste justamente en el cumplimiento de un cierto rol causal.
37
otros estados mentales y; por otro lado, con estímulos ambientales y con la
conducta.
De este modo, podemos concebir a los estados mentales como estados insertos
en una red causal sumamente compleja que toca en ciertos puntos con el mundo
externo. Dada esta red causal, la identidad de cada estado mental queda
determinada por sus relaciones causales con entradas, con salidas y con otros
estados mentales. Retomando el ejemplo del estado mental de creer que va a
llover (B). Éste es el estado mental de creer que va a llover –y no el estado mental
de creer que la Luna.es el satélite natural de la Tierra-- justamente porque éste
mantiene las relaciones causales apropiadas para contar como un estado mental
del primer tipo; mientras que no mantiene las relaciones causales apropiadas para
contar como un estado mental del segundo tipo.
Concluyendo, para el funcionalismo, un estado mental se individua sobre la base
de su función en el sistema, y no sobre la base de su realización física específica.
De aquí que, si los estados mentales de dos o más individuos cumplen con el
mismo rol causal o funcional, podamos decir que esos individuos se encuentran
en el mismo tipo de estado mental, independientemente de cómo estos estados se
implementen físicamente en sus cerebros.
Ejemplificación esquemática de una red causal que incluye entradas (inputs), salidas (outputs) y
otros estados mentales. Las relaciones causales se representan mediante “→”.
ESTIMULO
EXTERNO:
Cielo nublado
ORGANISMO
CREENCIA (A)
CREENCIA (B)
DESEO (C)
CREENCIA (D)
El cielo está →→→→ nublado
Va a llover →→→→
No deseo →→→→ mojarme
Debo llevar paraguas
RESPUESTA:
Buscar paraguas.
38
Esta es pues la concepción funcionalista sobre la naturaleza de los estados
mentales y la razón de nuestro interés en ella en el presente texto, estriba, como
ya se dijo, en el hecho de que ésta es la posición con la que se compromete la
teoría computacional de la mente. Dicha teoría concibe a los estados mentales
como estados funcionales del cerebro; estados funcionales que, en principio,
podrían realizarse en otras estructuras físicas, tales como seres extraterrestres o
incluso máquinas.
Llegados a este punto podemos ver cómo la concepción funcionalista –y por
supuesto la visión de TCM-- son congruentes con cómo las computadoras
digitales de hecho funcionan. En las computadoras es posible distinguir entre el
programa que la máquina está ejecutando y la realización física de ese programa,
es decir, entre el conjunto de instrucciones que guían las operaciones de la
computadora y el conjunto de acontecimientos físicos ocurriendo en la red de
circuitos que constituyen su estructura física. En el vocabulario de la computación
se utiliza el termino software para hacer alusión a lo primero, y el termino
hardware para hacer alusión a lo segundo. Pues bien, extrapolando esta
terminología (y la distinción que ella conlleva) al ámbito de lo mental, podemos
decir que, tanto el funcionalismo como TCM, consideran que la mente puede ser
entendida como el software del cerebro (el cual constituiría el hardware).
Por otra parte, la tesis de la realizabilidad múltiple es más que evidente en las
computadoras. No es ninguna novedad para nosotros que dos computadoras
físicamente diferentes pueden ejecutar un mismo programa; justamente de la
misma manera en que diferentes cerebros (por ejemplo, el cerebro humano y el de
un perro, o el de cualquier otra criatura capaz de tener estados mentales) podrían
instanciar un mismo tipo de estado mental.
1.4 LAS VIRTUDES DEL FUNCIONALISMO.
Concluiré este apartado señalando dos virtudes del funcionalismo6, mismas que
han hecho de él la postura más atractiva dentro de la psicología cognoscitiva.
6 Por supuesto que el funcionalismo también tiene sus limitaciones. El lector interesado en explorarlas puede leer Las Dificultades del Funcionalismo de Ned Block (1978).
39
En primer lugar, el funcionalismo tiene la virtud de ser una postura que defiende el
“realismo de lo mental”. El realismo de lo mental es una posición que acepta a lo
estados mentales, tales como creencias, deseos, esperanzas, temores, etc. como
fenómenos genuinamente existentes, al mismo tiempo que les concede
verdaderos poderes causales, de tal modo que ellos deben jugar un papel central
en la explicación de la conducta. Por lo tanto, el funcionalismo es una posición
consistente con la psicología popular, por lo cual se contrapone con posiciones
como el conductismo filosófico o el materialismo eliminativo, las cuales son en
esencia posiciones “antirrealistas” (el antirrealismo es justamente la negación del
realismo de lo mental).
En segundo lugar, el funcionalismo tiene la virtud de especificar un nivel de
explicación de lo mental que es el nivel de explicación que propiamente compete a
la psicología.
Consideremos los siguientes niveles de explicación de lo mental:
1. explicaciones propias de la psicología popular.
2. explicaciones funcionales (nivel de explicación propio de la psicología).
3. explicaciones de la neurofisiología.
Estos tres niveles de explicación se mueven en un sentido de mayor a menor
abstracción.
Por un lado, desde la perspectiva de la teoría de la identidad sólo hay dos niveles
de explicación, el primero y el tercero, por lo tanto no hay un nivel de estudio de lo
mental que sea propiamente psicológico. Por otro lado, desde la perspectiva del
materialismo eliminativo, el panorama es todavía peor, pues el único nivel de
explicación posible es el neurofisiológico. Por lo tanto, no hay nada que
propiamente le competa hacer a la psicología. En contraste con las dos posturas
anteriores, el funcionalismo presupone que, además de las explicaciones de la
psicología popular (que son propias del sentido común) y de las explicaciones de
la neurofisiología, existe un tercer nivel de análisis y explicación de lo mental que
es el nivel funcional, el cual es el nivel de explicación propiamente psicológico.
40
2. LA TESIS DEL LENGUAJE DEL PENSAMIENTO.
El segundo presupuesto básico de TCM es que existe un código de
representación mental que constituye el medio mismo en que se realiza el
pensamiento. Aunque esta idea ya estaba presupuesta en algunas teorías
psicológicas destacadas, nunca había sido claramente especificada. Debemos al
filósofo de la mente, Jerry Fodor, el haberla hecho explícita y el haber delineado
sus consecuencias.
En El lenguaje del pensamiento (1975), Fodor nos da razones a favor de la tesis
de la existencia de un código de representación interna al que él llama “el lenguaje
del pensamiento” (LP). Una de las estrategias de Fodor para apoyar su tesis es
mostrarnos, en primer lugar, que hay algunas teorías psicológicas (ampliamente
aceptadas y plausibles) en las que los procesos cognoscitivos se conciben como
procesos computacionales; pero puesto que la computación presupone un medio
en que realizarse, estas teorías están presuponiendo también que los estados
mentales son representacionales.
Una de las teorías a las que hace alusión Fodor es la teoría de la decisión. Según
tal teoría, la conducta de un sujeto enfrentado ante múltiples alternativas de
acción, se ajusta más o menos al siguiente esquema:
1) El agente reconoce que se encuentra en una determinada situación.
2) El agente reconoce un conjunto de opciones conductuales apropiadas a
esa situación.
3) El agente prevé las consecuencias probables que se seguirían de realizar
cada una de las opciones posibles.
4) El agente atribuye un orden de preferencia a las consecuencias.
5) La elección de conducta está determinada en función de las preferencias y
probabilidades asignadas.
Obviamente, para que un modelo como éste funcione es necesario presuponer
que el agente debe de alguna manera representar la situación en que se
encuentra, las opciones conductuales posibles dada esa situación, las
consecuencias de actuar conforme a esas opciones, una determinada jerarquía de
preferencias y por supuesto su propia conducta. Finalmente debe ser capaz de
41
realizar ciertas computaciones sobre estas representaciones que le permitan
decidir una vía de acción.
Además de la teoría de la decisión, Fodor cita otra teoría psicológica: la alusiva al
aprendizaje de conceptos. Aquí él destaca el hecho de que el proceso de aprender
un concepto se define esencialmente como un proceso de formación y de
confirmación de hipótesis; haciéndonos ver, nuevamente, la necesidad de postular
un sistema representacional en el que las posibles hipótesis puedan ser
codificadas y en el que se lleven a cabo las inducciones e inferencias pertinentes.
Lo que Fodor pretende con el análisis de estas teorías es mostrar que, como una
cuestión de hecho, la tesis de la existencia de LP ya está presupuesta por teorías
prestigiadas dentro de la psicología.
Por otro lado, Fodor busca dilucidar la naturaleza de este lenguaje del
pensamiento. Muchos han pensado que este lenguaje puede, muy bien, ser el
mismo que nuestro lenguaje natural, pero Fodor se opone enérgicamente a esta
idea y nos da dos razones principales para refutarla:
1) En primer lugar él considera que tanto los niños pre-verbales como los animales
son claramente capaces en muchas actividades cognoscitivas a pesar de no
poseer ningún lenguaje. Así, una prueba obvia de que el lenguaje natural no
puede ser el código interno, es que “hay organismos no verbales que piensan”.
(Fodor, 1975. p. 74).
2) Otro argumento que Fodor construye para refutar la afirmación de que nuestro
lenguaje natural es el medio del pensamiento es el siguiente:
El aprendizaje de la lengua nativa es una cuestión de formación y de confirmación
de hipótesis (recuérdese lo dicho arriba sobre el aprendizaje de conceptos). La
visión general de cómo se da dicho aprendizaje es la siguiente:
1) El niño se plantea hipótesis acerca del significado de las expresiones.
2) Tales hipótesis son sometidas a prueba, o dicho en otros términos, a
contrastación contra la evidencia.
3) El niño acepta o rechaza las hipótesis en cuestión en función de su
concordancia con la evidencia de que dispone.
42
4) En la concepción de Fodor, puede decirse que el niño ha aprendido el
significado de una expresión, pongamos por caso “x es un perro” una vez
que él ha aprendido cual es la regla o criterio de aplicación de esa
expresión. Esto es, una vez que el niño ha aprendido a identificar
claramente cuáles son los casos o situaciones en los que dicha expresión
se aplica con verdad.
Pero, argumenta Fodor, el niño no podría seguir ninguno de los pasos anteriores si
él no dispusiera de un lenguaje previo en el que se puedan representar las
expresiones que se están aprendiendo, las distintas hipótesis acerca de cuál es su
criterio de aplicación, además de la evidencia disponible y los resultados de las
contrastaciones. Esto significa que no se puede aprender un lenguaje a menos
que ya se posea uno previamente y, por hipótesis, ese lenguaje previo no puede
ser el lenguaje natural, pues éste es justamente el que se está aprendiendo.
(Fodor, 1975; p. 77).
El supuesto fodoriano de que aprender un lenguaje requiere necesariamente un
conocimiento previo de un lenguaje anterior, ha sido criticado básicamente porque
implica un retroceso al infinito. Si pensamos en este lenguaje anterior, podríamos
postular que aprenderlo ha requerido, a su vez, del conocimiento de otro lenguaje,
y así sucesivamente hasta el infinito. La respuesta de Fodor a esta objeción es
que saber el lenguaje del pensamiento no requiere de postular un lenguaje
anterior, sencillamente porque el lenguaje del pensamiento no se aprende, y no
necesita aprenderse porque es innato.
Fodor muestra cómo es esto posible partiendo de una analogía con las
computadoras:
“Las computdoras suelen utilizar al menos dos lenguajes diferentes: un lenguaje
de input-output en el que se comunican con su entorno y un lenguaje de máquina
en el que hablan consigo mismas (es decir, en el que realizan sus
computaciones). Los compiladores median entre los dos lenguajes, especificando
bicondicionales cuya parte de la izquierda es una fórmula en el código de input-
output y cuya parte de la derecha es una fórmula en el código de máquina [...]. Lo
que quiero dejar claro es que, aunque la máquina deba tener un compilador para
43
utilizar el lenguaje de input-output, no necesita tener también un compilador para
el lenguaje de la máquina. Lo que evita que se produzca un retroceso hasta el
infinito en el caso de los compiladores, es el hecho de que la máquina está
construida para utilizar el lenguaje de máquina. Más o menos, el lenguaje de la
máquina se distingue del lenguaje de input/output en que sus fórmulas
corresponden directamente a estados y operaciones de la máquina de carácter
físico y computacionalmente pertinente [....]”. (Fodor, 1975; p. 83-84)
Aclaremos un poco esta cita. En cuanto a la terminología sólo quiero señalar que
Fodor utiliza la expresión lenguaje de input/output para referirse al lenguaje de
programación. El lenguaje de programación es aquel en el que el usuario humano
da directamente instrucciones a la computadora (o el lenguaje en el que se
codifica el “programa” que se pretende que la computadora ejecute). Los
lenguajes de programación se han inventado para mediar entre los usuarios de la
computadora y la computadora misma. Esto es necesario porque, para el
programador humano, dar instrucciones a una computadora en el lenguaje de
máquina --que es el lenguaje que la computadora puede directamente “entender”--
, sería un tarea sumamente compleja. Es entonces el objetivo de simplificar el
trabajo de los programadores lo que lleva a la construcción de lenguajes de
programación. El problema ahora es que la computadora no “entiende” el lenguaje
de programación, pues éste no es el lenguaje (o código) en que ella realiza sus
computaciones. Por lo tanto, ha sido necesaria la construcción de traductores
(llamados, en la jerga computacional, compiladores) que le permitan a la
computadora traducir las instrucciones dadas en el lenguaje de programación a un
lenguaje que ella “entiende”, esto es, al lenguaje de máquina. La computadora
manipula entonces dos lenguajes: 1) un lenguaje de programación, que es el
lenguaje con el que se comunica con el mundo exterior y, 2) el lenguaje de
máquina, que es en el que realiza todas sus operaciones. Entre los dos lenguajes
media un compilador, que no es otra cosa que un traductor. La computadora
entonces puede “entender” el lenguaje de programación en la medida en que ésta
ya posee un lenguaje previo (el lenguaje de máquina), pero la computadora no
44
requiere de un lenguaje previo para entender el lenguaje de máquina ¿porqué?
Bueno, pues porque las fórmulas o “expresiones” en este lenguaje se
corresponden directamente con operaciones de carácter físico en la máquina y,
dada la forma en que ésta ha sido construida, ese es el lenguaje que ella puede
usar.
Esta es pues la forma en la que las computadoras trabajan y que Fodor toma
como modelo para dar cuenta de las relaciones existentes entre el lenguaje
natural y el lenguaje del pensamiento, asumiendo plenamente la analogía mente-
computadora.
Según Fodor, lo que las personas hacemos cuando, por ejemplo, entendemos una
frase de nuestro idioma es primero traducirla al lenguaje del pensamiento. No
obstante, el lenguaje del pensamiento, que es el lenguaje en el que computa el
cerebro no precisa de traducción, ya que, el cerebro –dada su estructura y los
procesos físicos que realiza-- está intrínsecamente preparado para utilizar este
lenguaje (justamente de la misma manera en que una computadora está
preparada para utilizar su lenguaje de máquina).
Una vez comprendida la frase, nosotros podemos realizar una serie de
operaciones para procesar la respuesta. Por supuesto, estas operaciones se
realizan en el lenguaje del pensamiento y cuando la respuesta es alcanzada, ésta
debe de ser traducida al lenguaje natural para posteriormente ser emitida.
Quiero concluir este apartado señalando dos puntos:
1) Para TCM la mejor manera de entender el pensamiento es concebirlo como un
lenguaje. De este modo, TCM da una solución sencilla y elegante al problema de
dilucidar la relación entre pensamiento y lenguaje. Dicha relación sería
básicamente análoga a la relación de intertraducción que se da entre dos
lenguajes naturales.
2) Para TCM, una tarea importante para la psicología cognoscitiva debe ser la
descripción del lenguaje del pensamiento, dando cuenta, entre otras cosas, de sus
propiedades sintácticas y semánticas.
45
3. LOS PROCESOS MENTALES SON PROCESOS COMPUTACIONA LES.
El tercer presupuesto básico de TCM es el de que los procesos mentales son
procesos computacionales. Decir que los procesos mentales7 son
computacionales es afirmar básicamente dos cosas:
1) Que los procesos mentales son descriptibles mediante una secuencia finita
y especificable de pasos (operaciones), mecánicos en su aplicación, los
cuales implican la transformación de representaciones mentales.
2) Que las operaciones realizadas sobre representaciones o símbolos
mentales son sensitivas únicamente a las propiedades sintácticas o
formales de estos símbolos, sin consideración de sus propiedades
semánticas. De cualquier manera estas operaciones son tales que respetan
y preservan el valor semántico de los símbolos mentales.
Expliquemos este segundo punto con algo más de amplitud.
La manera más simple de explicar qué es lo que se quiere decir cuando se afirma
que los procesos mentales son procesos meramente formales (o guiados
únicamente por la estructura sintáctica), es apelar a la clase de operaciones sobre
símbolos que se ejecutan en las demostraciones de validez lógica de un
argumento. Para hacer esto será necesario que conozcamos un poquito de
Lógica.
Primero que todo, establezcamos algunos conceptos fundamentales:
La lógica es una disciplina que estudia el razonamiento desde el punto de vista de
si éste es correcto o incorrecto. Un razonamiento es el proceso mediante el cual,
un individuo llega a afirmar una proposición partiendo de la base de otras
proposiciones ya aceptadas. Los razonamientos se expresan mediante
argumentos. Los siguientes son ejemplos de argumentos:
7 Los procesos mentales han de entenderse como “operaciones” realizadas sobre representaciones mentales. Estas operaciones se conciben como estando guiadas por “reglas”.
46
a) Juan es más alto que Pedro
Pedro es más alto que María .
Juan es más alto que María
b) Todos los gorilas son primates
Todos los primates son mamíferos .
Todos los gorilas son mamíferos
c) O bien Luis estudia o bien Luis trabaja
Luis no estudia .
Luis trabaja
d) O vamos al cine o vamos al teatro
No vamos al cine .
Vamos al teatro
Un argumento puede definirse como un conjunto de oraciones algunas de las
cuales son premisas, mientras que otra es la conclusión. Las premisas son las
oraciones que son afirmadas como razones en apoyo de la conclusión, mientras
que la conclusión es la oración que establece el punto que se quiere sustentar.
La tarea de la lógica es establecer criterios (reglas) para determinar cuando un
argumento es correcto y cuando es incorrecto, es decir, cuando la conclusión se
sigue efectivamente de las premisas y cuando no.
Para alcanzar mayor rigor en su tarea, la lógica se vale de un lenguaje simbólico.
Esto implica traducir las oraciones del español en que el argumento está
expresado a oraciones del lenguaje lógico de la siguiente manera: a cada oración
simple (aquella unidad mínima que declara un hecho en el mundo y que es
susceptible de ser verdadera o falsa) del español se le asignará una letra
estableciendo así un vocabulario. Por ejemplo, si queremos simbolizar el
argumento “c” arriba, podemos utilizar el siguiente vocabulario:
p: Luis estudia q: Luis trabaja
lo cual significa que siempre que encontremos la oración simple “Luis estudia” la
reemplazaremos por “p” y siempre que encontremos la oración simple “Luis
trabaja” la reemplazaremos por “q”.
Además de letras oracionales, el lenguaje lógico utiliza símbolos de “conectivos”,
los cuales sirven para conectar o vincular oraciones para construir oraciones más
complejas. Estos símbolos son los siguientes:
(conjunción)... “y” : ∧
(disyunción)... “o” : ∨
(negación)... “no”, “no es cierto que”, “no ocurre que” : ¬
47
(condicional)... “si... entonces” : →
(bicondicional)... “si y sólo si” : ↔
Valiéndonos, específicamente de los símbolos de disyunción y de negación,
podemos simbolizar el argumento “c” en el lenguaje lógico de la siguiente manera:
c*) p ∨ q
¬ p .
q
La lógica nos dice que este es un argumento correcto dado que la conclusión se
sigue efectivamente de las premisas o, dicho en otros términos, dado que las
premisas sustentan efectivamente la conclusión. Esta relación de sustentación
entre premisas y conclusión, en el caso de este argumento que estamos
considerando, está avalada por una regla lógica particular, la regla conocida como
“silogismo disyuntivo”. La regla de silogismo disyuntivo puede expresarse así:
siempre que tengamos una disyunción (oración compleja cuyo conectivo principal
es “o”) y la negación de uno de sus disyuntos (se llama disyunto a cada una de las
oraciones componentes en una disyunción), entonces, de esas oraciones se sigue
la afirmación del disyunto no negado.
La regla de silogismo disyuntivo es una regla que se aplica a cualesquiera
premisas que tengan la misma estructura o forma de las premisas del argumento
simbólico arriba presentado (c*), independientemente del vocabulario empleado,
es decir, independientemente de cuál sea la oración simbolizada por “p” y de cuál
sea la oración simbolizada por “q”. Por ejemplo, si ahora nosotros deseamos
simbolizar el argumento “d”, puesto que el vocabulario es arbitrario, puedo ahora
utilizar un vocabulario diferente:
p: vamos al cine q: vamos al teatro
lo cual significa que he decidido que “p” ahora representará a la oración “vamos al
cine”, mientras que “q” representará a la oración “vamos al teatro”. La
simbolización lógica del argumento “d” sería entonces la siguiente:
d*) p ∨ q
¬ p .
q
48
justamente la misma simbolización del argumento “c”. Esto se debe a que las
premisas en “c” y “d”, tienen la misma estructura lógica. Por lo tanto, la regla de
silogismo disyuntivo es igualmente aplicable en ambos casos. Vemos pues que,
para cualesquiera par de premisas, si ellas tienen la misma estructura o forma
lógica que la de las premisas en c* (y en d*), entonces ellas implicarán siempre
una misma conclusión, a saber: la afirmación del disyunto no negado. Esto
ocurrirá sin importar a qué refieran o cuál es el asunto del que hablan las
oraciones involucradas; no importará si “p” está por “Luis estudia” o por “vamos al
cine” o por “2 + 3 = 5”, de igual modo no será importante por cuál oración esté “q”.
La regla de silogismo disyuntivo (así como cualquier regla lógica) es un ejemplo
muy claro de lo que es una regla “formal”, lo cual quiere decir, una regla que se
aplica a oraciones simbólicas únicamente sobre la base de su forma lógica (o
estructura) y con total independencia de su contenido (o significado).
Una vez entendido esto, estamos en condiciones de aclarar cuál es exactamente
el sentido de la afirmación de que los procesos mentales son procesos formales o
sintácticos. Básicamente, esto significa que las reglas que guían las operaciones
sobre representaciones mentales (estas últimas, dada la tesis de que el
pensamiento es en sí mismo un lenguaje, pueden ser entendidas como una
especie de “oraciones mentales”) son sensibles únicamente a la forma o
estructura sintáctica de esas representaciones. Tales reglas se aplican a las
representaciones mentales en función de la forma de estas representaciones, con
total independencia de cuál sea su contenido semántico (su significado).
Para concluir señalaré que, en la medida en que TCM sostiene que los procesos
mentales son procesos computacionales, una tarea central para el proponente de
TCM es la identificación y la descripción de las reglas que presuntamente regulan
los procesos en nuestro sistema cognitivo.
49
BIBLIOGRAFÍA.
- Bruner, Jerome (1990): “La psicología popular como instrumento de la cultura”.
En Actos de Significado. Más allá de la Revolución Cognitiva.
Madrid, Alianza Editorial, 1991.
- Churchland, Paul (1984): Materia y Conciencia. Introducción Contemporánea a la
Filosofía de la Mente. España, Gedisa Editorial, 1992
- Fodor, J.A. (1975): El lenguaje del pensamiento.
Madrid, Alianza Editorial, 1984.
- Block, N. (1978): “Las dificultades del funcionalismo”. En Rabossi, Eduardo
(compilador), Filosofía de la Mente y Ciencia Cognitiva. España, Ediciones Paidós
Ibérica, 1995.
50
TEMA 4. CONEXIONISMO.
ANTECEDENTES.
Alrededor de 1960 se produjo una breve ráfaga de entusiasmo en torno de un
mecanismo inventado por Frank Rosenblatt en la Universidad de Cornell,
denominado PERCEPTRON, cuyo propósito era reconocer letras (y otras figuras-
patrón) situadas frente a sus “ojos”. El PERCEPTRON consistía en una grilla de
cuatrocientas células fotoeléctricas, correspondientes a las neuronas de la retina;
estas células estaban conectadas con elementos asociadores cuya función
consistía en reunir los impulsos eléctricos producidos por ellas; …..Otra serie de
componentes incluían unidades de respuesta: un asociador producía una señal
únicamente en el caso de que el estímulo superará cierto umbral. (Gardner, pp.
190-191)
En la década de los 60’s el enfoque de procesamiento simbólico y el enfoque
conexionista parecían igual de promisorios. Sin embargo, hacia 1970 la
investigación en el ámbito conexionista, que poseía su paradigma en el
Perceptrón, se redujo considerablemente. Una de la razones fundamentales fue la
publicación en 1968 del libro de Marvin Minsky y Seymour Papert “Perceptrones:
una introducción a la geometría computacional” en la que se atacaba la idea del
Perceptrón, sosteniendo que estas investigaciones carecían de valor científico.
Posteriormente, la aproximación conexionista al estudio de la cognición humana
fue gradualmente revitalizada. En la actualidad constituye en enfoque prometedor
y en pleno auge.
QUE ES EL CONEXIONISMO.
El conexionismo es un movimiento en ciencia cognitiva el cual espera explicar las
habilidades intelectuales humanas usando redes neuronales artificiales. Las redes
neuronales son modelos simplificados del cerebro compuestas de un gran número
de unidades (análogas a las neuronas) junto con pesos que miden las fuerzas de
las conexiones entre las unidades. Estos pesos modelan los efectos de las
sinapsis que conectan a una neurona con otra.
51
Descripción de una red neuronal.- una red neuronal consiste de un gran número
de unidades colocadas juntas en un patrón de conexiones. Las unidades de la red
son de tres clases: 1) unidades de input, las cuales reciben la información a ser
procesada; 2) unidades de output en las cuales se encuentran los resultados del
procesamiento y 3) unidades intermedias llamadas unidades ocultas. Si una red
neuronal fuera a modelar al sistema nervioso humano, las unidades de input
serían análogas a las neuronas sensoriales, las unidades de output a las neuronas
motoras, y las unidades ocultas a todas las otras neuronas.
Cada unidad de input tiene un valor de activación que representa a alguna
característica externa a la red. Una unidad de input envía su valor de activación a
cada una de las unidades ocultas a las cuales está conectada. Cada una de estas
unidades ocultas calcula su propio valor de activación dependiendo de los valores
de activación que ésta recibe de las unidades de input. Esta señal es entonces
transmitida a las unidades de output o a otra capa de unidades ocultas. Esas
unidades ocultas computan sus valores de activación en la misma forma y envían
la señal a sus vecinas. Eventualmente, la señal de las unidades de input se
propaga a través de la red para determinar los valores de activación de todas las
unidades de output.
El patrón de activación propio de una red está determinado por los pesos, o fuerza
de las conexiones entre unidades. Los pesos pueden ser ambos: positivos o
negativos. Un peso negativo representa la inhibición de la unidad receptora dada
la actividad de la unidad que envía.
Según el conexionismo, los logros intelectuales humanos deben depender
fundamentalmente de la distribución de pesos entre las unidades.
Aprendizaje y propagación hacia atrás en redes neuronales.- encontrar el conjunto
correcto de pesos para lograr una cierta tarea es la meta central para la
investigación conexionista. Afortunadamente, se han descubierto algoritmos de
aprendizaje que pueden calcular los pesos correctos para la realización de
múltiples tareas. Uno de estos métodos de entrenamiento es llamado
“propagación hacia atrás”. Para utilizar este método se requiere de un “conjunto de
52
entrenamiento” (training set) consistente de muchos ejemplos de inputs y sus
deseados outputs para una tarea dada. Si, por ejemplo, la tarea es distinguir
rostros masculinos de rostros femeninos, el conjunto de entrenamiento puede
contener retratos de caras junto con una indicación del sexo de la persona. Una
red que puede aprender esta tarea puede tener dos unidades de output (indicando
las categorías hombre, mujer) y muchas unidades de input, una dedicada a la
brillantez de cada píxel en el retrato. Los pesos de la red que va a ser entrenada
son inicialmente establecidos al azar, y entonces los miembros del conjunto de
entrenamiento son repetidamente expuestos a la red. Los valores para el input de
un miembro son colocados sobre las unidades input y el output de la red es
comparado con el output deseado para este miembro. Entonces todos los pesos
en la red son ajustados ligeramente en la dirección que más aproxima los valores
output de la red a los valores output deseados. Por ejemplo, cuando la cara de un
hombre es presentada a las unidades input los pesos son ajustados de modo tal
que el valor de la unidad output “hombre” se incrementa y el valor de la unidad
output “mujer” se decrementa. Después de muchas repeticiones de este proceso la
red puede aprender a producir el output deseado para cada input en el conjunto de
entrenamiento. Si el entrenamiento va bien, la red ha aprendido también a
generalizar y exhibir la conducta deseada aún para inputs y outputs que no
estaban en el conjunto de entrenamiento (otras fotografías diferentes).
El éxito en el entrenamiento de redes depende de ajustes sutiles del algoritmo y
del conjunto de entrenamiento. Típicamente, el entrenamiento implica cientos de
miles de rondas de ajuste de los pesos. Dadas las limitaciones de las
computadoras actualmente disponibles para la investigación conexionista,
entrenar una red para que ejecute una tarea interesante puede tomar días o aún
semanas. Algunas dificultades pueden resolverse cuando se utilizan circuitos en
paralelo específicamente diseñados para modelar redes neurales.
Lo que las redes neuronales pueden hacer.- mencionaremos tres experimentos
bien conocidos que han impulsado a los conexionistas a creer que las redes
neuronales son buenos modelos de la inteligencia humana:
53
1) NETtalk.- esta red, diseñada por Sejnowski y Rosenberg en 1987, puede
leer textos en inglés. El conjunto de entrenamiento para NETtalk fue una
gran base de datos consistente de textos en inglés acoplados con su
correspondiente salida fonética (la cual se daba mediante un sintetizador de
habla). Las grabaciones de la ejecución de NETtalk en diferentes estadios
del entrenamiento son muy interesantes. En un principio el output es ruido
aleatorio. Después, la red suena como si estuviera balbuceando, después
los sonidos empiezan a asemejarse a palabras del inglés. Finalmente
NETtalk hace un buen trabajo en pronunciar (leer) el texto que le es dado.
Además, esta habilidad se generalizó a textos que no fueron presentados
en el conjunto de entrenamiento.
2) Otro modelo conexionista importante es una red entrenada por Rumelhart y
McClelland (1986) para predecir el tiempo pasado de los verbos en inglés.
El conjunto de entrenamiento consistió de un conjunto de verbos en
presente y en pasado (tanto regulares como irregulares). La red aprendió el
tiempo pasado de 460 verbos regulares en 200 rondas de entrenamiento y
llego a generalizar correctamente a verbos que no estaban presentes en el
conjunto de entrenamiento. La red también mostró una buena apreciación
de “regularidades” encontradas entre los verbos irregulares (‘send’/’sent’,
‘build’/’built’, ‘blow’/’blew’). Durante el aprendizaje, en la medida en que la
red fue expuesta a más verbos regulares que irregulares, ésta mostró una
tendencia a sobre-regularizar, i.e. a combinar ambas formas: regulares e
irregulares (‘break’/’broked’, en lugar de ‘break’/’broke’) Esto fue corregido
con más entrenamiento. Es interesante notar que los niños exhiben la
misma tendencia a sobre-regularizar durante el aprendizaje del lenguaje.
Sin embargo, hay un acalorado debate acerca de si este modelo es de
hecho un buen modelo de cómo los humanos aprenden las terminaciones
de los verbos.
3) Elman (1991) entrenó a una red para predecir la próxima palabra en una
oración del inglés. El conjunto de entrenamiento consistió de un conjunto de
oraciones del inglés las cuales fueron formadas desde un vocabulario
54
simple de 23 palabras y un subconjunto de la gramática del inglés. Una de
las característica del modelo de Elman es el uso de conexiones recurrentes.
Los valores de las unidades ocultas son guardados en un conjunto de las
así llamadas “unidades de contexto” para ser enviadas hacia atrás al nivel
del input para la próxima ronda de procesamiento. Este “loop” hacia atrás,
desde las capas ocultas a las capas de entrada provee a la red con una
forma rudimentaria de memoria de la secuencia de palabras en la oración
input. Aunque la red no predecía exactamente cuál era la próxima palabra
en una oración (eso es una tarea imposible), la red tuvo éxito al activar,
dada la primera parte de una oración, las unidades output que son
continuaciones gramaticales de la oración, y al no activar las unidades
output que en ese punto no son continuaciones gramaticales de la oración.
Al final del entrenamiento, la red de Elman pudo generalizar a oraciones no
incluidas en el conjunto de entrenamiento.
CONTRASTES ENTRE CONEXIONISMO Y EL ENFOQUE SIMBÓLICO.
ENFOQUE SIMBOLICO. ENFOQUE CONEXIONISTA. La información se representa por cadenas de símbolos (lenguaje del pensamiento).
La información es almacenada de manera no simbólica, en los pesos o fuerza de las conexiones entre las unidades de la red neuronal.
El procesamiento de la información es secuencial y acorde con las instrucciones de un programa.
El procesamiento de la información es paralelo y está en función de la evolución dinámica y graduada de la actividad en una red neuronal.
Representación local.- los símbolos se almacenan en lugares específicos de la memoria. Las representaciones complejas tienen una estructura interna. De este modo, cuando una representación compleja es instanciada, los
Representación distribuida.- las representaciones están codificadas en los patrones de actividad de una red neuronal completa (no en la actividad de unidades individuales). Aquí no tiene caso hablar de representaciones simples y complejas (atómicas y moleculares). Las
55
constituyentes de esa representación también se instancian. Por ejemplo, si se representa el símbolo complejo ‘Juan ama a María’ también hay una representación de los símbolos simples: ‘Juan’, ‘ama’ y ‘María’.
representaciones distribuidas para expresiones complejas como ‘Juan ama a María’ no contienen, necesariamente, ninguna representación explícita de sus partes.
FUERZAS Y DEBILIDADES DE LOS MODELOS DE REDES NEURONALES.
Fuerzas.
1) Los modelos conexionistas parecen particularmente bien adaptados a lo
que se conoce en neurología. El cerebro es en verdad una red neuronal
formada de una cantidad masiva de unidades (neuronas) y sus conexiones
(sinapsis).
2) Degradación elegante de la función.- Ante el daño la respuesta de la red
sigue siendo apropiada aunque menos precisa. Esto es congruente con la
manera en que realmente se degradan las capacidades cognitivas en
personas que sufren daño cerebral. En contraste con lo anterior, el daño
estructural (ya sea a nivel de hardware o de software) en un sistema de
procesamiento simbólico resulta típicamente en una falla catastrófica.
3) Las redes neuronales están bien adaptadas para la resolución de
problemas que demandan un procesamiento complejo en paralelo.
(ejemplo: escribir en máquina o computadora)
4) Las redes neuronales están bien adaptadas para modelar capacidades que
no pueden ser fácilmente explicitadas mediante reglas precisas o mediante
principios libres de excepción.
Debilidades.
1) La gran cantidad de repeticiones que son necesarias para el entrenamiento
de una red parece poco realista.
2) Los modelos de redes neuronales no son particularmente buenos para la
clase de procesamiento basado en reglas, que es el que se supone,
56
subyace a la capacidad para el lenguaje, razonamiento y formas superiores
de pensamiento.
3) En tanto que el conocimiento en una red neuronal está meramente
implícito en un conjunto de pesos específicos de la tarea, no es posible
para la red comunicar ese conocimiento directamente a ninguna otra red
implicada en la solución de un problema relacionado. El conocimiento de
la red no es transferible , de modo que no es posible explotar los
resultados de un aprendizaje exitoso a fin de obviar la necesidad de un
reentrenamiento de la nueva red en ese aspecto de la tarea. Ilustremos
esto con un ejemplo: En el transcurso de los años un banco ha acumulado
una vasta base de datos acerca de quienes son buenos pagadores y
quienes no, y acerca de con quienes vale la pena arriesgarse
concediéndoles un préstamo. Sin embargo, estos datos están
desorganizados y no se ven emerger patrones claros. Los datos son
entonces usados para entrenar a una red conexionista la cual aprende a
evaluar, mucho mejor que cualquier operador del banco, cuáles son los
clientes a los que es conveniente conceder un préstamo (aquéllos con los
que vale la pena arriesgarse) y cuáles son los clientes a los que no
conviene conceder un préstamo (aquéllos con los que no deben
arriesgarse). Intentemos analizar ahora lo que la red ha aprendido. Tras
una cierta clase de análisis estadístico es posible descubrir que la red ha
aprendido a considerar el domicilio como un criterio útil y ha particionado su
dominio en “buenas direcciones” y “no tan buenas direcciones”. La red
puede llegar también a considerar criterios como estabilidad en el empleo y
nivel salarial. Imagínese ahora que esta red es una pequeña parte de un
sistema mucho mayor el cual si es capaz de comunicación real. Llámese a
este sistema “el gerente de banco”. Un banco australiano solicita a este
“gerente de banco” información sobre cuáles son las condiciones favorables
para conceder un préstamo. En otros términos, el banco australiano desea
conocer la teoría subyacente en el sistema sobre préstamos bancarios.
Como están las cosas, “el gerente de banco” no tiene nada que decir, él no
57
posee una teoría útil que pueda transmitir. Considérese ahora la tarea
relacionada de evaluar la conveniencia de los préstamos en una economía
en depresión. Aquí la estabilidad del empleo puede ser un criterio mucho
más importante que el nivel salarial (lo opuesto de lo que ocurre en una
economía en crecimiento). En el caso de las redes neuronales, el
conocimiento ganado usando los datos de una economía en apogeo no
acelerará el aprendizaje, ni reducirá el tiempo de entrenamiento, de una red
que debe funcionar en una economía en depresión. (Clark, A. & Karmiloff-
Smith, A. 1993. Ver ejemplo en pp. 490-491)
En resumen, puede decirse que el conocimiento que una red posee, una
vez que ha sido entrenada, no puede ser transferido o comunicado a otras
redes para que puedan llevar a cabo tareas relacionadas. De ahí que haya
problemas para la integración de las redes con otros subsistemas para
formar sistemas más complejos.
4) Del carácter implícito del conocimiento de una red neuronal se derivan otras
de sus limitaciones:
a) Las redes neuronales no son capaces de depurar o eliminar sus errores
sin apelar a un re-entrenamiento a gran escala. Si en el transcurso del
entrenamiento una red va por una vía sumamente equivocada no hay nada
que se pueda hacer, excepto re-entrenarla con el conjunto de ejemplos de
entrenamiento. No obstante, la manera en que los humanos eliminamos el
error está mucho más focalizada. Veamos un ejemplo, un jugador de golf
cuyo nivel de juego se deteriora repentinamente puede aislar la causa del
problema como un componente en el giro de su muñeca. Esto le habilita
para enfocar su acción en la corrección de ese error específico en lugar de
aprender a jugar golf nuevamente desde el principio. Tal focalización no es
posible para una red conexionista (de primer orden) en la cual todo el
conocimiento está inextricablemente entreverado de modo que no es
posible desempaquetar las partes de dicho conocimiento a fin de hacer
modificaciones puntuales mientras el conocimiento restante permanece
intacto.
58
b) Dado lo anterior, una red no es capaz de contender con cambios
sistemáticos en la estructura de las reglas que gobiernan un dominio.
Los filósofos han llegado a interesarse en el conexionismo porque este provee una
alternativa a la teoría clásica de la mente: la visión ampliamente sostenida de que
la mente es algo análogo a una computadora digital que procesa un lenguaje
simbólico.
Exactamente cómo y a qué extensión el paradigma conexionista constituye un
desafío al enfoque clásico han sido cuestiones cálidamente debatidas en años
recientes.
Muchos conexionistas no visualizan su trabajo como un desafío al clasicismo y
algunos aceptan abiertamente la postura clásica. Los llamados conexionistas
implementacionales buscan una adecuación de los dos paradigmas. Ellos
sostienen que las redes del cerebro implementan un procesador simbólico. En
verdad, la mente es una red neuronal; pero ésta es también un procesador
simbólico a un nivel superior y más abstracto de descripción. Por lo tanto, el papel
de la investigación conexionista de acuerdo a los implementacionalistas es
descubrir cómo la maquinaria requerida para el procesamiento simbólico puede
ser forjada desde los materiales de una red neural, de modo tal que el
procesamiento clásico pueda ser reducido a la descripción de la red neural.
Sin embargo, muchos conexionistas rechazan el punto de vista implementacional.
Los conexionistas radicales se quejan de que la teoría clásica hace un mal trabajo
para explicar la degradación “graciosa” (graceful) de la función, la representación
holística de los datos, la generalización espontánea, la apreciación del contexto, y
muchas otras características de la inteligencia humana las cuales sí son
capturadas por sus modelos.
59
BIBLIOGRAFÍA.
- Clark, Andy; Karmiloff-Smith, Annette (1993): “The Cognizers Innards: A
Psychological and Philosophical Perspective on the Development of Thought”.
Mind and Language , Vol. 8, No. 4
- Garson, James; “Connectionism”; The Stanford Encyclopedia of Philosophy
(Spring 2007 Edition), Edward N. Zalta (ed.),
URL= http://plato.stanford.edu/archives/spr2007/entries/connectionism/
60
TEMA 5. LIMITACIONES DE LA VISIÓN COMPUTACIONAL DE LA MENTE.
Experimento Mental.- La habitación china. (ver texto pp. 37-38)
Argumento de Searle:
1) La sintaxis no es suficiente para la semántica.
2) Los programas de computadora están definidos enteramente por su
estructura formal o sintáctica.
3) Las mentes tienen contenidos semánticos.
4) Por lo tanto, ningún programa de computadora es suficiente por sí mismo
para dar a un sistema una mente.
La respuesta de Jaegwon Kim.
“La conclusión que se desprende del experimento mental de la habitación china es
que la mentalidad es mucho más que manipulación sintáctica de símbolos de
acuerdo a reglas, y que no hay forma de obtener la semántica –o lo que los
símbolos significan o representan— desde su sintaxis. Esto quiere decir que el
entendimiento y otros estados y actividades mentales inteligentes no pueden
surgir de meros procesos sintácticos.
Los procesos mentales están guiados por contenidos representacionales o
significados. La creencia de que llueve causa en mí el deseo de llevar un
paraguas y esta relación causal se sostiene, en parte, porque la creencia y el
deseo tienen los contenidos particulares que ellos tienen y no otros; así mi
creencia de que llueve no causa el deseo de usar mi mejor traje para ir a trabajar,
y la creencia de que el día está soleado no causa mi deseo de llevar paraguas.
Por lo tanto, la mente es una máquina semántica, la computadora, en contraste,
es sólo una máquina sintáctica.
Así pues, el experimento de la habitación china destaca un problema legítimo
relativo al significado y a la causación mental. Sin embargo, este es un problema
general que surge para cualquier concepción materialista de la mente,
independientemente de si ésta se compromete con una visión computacional.
Considere la posición que Searle favorece: la mentalidad sólo puede surgir en
sistemas biológicos complejos como el cerebro humano. No obstante, parece ser
61
que los procesos causales neurobiológicos ocurrirán sin importar lo que los
estados neuronales involucrados representen acerca del mundo o si es que ellos
representan algo en lo absoluto. Los procesos neuronales no parecen más
sensitivos al significado y al contenido representacional de lo que lo son los
procesos computacionales. Las condiciones físico-biológicas locales del cerebro,
no los estados de cosas distales representadas por ellos, son las que guían los
procesos neuronales. Si esto es así ¿no está Searle en el mismo barco que Turing
y otros computacionalistas?
Aquí se hace necesario responder a una cuestión previa muy importante: ¿cómo
es que los estados neuronales pueden representar algo? ¿cómo es que estos
estados llegan a tener el contenido particular que ellos tienen?”
BIBLIOGRAFIA.
- Kim, Jaegwon (2006): Philosophy of Mind.
U.S.A., Westview Press.
- Searle, John; (1984): “Pueden los computadores pensar? En: Mentes, Cerebros
y Ciencia. Madrid, Ediciones Cátedra, 2001
62
TEMA 6. PROCESOS MENTALES.
El presente escrito tiene dos objetivos fundamentales: el primero es explicar el
concepto mismo de “proceso mental” en la perspectiva de la teoría computacional
de la mente (TCM). El segundo es dar un panorama muy general de los procesos
cognoscitivos que TCM ha buscado explicar.
Vayamos pues al primer punto. ¿Qué es un proceso mental? Iniciemos con esta
definición como punto de partida: “un proceso se entiende como una operación
específica realizada sobre representaciones mentales, la cual nos lleva a producir
nuevas representaciones”. Esta definición establece dos cosas, primero la clase
de objetos sobre los cuales actúan los procesos; estos objetos no son otra cosa
que representaciones mentales, las cuales pueden ser entendidas, dada la tesis
del lenguaje del pensamiento, como “oraciones mentales” con propiedades
sintácticas y semánticas. Los objetos del pensamiento son pues “representaciones
mentales”. La definición anterior también establece que un proceso no es otra
cosa que una operación específica, es decir una transformación de estas
representaciones de acuerdo con alguna regla o principio que puede ser
claramente establecido. De este modo, el pensamiento es el producto de una
cadena de transformaciones y manipulaciones de símbolos de acuerdo a ciertas
reglas.
Otra característica importante que hay que considerar respecto a los procesos
mentales, según los concibe la teoría computacional, es que éstos operan de
manera conjunta para llevar a cabo procesos más complejos. De este modo, las
capacidades cognoscitivas complejas pueden ser explicadas en términos de
capacidades a las que subyacen un conjunto de procesos mucho más simples, los
cuales a su vez, pueden ser explicados en términos de subprocesos más simples,
y así hasta llegar al nivel de los procesos “primitivos”, que son aquellos que ya no
pueden descomponerse en otros procesos. Según el enfoque computacional, la
explicación en el nivel de los procesos primitivos correspondería ya a
explicaciones en el nivel neurofisiológico (o de hardware) y no serían de
competencia del psicólogo cognitivo. El psicólogo cognitivo debe ocuparse de
63
explicar los procesos en un nivel superior de abstracción, que es el
correspondiente al nivel de explicación “funcional” (o de software).
Para completar nuestra descripción de lo que son los procesos mentales, en la
perspectiva de TCM, resta mencionar un último punto: para TCM los procesos
mentales son procesos computacionales ¿qué quiere esto decir? Básicamente,
esto significa que las operaciones realizadas sobre representaciones o símbolos
mentales son sensitivas únicamente a las propiedades sintácticas o formales de
estos símbolos, sin consideración de sus propiedades semánticas.
Podemos concluir nuestra explicación de lo que son los procesos mentales,
retomando todas las consideraciones anteriores para ampliar nuestra primera
definición de “proceso mental” :
Un proceso se entiende como una operación específica realizada sobre
representaciones mentales, la cual nos lleva a producir nuevas representaciones.
Dicha operación se coordina con otras operaciones para dar lugar a operaciones
más complejas, las cuales se conciben como estando guiadas por reglas de
carácter estrictamente formal.
Vayamos ahora a nuestro segundo objetivo ¿Cuáles son los procesos
mentales que han buscado entender los psicólogos dentro de esta perspectiva
teórica? A continuación se expone, de una manera muy general, cuál es el
dominio de capacidades cognoscitivas (y procesos subyacentes) que los teóricos
de TCM han investigado y tratado de dilucidar.
PERCEPCIÓN.
TCM ha tratado de explicar nuestras capacidades perceptuales. El objetivo es dar
cuenta de cómo los seres humanos registramos e interpretamos la información
proveniente de nuestros sentidos.
64
ATENCIÓN.
Continuamente nuestros sentidos están siendo bombardeados por un gran
número de estímulos. No obstante, sólo una parte de ellos son registrados por
nosotros; aquellos que en el momento resultan relevantes. TCM se ha preocupado
por indagar cuáles son los mecanismos que nos permiten seleccionar de manera
automática y tan eficiente la información importante, al mismo tiempo que
desechamos la que no lo es.
REPRESENTACION MENTAL.
Las teorías de la representación mental se abocan a descifrar cuál es la
naturaleza del código, o códigos, en el que nuestro conocimiento del mundo se
almacena en nuestras mentes. Se han estudiado fundamentalmente dos códigos:
el código proposicional (que es un formato cuasi lingüístico) y el código de
imágenes (que es un formato analógico).
MEMORIA.
Si el conocimiento del mundo está almacenado en nuestras mentes, es importante
entender cuáles son los mecanismos que hacen posible el registro de nueva
información (codificación), así como cuáles son los mecanismos que nos permiten
recuperar la información necesaria y traerla a la consciencia cuando la
necesitamos.
CATEGORIZACIÓN.
Nuestro entorno está poblado de un sin fin de objetos particulares y fenómenos
únicos. Si nosotros tuviéramos que enfrentarnos a este mundo infinito de
particularidades nos sería muy difícil, si no es que imposible el dominio de nuestro
entorno. Afortunadamente estos objetos en nuestro entorno poseen propiedades
en común que nos permiten organizarlos juntos o agruparlos, de modo tal que el
número de entidades que pueblan el mundo se vuelva manejable. Generamos de
este modo conceptos, los cuales nos permiten organizar el mundo que nos rodea.
65
TCM busca descifrar cuáles son los procesos implicados en la formación y
adquisición de conceptos.
RAZONAMIENTO Y SOLUCION DE PROBLEMAS.
TCM ha buscado también descifrar cuáles son las reglas que subyacen a nuestra
capacidad para el razonamiento, esto es, a nuestra capacidad para establecer que
dado que ciertas oraciones son verdaderas, otras oraciones necesariamente (o
muy probablemente) deben serlo también, determinando así cuáles son las
implicaciones de lo que ya sabemos. La capacidad para el razonamiento está
estrechamente vinculada a la capacidad humana para la solución de problemas, la
cual consiste en la habilidad para encontrar los medios adecuados que nos
permitan alcanzar un objetivo deseado cuando ciertos obstáculos se interponen.
TCM también busca dilucidar cómo los seres humanos podemos hacer esto.
TOMA DE DECISIONES.
Tomar decisiones implica hacer varias cosas al mismo tiempo, tales como: 1)
identificar cuál es la situación específica en que nos encontramos; 2) dada esa
situación específica, determinar cuáles son las opciones conductuales (o vías de
acción) posibles; 3) determinar cuáles son las consecuencias probables que se
seguirían de la realización de cada vía de acción posible; 4) determinar cuál es el
valor que nosotros asignamos a cada una de las consecuencias de realizar una u
otra acción, y finalmente 5) sobre la base de los datos anteriores, “calcular” cuál es
la vía de acción más conveniente dados nuestros deseos. TCM se ha ocupado de
investigar cómo los seres humanos realizamos cada uno de estos pasos. Del
mismo modo ha tratado de indagar hasta qué punto la forma en que los seres
humanos tomamos decisiones se apega a ciertos modelos de elección racional.
LENGUAJE.
Por último, TCM ha buscado explicar la capacidad humana para producir y
comprender el número infinito de oraciones, tanto habladas como escritas, que
66
pueden ser generadas en una lengua. TCM también se interesa en explicar cuáles
son las relaciones entre pensamiento y lenguaje.
Estas son pues las capacidades cognoscitivas que constituyen el dominio de
investigación y explicación propios de la teoría computacional de la mente, la cual
pretende dar cuenta de estas capacidades en términos de una serie de procesos
mentales subyacentes.