tablas de contingencia para la enseรanza del concepto de ...ย ยท 2.7 asociaciรณn en tablas de...
TRANSCRIPT
TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL
CONCEPTO DE ASOCIACIรN ENTRE VARIABLES
ALEATORIAS CUALITATIVAS
Juan Pablo Caro Quintero
Universidad Nacional de Colombia
Facultad de Ciencias
Maestrรญa en Enseรฑanza de las Ciencias Exactas y Naturales
Bogotรก, Colombia
2017
TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL
CONCEPTO DE ASOCIACIรN ENTRE VARIABLES
ALEATORIAS CUALITATIVAS
Juan Pablo Caro Quintero
Tesis presentada como requisito parcial para optar al tรญtulo de:
Magister en Enseรฑanza de la Ciencias Exactas y Naturales
Director:
Mg. Pedro Nel Pacheco Durรกn
Docente Departamento de Estadรญstica
Lรญnea de Investigaciรณn: Educaciรณn Estadรญstica
Universidad Nacional de Colombia
Facultad de Ciencias
Maestrรญa en Enseรฑanza de las Ciencias Exactas y Naturales
Bogotรก, Colombia
2017
Dedicatoria
A mis padres: รngel Custodio Caro y
Marรญa Ignacia Quintero, por su esfuerzo,
dedicaciรณn, apoyo incondicional y amor
durante toda mi vida.
A mi hermana Elizabeth por estar siempre
cuando emprendo nuevos retos, o la
construcciรณn de nuevos sueรฑos.
A mi tรญa Marรญa de Jesรบs por todo el apoyo
cuando mi familia mรกs lo necesitaba.
Agradecimientos
A Dios por permitirme cada dรญa nuevas oportunidades de crecimiento personal y
profesional.
Al profesor Pedro Nel por su apoyo incondicional durante el proceso de desarrollo
de este trabajo de grado.
RESUMEN V
Resumen
Este trabajo presenta una propuesta didรกctica que pretende facilitar a los
estudiantes de grado once del Colegio Saludcoop Sur I.E.D, la construcciรณn del
concepto de asociaciรณn estadรญstica entre variables cualitativas en tablas de
contingencias 2X2; y por otra parte ayudarles en el anรกlisis de las diferentes
probabilidades que pueden ser calculadas a partir de frecuencias absolutas, y
marginales por filas o por columnas. La propuesta incluye el diseรฑo de objetos
virtuales de aprendizaje y un modelo geomรฉtrico que permite calcular las
probabilidades esperadas de eventos estadรญsticamente independientes.
Palabras clave: Tablas de contingencia 2X2, asociaciรณn de variables
cualitativas, probabilidades, condiciones de independencia.
VI ABSTRACT
Abstract
This work presents a didactic proposal that aims to facilitate to then students of the
eleventh grade at Colegio Saludcoop Sur I.E.D, the construction of the concept of
statistical association between qualitative variables in tables of contingencies 2X2;
on the other hand to help them in the analysis of the different probabilities that can
be calculated from absolute frequencies and marginal, frequencies by rows or by
columns. The proposal includes the design of virtual objects of learning and a
geometric model that allows to calculate the expected probabilities of events
statistically independent.
Key words: Contingency tables 2X2, association of qualitative variables,
probabilities, conditions of independence.
CONTENIDO VII
Contenido
Resumen .............................................................................................................................. V
Introducciรณn ........................................................................................................................ 1
1. Marco Conceptual ..................................................................................................... 4
1.1 Justificaciรณn ................................................................................................................. 4
1.2 Situaciรณn Problema ..................................................................................................... 4
1.3 Objetivo General.......................................................................................................... 5
1.4 Objetivos Especรญficos .................................................................................................. 5
2. Marco Teรณrico ............................................................................................................ 6
2.1 Probabilidades ............................................................................................................. 6
2.1.1 Definiciรณn clรกsica ......................................................................................................... 6
2.1.2 Definiciรณn de la probabilidad como frecuencia relativa o probabilidad empรญrica ....... 6
2.1.3 Interpretaciรณn subjetiva de la probabilidad ................................................................. 6
2.1.4 Elementos bรกsicos de la teorรญa de conjuntos utilizados para el estudio de la
probabilidad........................................................................................................................... 7
2.1.5 Probabilidad conjunta, marginal y condicional ........................................................... 8
2.1.5.1 Probabilidad conjunta ........................................................................................... 8
2.1.5.2 Probabilidad marginal........................................................................................... 9
2.1.5.3 Probabilidad condicional ...................................................................................... 9
2.2 Eventos estadรญsticamente independientes ................................................................. 9
2.3 Tablas de Contingencia............................................................................................. 10
2.3.1 Tablas de Contingencia 2x2 ...................................................................................... 12
VIII CONTENIDO
2.4 Independencia y asociaciรณn entre las variables de una Tabla de Contingencias ... 13
2.5 Estudios iniciales sobre coeficientes de asociaciรณn de variables categรณricas en
tablas de contingencia 2X2................................................................................................. 16
2.6 Signo de la Asociaciรณn, Riesgo Relativo y Riesgo de Productos Cruzados en
Tablas de Contingencia 2X2 .............................................................................................. 18
2.6.1 Signo de la Asociaciรณn. ............................................................................................. 18
2.6.2 Riesgo Relativo ......................................................................................................... 19
2.6.3 Riesgo de Productos Cruzados ................................................................................ 20
2.7 Asociaciรณn en Tablas de Contingencia 2X2, y el coeficiente ๐ฝ (Phi) de Pearson .. 21
2.8 Representaciones Semiรณticas................................................................................... 22
2.9 Situaciones Didรกcticas .............................................................................................. 24
3. Propuesta Didรกctica ................................................................................................ 26
3.1 Prueba diagnรณstica .................................................................................................... 26
3.2 Problema Introductorio a Tablas de Contingencias 2x2 ........................................... 28
3.3 Modelo Geomรฉtrico de una Tabla de Contingencias 2X2 ........................................ 32
3.4 Applets de GeoGebra primera fase .......................................................................... 46
3.5 Formalizaciรณn de la Asociaciรณn en Tablas de Contingencias 2x2 ........................... 46
3.6 Applets de GeoGebra segunda fase......................................................................... 50
3.7 Tareas enviadas al Moodle del Colegio .................................................................... 51
3.8 Soluciรณn de un caso hipotรฉtico ................................................................................. 51
4. Conclusiones y recomendaciones ........................................................................ 55
4.1 Conclusiones ............................................................................................................. 55
4.2 Recomendaciones ..................................................................................................... 56
A. Anexo: Cuestionario Evaluaciรณn Diagnรณstica ..................................................... 57
B. Anexo: Libro de GeoGebra .................................................................................... 59
C. Anexo: Anรกlisis Algebraico del Modelo Geomรฉtrico .......................................... 61
C1. Primer Procedimiento Propuesto .......................................................................... 61
C2. Segundo Procedimiento Propuesto ...................................................................... 62
CONTENIDO IX
C3. Cรกlculo de Probabilidades con el Modelo Geomรฉtrico y su relaciรณn con los
Cรกlculos del Mรฉtodo Tradicional .................................................................................... 64
D. Fรณrmula simplificada para calcular el coeficiente de Phi de Pearson .............. 67
E. Actividades registradas en el Moodle del colegio .............................................. 73
Bibliografรญa ........................................................................................................................ 75
CONTENIDO X
Lista de figuras
Figura 1: Tabla de la distribuciรณn Chi cuadrada ................................................................ 15
Figura 2: Applet, Prueba Introductoria Tablas de Contingencia ........................................ 27
Figura 3: Modelo Geomรฉtrico de una tabla de contingencias 2X2 .................................... 33
Figura 4: Modelo Geomรฉtrico aplicado al ejemplo 01........................................................ 35
Figura 5: Modelo Geomรฉtrico aplicado al ejemplo 02........................................................ 40
Figura 6: Libro de GeoGebra .............................................................................................. 59
Figura 7: Applet Introductorio Informaciรณn de Tablas de Contingencia ............................ 59
Figura 8: Modelo Geomรฉtrico ............................................................................................. 60
Figura 9: Applet para el cรกlculo de porbabilidades condiciones ........................................ 60
Figura 10: Applet para el cรกlculo de Riesgos Relativos .................................................... 60
Figura 11: Applet para calcular probabilidades conjuntas y marginales ........................... 60
Figura 12: Tareas en Moodle sobre tablas de contingencia .............................................. 73
CONTENIDO XI
Lista de tablas
Tabla 1: Tabla bivariada ....................................................................................................... 8
Tabla 2: Modelo general de Tablas de Contingencia ........................................................ 11
Tabla 3: Modelo 1, Tabla de Contingencias 2X2 para las caracterรญstica A y B. ............... 12
Tabla 4: Modelo 2 Tabla de Contingencias 2X2 para las caracterรญstica A y B. ................ 12
Tabla 5. Modelo 3 Tabla de Contingencias 2X2 para las caracterรญstica A y B. ................ 12
Tabla 6: Signo de la Asociaciรณn Tabla de Contingencias 2X2 .......................................... 19
Tabla 7: Interpretaciones de los valores del cรกlculo de Riesgos Relativos....................... 20
Tabla 8: Datos cuestionario introductorio ........................................................................... 26
Tabla 9: Modelo Tabla de Contingencias Problema Introductorio ..................................... 29
Tabla 10: Tabla para la formalizaciรณn de cรกlculos en Tablas de Contingencia ................ 30
Tabla 11: Modelo de tabla de contingencias 2X2 para elaborar la representaciรณn grรกfica
del modelo geomรฉtrico propuesto ...................................................................................... 32
Tabla 12: Tabla Ejemplo 01 ................................................................................................ 34
Tabla 14: Ejercicio propuesto 01 ........................................................................................ 39
Tabla 13: Ejercicio propuesto 02 ........................................................................................ 39
Tabla 15: Informaciรณn ejemplo 02 ...................................................................................... 39
Tabla 16: Tabla resumen de los errores entre los valores esperados y observados ....... 44
Tabla 17: Resumen de los errores entre los valores esperados y observados ejemplo 2 44
Tabla 18: Resumen de los errores entre las probabilidades esperadas y las observadas
............................................................................................................................................. 45
Tabla 19: Resumen de los errores entre las probabilidades esperadas y las observadas
del ejemplo 2 ....................................................................................................................... 45
Tabla 20: Tablas de Contingencias Problema Propuesto ................................................. 47
Tabla 21: Valores para la Interpretaciรณn del Phi de Pearson ............................................ 50
XII TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
Tabla 22: Problema Evaluaciรณn Tablas de Contingencias 2X2 ......................................... 52
Tabla 23: Tabla de Contingencias Evaluaciรณn Diagnรณstica............................................... 57
Tabla 24: Para el anรกlisis algebraico del modelo geomรฉtrico ........................................... 61
Tabla 25: Comparativo cรกlculo de probabilidades procedimiento 1 .................................. 61
Tabla 26: Tabla de contingencias construida a partir de probabilidades .......................... 62
Tabla 27: Comparativo cรกlculo de probabilidades procedimiento 2 .................................. 63
CONTENIDO XIII
Lista de Sรญmbolos y Abreviaturas
Sรญmbolo o
Abreviatura Significado o definiciรณn
โฉ Intersecciรณn
โช Uniรณn
~ Negaciรณn
โ Vacรญo
๐๐๐, ๐๐๐ Frecuencia absoluta observada, registrada en la fila ๐ y en la columna ๐
๐11, ๐11 Frecuencia absoluta observada, registrada en la fila 1 y en la columna 1
๐.๐ Total marginal de la columna ๐
๐๐ . Total marginal de la fila o renglรณn ๐
๐, ๐ Total de frecuencias o eventos registrados en la Tabla de Contingencias
๐, ๐๐ Frecuencia observada ๐11 o valores observados de los eventos (๐ด1 โฉ ๐ต1)
๐, ๐๐ Frecuencia observada ๐12 o valores observados de los eventos (๐ด1 โฉ ๐ต2)
๐, ๐๐ Frecuencia observada ๐21 o valores observados de los eventos (๐ด2 โฉ ๐ต1)
๐, ๐๐ Frecuencia observada ๐22 o valores observados de los eventos (๐ด2 โฉ ๐ต2)
๐ Frecuencias absolutas observadas
๐ด๐ , ๐ต๐ Eventos de la Tabla de Contingencias
๐ด Caracterรญstica ๐ด o presencia de la caracterรญstica ๐จ
~๐ด Ausencia de la caracterรญstica ๐จ
๐(๐ด๐) Probabilidad marginal del evento ๐จ๐
๐(๐ต๐) Probabilidad marginal del evento ๐ฉ๐
XIV TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
Sรญmbolo o
Abreviatura Significado o definiciรณn
๐(๐ด๐ โฉ ๐ต๐) Probabilidad conjunta de los eventos ๐ด๐ y ๐ต๐
๐(๐ด๐|๐ต๐) Probabilidad condicional del evento ๐ด๐, dado que ha ocurrido el evento ๐ต๐
๐๐ Probabilidad observada de ๐
๐๐ Probabilidad observada de ๐
๐๐ Probabilidad observada de ๐
๐๐ Probabilidad observada de ๐
๐ด๐ รrea que representa la ocurrencia de ๐
๐ด๐ รrea que representa la ocurrencia de ๐
๐ด๐ รrea que representa la ocurrencia de ๐
๐ด๐ รrea que representa la ocurrencia de ๐
๐2 รrea que representa la ocurrencia de todos los eventos del espacio
muestral
๐๐๐ Frecuencia absoluta esperada para la fila ๐ y la columna ๐
๐ Frecuencias absolutas esperadas
๐๐ Frecuencia esperada ๐11 o valores esperados de los eventos (๐ด1 โฉ ๐ต1)
๐๐ Frecuencia esperada ๐12 o valores esperados de los eventos (๐ด1 โฉ ๐ต2)
๐๐ Frecuencia esperada ๐21 o valores esperados de los eventos (๐ด2 โฉ ๐ต1)
๐๐ Frecuencia esperada ๐22 o valores esperados de los eventos (๐ด2 โฉ ๐ต2)
๐(๐๐) Probabilidad calculada con el Modelo Geomรฉtrico (Probabilidad esperada) para el evento ๐
๐(๐๐) Probabilidad calculada con el Modelo Geomรฉtrico (Probabilidad esperada) para el evento ๐
๐(๐๐) Probabilidad calculada con el Modelo Geomรฉtrico (Probabilidad esperada) para el evento ๐
๐(๐๐) Probabilidad calculada con el Modelo Geomรฉtrico (Probabilidad esperada) para el evento ๐
๐2 Estadรญstico Chi Cuadrado
! Factorial
| | Valor absoluto
โ Error o diferencia entre los valores esperados y los observados
Introducciรณn
El ciudadano actual, ciudadano del siglo XXI, cuenta con diversas fuentes de
informaciรณn estadรญstica para la toma de decisiones relacionadas con su vida
profesional, acadรฉmica, familiar o personal; esta informaciรณn puede presentarse
como indicadores econรณmicos, indicadores de morbilidad, estudios
epidemiolรณgicos, horas pico de trรกfico, estudios de mercadeo, resultados de
encuestas de opiniรณn, etc. Por esta razรณn corresponde a la formaciรณn impartida en
los colegios promover en los estudiantes el aprendizaje de la estadรญstica y su
implementaciรณn en diferentes situaciones hipotรฉticas o concretas.
De acuerdo con (Artega, Batanero, Contreras, & Caรฑadas, 2011) quienes citan a
(Batanero, 2002) desde hace unas dรฉcadas la enseรฑanza de la estadรญstica se ha
incorporado en todos los niveles educativos en forma generalizada, promoviendo
asรญ el desarrollo del razonamiento estadรญstico, basado en la comprensiรณn de ideas
fundamentales como los datos, el anรกlisis e interpretaciรณn de grรกficos o tablas, la
variabilidad aleatoria, el anรกlisis y la inferencia de distintas distribuciones de datos,
la asociaciรณn entre variables categรณricas y la correlaciรณn para analizar si existe
correspondencia o algรบn tipo de relaciรณn de dependencia entre variables
cuantitativas; la concepciรณn de probabilidad y el muestro inferencial (Batanero ,
Contreras, Dรญaz , & Roa, 2013). Ademรกs el razonamiento estadรญstico presenta los
siguientes modos fundamentales segรบn (Wild & Pfannkuch, 1999) quienes son
citados por (Batanero et al., 2013)
2 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
Reconocer la necesidad de los datos, en la forma adecuada como se han
recogido y en su anรกlisis, pues son ellos la base de la investigaciรณn
estadรญstica.
La transnumeraciรณn, que ocurre cuando surge una nueva compresiรณn de
los datos, desorganizados en un primer momento, al cambiarlos a otras
representaciones que pueden simplificar, en gran medida, la informaciรณn
estadรญstica que se desee comunicar de forma sencilla al pรบblico en
general. Es posible hablar de transnumeraciรณn cuando se emplea una
escala o medida para capturar la informaciรณn de diferentes cualidades y
caracterรญsticas propias de un evento que se estรฉ analizando; cuando el
significado de un estadรญstico, aplicado a un conjunto de datos, es llevado
a un lenguaje comprensible que puede ser entendido por personas no
expertas; cuando los datos se representan con grรกficas o tablas que
permiten descubrir nuevos significados y nuevas relaciones de las
variables involucradas.
La percepciรณn de la variaciรณn de eventos aleatorios, que permite
identificar sus fuentes, buscar sus explicaciones y sus causas, para
proponer ciertas inferencias o predicciones con algรบn margen de error.
El razonamiento con modelos estadรญsticos diseรฑados para alcรกzar una
mejor comprensiรณn de la realidad. No solo se pueden emplear modelos
probabilรญsticos, tambiรฉn pueden usarse funciones o grรกficos para
modelar la situaciรณn de interรฉs.
Y por รบltimo, en la integraciรณn que se debe hacer entre los estudios
estadรญsticos y su contexto, por ejemplo al proponer el modelo y al
momento de interpretar sus resultados, contrastรกndolos con la situaciรณn
real objeto estudio.
INTRODUCCIรN 3
El anรกlisis crรญtico de la informaciรณn estadรญstica consignada en tablas de doble
entrada o de contingencia, puede ayudar a analizar fenรณmenos sociales, polรญticos,
econรณmicos, empresariales, institucionales o nacionales.
En el primer capรญtulo, Marco Conceptual, se describen la justificaciรณn, la situaciรณn
problema, el objetivo general y los objetivos especรญficos del presente trabajo.
En el segundo capรญtulo, Marco Teรณrico, se muestra un breve recorrido por la teorรญa
de probabilidades, tipos de probabilidades que se pueden obtener a partir de las
frecuencias de las tablas de contingencia, independencia estadรญstica en tablas de
contingencia, y asociaciรณn entre variables categรณricas. Tambiรฉn se mencionan los
referentes que, desde la educaciรณn matemรกtica, darรกn soporte al diseรฑo de la
propuesta didรกctica.
En el tercer capรญtulo se presenta la propuesta didรกctica que contempla: una prueba
diagnรณstica; el diseรฑo de un modelo geomรฉtrico para representar tablas de
contingencias 2X2, cuando sus variables categรณricas son estadรญsticamente
independientes; formalizaciรณn del concepto de asociaciรณn y de algunos coeficientes
o indicadores del grado de asociaciรณn entre variables cualitativas, por รบltimo se
proponen problemas de aplicaciรณn y de Applets en GeoGebra, como complemento
a la propuesta didรกctica.
En el cuarto y รบltimo capรญtulo se mencionan las principales conclusiones y
recomendaciones para ser tenidas en cuenta en caso de desarrollar esta propuesta
con otro u otros grupos de estudiantes de grado once o de nivel superior.
En los anexos se expone un anรกlisis algebraico que permite establecer la estrecha
relaciรณn entre el modelo tradicional, tomando directamente la informaciรณn de la
tabla de contingencias, y el modelo geomรฉtrico, cuando se presenta independencia
entre sus variables categรณricas, al momento de calcular los diferentes tipos de
probabilidades de los eventos estudiados con tablas de contingencia 2X2;
posteriormente, y para finalizar, se muestran imรกgenes o capturas de pantalla de
los Applets propuestos y de actividades complementarias desarrolladas utilizando
el Moodle del colegio Saludcoop Sur IED.
1. Marco Conceptual
1.1 Justificaciรณn
En la enseรฑanza estadรญstica, el formato de las tablas de contingencia ayuda a
visualizar conceptos y relaciones abstractas difรญciles de comprender, pero no es un
tema tan sencillo incluso cuando solo se trata de tablas de dos filas y dos columnas
(Contreras, Caรฑadas, & Artea, 2013), por ello es pertinente diseรฑar propuestas
didรกcticas que permitan a los estudiantes acercarse a los conceptos de
probabilidad conjunta, marginal, condicional, condiciones de independencia y
grado de asociaciรณn, estrechamente relacionados con el estudio de tablas de
contingencia y su aplicaciรณn a partir de situaciones problema.
1.2 Situaciรณn Problema
Partiendo de las posibilidades del anรกlisis de la informaciรณn en tablas de
contingencia, se plantea la siguiente pregunta problema:
ยฟQuรฉ caracterรญsticas debe tener una propuesta didรกctica que permita a estudiantes
de grado undรฉcimo, del colegio Saludcoop Sur IED jornada tarde, construir tablas
de contingencia que los acerquen a los conceptos de asociaciรณn entre variables
aleatorias cualitativas, probabilidad marginal, conjunta y condicional, a partir del
anรกlisis de frecuencias absolutas, relativas y marginales?
MARCO CONCEPTUAL 5
1.3 Objetivo General
Diseรฑar una secuencia didรกctica para estudiantes de grado undรฉcimo, del colegio
Saludcoop Sur IED jornada tarde, que les permita examinar la informaciรณn
estadรญstica consignada en tablas de contingencia 2X2, y llegar a una primera
conceptualizaciรณn de asociaciรณn entre variables cualitativas, probabilidad marginal,
conjunta y condicional, a partir del anรกlisis de frecuencias absolutas, relativas y
marginales.
1.4 Objetivos Especรญficos
โ Diseรฑar actividades y guรญas que permitan a los estudiantes establecer la
importancia de la construcciรณn de tablas de contingencia para el anรกlisis de
la informaciรณn de estudios estadรญsticos de variables cualitativas.
โ Diseรฑar un objeto virtual de aprendizaje que ayude a los estudiantes en la
adquisiciรณn de habilidades para elaborar y analizar la informaciรณn
consignada en tablas de contingencia, y ademรกs facilite la construcciรณn de
representaciones grรกficas asociadas como los diagramas de barras apilados
y adosados.
โ Crear actividades que permitan a los estudiantes la obtenciรณn de indicadores
para evaluar si existe o no asociaciรณn entre dos variables cualitativas objeto
de estudio.
โ Diseรฑar un conjunto de pruebas que permita evaluar el grado de
comprensiรณn de diferentes conceptos relacionados con la asociaciรณn entre
variables categรณricas y de probabilidad vistos a lo largo del desarrollo de la
propuesta.
2. Marco Teรณrico
2.1 Probabilidades
2.1.1 Definiciรณn clรกsica
Si un experimento, que estรก sujeto al azar, resulta de ๐ formas igualmente
probables y mutuamente excluyentes, y si ๐๐จ de estos resultados tienen un atributo
๐จ, la probabilidad de ๐จ es la proporciรณn de ๐๐จ con respecto a ๐. (Canavos, 1988,
pรกg. 29)
2.1.2 Definiciรณn de la probabilidad como frecuencia relativa o
probabilidad empรญrica
Si despuรฉs de ๐ repeticiones de un experimento bajo las mismas condiciones, se
observa que una cantidad ๐๐จ de los resultados corresponden a la ocurrencia de
un atributo ๐จ, entonces la probabilidad de ๐จ se define como el lรญmite de ๐๐จ
๐
conforme ๐ toma valores cada vez mรกs grandes (Canavos, 1988, pรกg. 31)
2.1.3 Interpretaciรณn subjetiva de la probabilidad
En este caso la probabilidad se interpreta como el grado de creencia, o de
convicciรณn personal, respecto a la ocurrencia de una afirmaciรณn (Canavos, 1988,
pรกg. 31)
MARCO TEรRICO 7
2.1.4 Elementos bรกsicos de la teorรญa de conjuntos utilizados
para el estudio de la probabilidad
1. Espacio muestral (๐บ): Es el conjunto de todos los posibles resultados de
un experimento aleatorio; puede ser discreto o continรบo segรบn sea la
naturaleza de los datos que se estรฉn analizando; su probabilidad de
ocurrencia es igual a uno, ๐ท(๐บ) = ๐ (Canavos, 1988, pรกg. 32)
2. Evento (๐จ): Un evento es un grupo o subconjunto del espacio muestral que
se define de acuerdo al cumplimiento de uno o mรกs atributos. Su
probabilidad de ocurrencia puede calcularse dentro de intervalo [0, 1]
3. Evento (๐จ โฉ ๐ฉ): Es el evento conformado por todos los resultados comunes
entre ๐จ y ๐ฉ, es decir son todos los resultados que cumplen
simultรกneamente con las condiciones de los atributos ๐จ y ๐ฉ. La
probabilidad de ocurrencia de este evento se expresa ๐ท(๐จ โฉ ๐ฉ).
4. Evento (๐จ โช ๐ฉ): Es el evento conformado por todos los posibles resultados
de ๐จ o de ๐ฉ, es decir son todos los resultados que cumplen con las
condiciones del atributo ๐จ o del atributo ๐ฉ. La probabilidad de ocurrencia
de este evento puede calcularse con la siguiente formula:
๐ท(๐จ โช ๐ฉ) = ๐ท(๐จ) + ๐ท(๐ฉ) โ ๐ท(๐จ โฉ ๐ฉ).
5. Evento (๐จโฒ): El evento ๐จ complemento estรก conformado por todos los
posibles resultados de ๐บ que no se encuentran en ๐จ. Su probabilidad de
ocurrencia pude expresarse asรญ ๐ท(๐จยด) = ๐ โ ๐ท(๐จ)
6. Evento vacรญo o nulo (โ ): Es el evento que no contiene ningรบn resultado
posible del espacio muestral, recibe el nombre de evento nulo o vacรญo y su
probabilidad es igual a cero. ๐ท(โ ) = ๐.
8 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
7. Evento ( ๐จ โฉ ๐ฉ) = โ : Si dos eventos son mutuamente excluyentes o
disjuntos, su intersecciรณn es vacรญa y se dice que no tienen resultados en
comรบn.
8. ( ๐จ โ ๐ฉ): El evento ๐จ estรก contenido en el evento ๐ฉ si todo resultado de ๐จ
tambiรฉn es un resultado de ๐ฉ.
2.1.5 Probabilidad conjunta, marginal y condicional
Para definir las probabilidades conjuntas, marginales y condicionales considรฉrese
que se ha realizado una encuesta que busca estudiar dos caracterรญsticas, ๐จ y ๐ฉ,
de un grupo de personas, y que la informaciรณn se resume en una tabla bivarida de
dos filas y dos columnas como la que se muestra a continuaciรณn.
Tabla 1: Tabla bivariada
๐ต1 ๐ต2 Totales
๐ด1 ๐11 ๐12 ๐1.
๐ด2 ๐21 ๐22 ๐2.
Totales ๐.1 ๐.2 ๐.
Si ๐บ es el espacio muestral que contiene a los eventos disjuntos ๐ด1, ๐ด2, ๐ต1, y ๐ต2,
entonces se tienen las siguientes probabilidades:
2.1.5.1 Probabilidad conjunta
Se llama probabilidad conjunta a la probabilidad de ocurrencia, de forma
simultรกnea, de los eventos ๐ด๐ y ๐ต๐ en relaciรณn al total de eventos del espacio
muestral.
๐(๐ด๐ โฉ ๐ต๐) = ๐๐๐
๐โ (1)
En el caso particular de la tabla 1, se tiene que
๐(๐ด1 โฉ ๐ต1) = ๐11
๐โ (2)
MARCO TEรRICO 9
2.1.5.2 Probabilidad marginal
Se llama probabilidad marginal a la probabilidad de ocurrencia de los eventos ๐ด๐ o
๐ต๐, independientemente de cualquier otro evento del espacio muestral. Otra forma
de definir la probabilidad marginal es como la suma de sus probabilidades
conjuntas.
๐(๐ด๐) = = (3) ๐(๐ต๐) = =
2.1.5.3 Probabilidad condicional
Se llama probabilidad condicional a la probabilidad de que ocurra un evento ๐จ๐
cuando se sabe que ha ocurrido evento un ๐ฉ๐, esto se denota asรญ ๐(๐ด๐|๐ต๐) y se
lee โProbabilidad de ๐จ๐ dado ๐ฉ๐ o la probabilidad de que ocurra ๐จ๐, dado que ha
ocurrido ๐ฉ๐โ. Una fรณrmula que puede utilizarse para calcular esta probabilidad es la
siguiente:
๐(๐ด๐|๐ต๐) = ๐(๐ด๐โฉ๐ต๐)
๐(๐ต๐), con ๐(๐ต๐) > 0 (5)
,
2.2 Eventos estadรญsticamente independientes
Cuando se quiere calcular la probabilidad condicional de ocurrencia de un evento
A, dado que ha ocurrido un evento B, se presupone que las probabilidades de
ocurrencia de estos dos eventos estรกn relacionadas y que son dependientes entre
sรญ; dicho de otra forma, la probabilidad de que se presente A es afectada por la
ocurrencia de B, sin embargo pueden presentarse situaciones en las que la
ocurrencia de B no influye sobre las probabilidades de ocurrencia de A. Cuando se
presentan estas situaciones se dice que los eventos A y B son estadรญsticamente
independientes.
Sean A y B dos eventos cualesquiera de un espacio muestral S, se dice que el
evento A es estadรญsticamente independiente del evento B, con ๐ท(๐ฉ) > ๐, si
โ๐๐๐
๐
2
๐=1
โ๐๐๐
๐
2
๐=1
โ ๐(๐ด๐ โฉ ๐ต๐)
2
๐=1
โ ๐(๐ด๐ โฉ ๐ต๐) (4)2
๐=1
10 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
๐ท(๐จ|๐ฉ) = ๐ท(๐จ), igualmente B es estadรญsticamente independiente del evento A,
con ๐ท(๐จ) > ๐, si ๐ท(๐ฉ|๐จ) = ๐ท(๐ฉ), esto tiene la siguiente implicaciรณn:
๐(๐ด|๐ต) = ๐(๐ดโฉ๐ต)
๐(๐ต), pero como ๐(๐ด|๐ต) = ๐(๐ด) tenemos que
๐(๐ด) = ๐(๐ดโฉ๐ต)
๐(๐ต), por lo tanto ๐(๐ด)๐(๐ต) = ๐(๐ด โฉ ๐ต)
En resumen, si A y B son eventos estadรญsticamente independientes, se debe
verificar una de las siguientes condiciones de independencia:
i. ๐(๐ด|๐ต) = ๐(๐ด) (6) ii. ๐(๐ต|๐ด) = ๐(๐ต) (7) iii. ๐(๐ด โฉ ๐ต) = ๐(๐ด)๐(๐ต) (8)
2.3 Tablas de Contingencia
Las tablas de contingencia, tรฉrmino acuรฑado por Karl Pearson en 1904 (Sanchez
Rivero, 1998), se utilizan en estudios estadรญsticos interesados en la posible relaciรณn
entre dos atributos cualitativos de los individuos de una poblaciรณn. Usualmente
cada atributo se maneja como una variable cualitativa ๐ o ๐, y la variaciรณn de cada
variable estรก representada por los valores ๐ฅ1 , ๐ฅ2, โฆ ๐ฅ๐ โฆ ๐ฅ๐ y ๐ฆ1 , ๐ฆ2, โฆ ๐ฆ๐ โฆ ๐ฆ๐
respectivamente. La informaciรณn se organizan en un tabla de doble entrada de
observaciones bivariadas que tienen como primera columna y primera fila o
renglรณn, los valores que asumen ๐ y ๐ (Caรฑadas G. , 2010)
En general si se toma una muestra de tamaรฑo ๐ de una poblaciรณn, y se desean
estudiar dos caracterรญsticas de un mismo individuo o grupo de personas, se tiene
que:
Sean estas caracterรญsticas X y Y la muestra se divide en:
Clase ๐ฅ๐ para la variable ๐
Clase ๐ฆ๐ para la variable ๐
MARCO TEรRICO 11
Dรณnde:
๐๐๐ es la frecuencia absoluta o frecuencia observada en cada celda
๐๐โ es la frecuencia acumulada en ๐ฅ๐ ., distribuciรณn marginal por filas o renglones
๐โ๐ es la frecuencia acumulada en ๐ฆ๐., distribuciรณn marginal por columnas
โ๐๐ =๐๐๐
๐ es la frecuencia relativa
โ๐๐ (๐ฅ๐
๐ฆ๐) =
๐๐๐
๐.๐=
๐๐๐
๐๐ฆ๏ฟฝฬ๏ฟฝ=
โ๐๐
โ.๐ representa las distribuciones condicionales por
columna
โ๐๐ (๐ฆ๐
๐ฅ๐) =
๐๐๐
๐๐.=
๐๐๐
๐๐ฅ๐ฬ =
โ๐๐
โ๐. representa las distribuciones condicionales por fila
o renglรณn
Tabla 2: Modelo general de Tablas de Contingencia
๐ฆ1 ๐ฆ2 โฏ ๐ฆ๐ โฏ ๐ฆ๐ Total
๐ฅ1 ๐11 ๐12 โฏ ๐1๐ โฏ ๐1๐ ๐1โ
๐ฅ2 ๐21 ๐22 โฏ ๐2๐ โฏ ๐2๐ ๐2โ
โฎ โฎ โฎ โฏ โฎ โฎ โฎ โฎ
๐ฅ๐ ๐๐1 ๐๐2 โฏ ๐๐๐ โฏ ๐๐๐ ๐๐โ
โฎ โฏ โฏ โฏ โฎ โฏ โฎ โฎ
๐ฅ๐ ๐๐1 ๐๐2 โฏ ๐๐๐ โฏ ๐๐๐ ๐๐โ
Total ๐โ1 ๐โ2 โฏ ๐โ๐ โฏ ๐โ๐ ๐
12 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
2.3.1 Tablas de Contingencia 2x2
Un caso particular son las tablas de contingencia de 2X2 como las que se muestran
a continuaciรณn:
Tabla 3: Modelo 1, Tabla de Contingencias 2X2 para las caracterรญstica A y B.
๐ต ๐๐ ๐ต Total
๐ด ๐11 ๐12 ๐1โ
๐๐ ๐ด ๐21 ๐22 ๐2โ
Total ๐โ1 ๐โ2 ๐
Tabla 4: Modelo 2 Tabla de Contingencias 2X2 para las caracterรญstica A y B.
๐ต ๐๐ ๐ต Total
๐ด ๐ ๐ ๐ + ๐ ๐๐ ๐ด ๐ ๐ ๐ + ๐ Total ๐ + ๐ ๐ + ๐ ๐ + ๐ + ๐ + ๐
Tabla 5. Modelo 3 Tabla de Contingencias 2X2 para las caracterรญstica A y B.
๐ต1 ๐ต2 Total
๐ด1 ๐ ๐ ๐ + ๐ ๐ด2 ๐ ๐ ๐ + ๐
Total ๐ + ๐ ๐ + ๐ ๐ = ๐ + ๐ + ๐ + ๐
Dรณnde:
๐, ๐, ๐ ๐ฆ ๐: Representan frecuencias absolutas.
De acuerdo a (Contreras J. M., Caรฑadas, Gea, & Arteaga, 2012), quienes citan a
(Dรญaz & De la Fuente, 2005) por cada celda de la tabla de contingencias pueden
calcularse tres frecuencias relativas diferentes, y ademรกs cada frecuencia relativa
se relaciona con el cรกlculo de una probabilidad diferente.
MARCO TEรRICO 13
Por ejemplo en relaciรณn a la celda ๐ o celda (1,1) tenemos:
Frecuencia relativa doble y el cรกlculo de la probabilidad conjunta de los
eventos ๐ด1 y ๐ต1
๐11
๐=
๐
๐+๐+๐+๐= ๐(๐ด1 โฉ ๐ต1) (9)
Frecuencia relativa con respecto a su fila o renglรณn, y el cรกlculo de la
probabilidad condicional ๐ต1 dado que ha ocurrido ๐ด1 :
๐11
๐1โ=
๐
๐+๐ = ๐(๐ต1|๐ด1) (10)
Frecuencia relativa con respecto a su columna, y el cรกlculo de la
probabilidad condicional ๐ด1 dado que ha ocurrido ๐ต1
๐11
๐โ1=
๐
๐+๐ = ๐(๐ด1|๐ต1) (11)
Frecuencias relativas marginales y el cรกlculo de probabilidades marginales
por filas o columnas es el siguiente:
Por fila ๐1โ
๐=
๐+๐
๐+๐+๐+๐ = ๐(๐ด1) (12)
Por columna ๐โ1
๐=
๐+๐
๐+๐+๐+๐ = ๐(๐ต1) (13)
2.4 Independencia y asociaciรณn entre las variables de una
Tabla de Contingencias
Cuando se estudia la posible asociaciรณn o relaciรณn de dependencia entre las
variables categรณricas de una tabla de contingencias, se parte de la hipรณtesis de que
14 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
no existe relaciรณn alguna y por lo tanto cada frecuencia observada (๐๐๐) es
equivalente a una frecuencia esperada o teรณrica (๐๐๐)
Antes de realizar los cรกlculos de independencia se plantean las siguientes dos
hipรณtesis:
Hipรณtesis nula (๐ป0): Las variables categรณricas de la tabla de contingencias son
independientes entre sรญ.
Hipรณtesis alternativa (๐ป1): Las variables categรณricas de la tabla de contingencias
son dependientes entre sรญ.
Para determinar las frecuencias esperadas se tienen en cuenta los valores
marginales de la tabla de contingencias; se asume igual la probabilidad para cada
categorรญa y que no existe asociaciรณn entre las variables estudiadas.
El grado de concordancia entre las frecuencias esperadas y las frecuencias
observadas se calcula utiliza el estadรญsticos ๐2 (Chi cuadrado)
๐2 = โ โ(๐๐๐ โ ๐๐๐)
2
๐๐๐
๐
๐=1
๐
๐=1
(15)
Una versiรณn simplificada para calcular este estadรญstico es:
๐2 = โ(๐โ๐)2
๐ (16)
Este estadรญstico permite identificar relaciones de dependencia entre variables
cualitativas, y afirmar con cierto nivel de confianza si los valores alcanzados por
una de las variables influyen sobre otra. (Otero & Medina Mora, 2005)
๐๐๐ =(๐๐๐ก๐๐ ๐๐ ๐๐ ๐๐๐๐ข๐๐๐ ๐)(๐๐๐ก๐๐ ๐๐ ๐๐๐๐๐รณ๐ ๐)
๐๐๐๐รฑ๐ ๐๐ ๐๐ ๐๐ข๐๐ ๐ก๐๐ (14)
MARCO TEรRICO 15
Cuando se calcula el valor de ๐2, y resulta mayor que algรบn valor crรญtico, tal como
el de ๐0,952 , se puede decir que las frecuencias observadas difieren
significativamente de las frecuencias esperadas, entonces se rechaza la hipรณtesis
inicial ๐ป๐. En caso contrario, se acepta o al menos no se rechaza. Este
procedimiento se conoce como ensayo o prueba de Chi-cuadrado de hipรณtesis.
(Spiegel & Stephens, 2009)
En el caso particular de tablas de contingencia de 2X2, si decide trabajar con un
nivel de significancia de 0.05 y un valor crรญtico de ๐0,952 se tiene como regla de
decisiรณn la siguiente:
Si 2 โฅ 3.84, entonces ๐ป๐ es rechazada, lo que significa la existencia de
dependencia entre las variables
Si 2 < 3.84 No se rechaza la hipรณtesis ๐ป๐, lo que significa que existe
independencia entre las variables.
Estos valores se encuentran en tablas de la distribuciรณn Chi cuadrada como la que
se muestra a continuaciรณn, que pertenece al del libro de Estadรญstica de Spiegel y
Stephens, 2009.
Figura 1: Tabla de la distribuciรณn Chi cuadrada
16 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
2.5 Estudios iniciales sobre coeficientes de asociaciรณn de
variables categรณricas en tablas de contingencia 2X2
Segรบn Fienberg (1978), citado por (Sanchez Rivero, 1998), los estudios iniciales
que se ocuparon del anรกlisis de las variables categรณricas en tablas de
contingencias fueron los desarrollados por Pearson y Yule a inicios del siglo XX.
Pearson definiรณ tres coeficientes:
1) Coeficiente de correlaciรณn Tetracรณrico
๐๐ =๐12๐21
๐11๐22 (17)
Si ๐12๐21
๐11๐22> 1 entonces ๐๐ es positivo, la relaciรณn entre las variables es positiva
Si ๐12๐21
๐11๐22< 1 entonces ๐๐ es negativo, la relaciรณn entre las variables es negativa
2) Coeficiente Phi de Pearson:
ฮฆ = โ๐๐
๐ (18)
El tamaรฑo de la muestra no influye en el valor que pueda tomar este coeficiente,
por lo que es posible comparar los resultados de diferentes tablas. Este coeficiente
รบnicamente toma valores mayores o iguales a cero, a medida que se aleje de cero
el grado de asociaciรณn entre las variables serรก mayor, si su valor es cero se
presume que las variables muestran independencia entre sรญ.
3) Coeficiente de contingencia:
Una de las principales dificultades del coeficiente Phi de Pearson es que puede
tomar valores superiores a 1, por ello Pearson propuso en 1904 (Sanchez Rivero,
MARCO TEรRICO 17
1998) el coeficiente de contingencia, el cual tomarรก siempre valores en el intervalo
0 a 1. Si ๐ถ = 0 entonces las variables muestran independencia, pero si se acerca
a 1 entonces se dice que presentan cierto grado de asociaciรณn.
C = โ๐๐
๐๐ + ๐ (19)
Entre 1954 y 1972
Goodman y Kruskal proponen un conjunto de medidas para evaluar la
independencia y la asociaciรณn entre variables categรณricas. Entre estas medidas
pueden mencionarse las siguientes (Sanchez Rivero, 1998):
1) Test de correcciรณn de continuidad de Yates:
๐๐ =๐(|๐๐๐๐๐๐ โ ๐๐๐๐๐๐| โ ๐. ๐๐)๐
๐๐. ๐๐. ๐.๐ ๐.๐ (20)
Este test se comporta como una distribuciรณn ๐2 con un grado de libertad y puede
variar desde cero hasta infinito. Si el resultado obtenido es mayor a 3,84 puede
decirse que las variables de la tabla de contingencias muestran que son
independientes.
2) Test exacto de Fisher
Si las frecuencias observadas en la tabla de contingencias son menores a cinco,
no es apropiado utilizar el test de ๐2, lo recomendado es utilizar el siguiente test
๐ท =๐๐. ! ๐๐. ! ๐.๐ ! ๐.๐ !
๐! ๐๐๐! ๐๐๐! ๐๐๐! ๐๐๐! (21)
18 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
3) Test Q de Yule:
๐ธ =๐๐๐๐๐๐ โ ๐๐๐๐๐๐
๐๐๐๐๐๐ + ๐๐๐๐๐๐ (22)
Posibles resultados
๐ = 0 Independencia ๐ < 0 Asociaciรณn negativa
๐ > 0 Asociaciรณn positiva ๐ = 1 Asociaciรณn perfecta estricta positiva
๐ = โ1 Asociaciรณn perfecta estricta negativa
4) Coeficiente Y de Yule:
๏ฟฝฬ๏ฟฝ =โ๏ฟฝฬ๏ฟฝ โ ๐
โ๏ฟฝฬ๏ฟฝ + ๐ (23)
En donde โ๏ฟฝฬ๏ฟฝ = โ๐๐๐๐๐๐
๐๐๐๐๐๐
El coeficiente de Yule puede tomar valores entre 1 y โ 1. Si se da el caso de que
๏ฟฝฬ๏ฟฝ = 0 entonces se pude decir que las variables de la tabla de contingencias son
independientes.
2.6 Signo de la Asociaciรณn, Riesgo Relativo y Riesgo de
Productos Cruzados en Tablas de Contingencia 2X2
2.6.1 Signo de la Asociaciรณn.
En una tabla de contingencias de dos filas y dos columnas, las diagonales
principales ๐, ๐ y ๐, ๐ aportan informaciรณn sobre el tipo de dependencia y
MARCO TEรRICO 19
asociaciรณn entre sus variables. Valores en las celdas ๐ (presencia de ๐จ y de ๐ฉ) y
en la celda ๐ (ausencia de ๐จ y de ๐ฉ) indican asociaciรณn directa o positiva. Valores
en las celdas ๐ (presencia de ๐จ y ausencia de ๐ฉ) y en la celda ๐ (ausencia de ๐จ y
presencia de ๐ฉ) indican asociaciรณn inversa o negativa. (Caรฑadas G. , 2013)
Tabla 6: Signo de la Asociaciรณn Tabla de Contingencias 2X2
๐ต ๐๐ ๐ต
๐ด ๐
๐ด๐ ๐๐๐๐๐๐รณ๐ ๐ท๐๐๐๐๐ก๐ ๐
๐ด๐ ๐๐๐๐๐๐รณ๐ ๐ผ๐๐ฃ๐๐๐ ๐
๐๐ ๐ด ๐
๐ด๐ ๐๐๐๐๐๐รณ๐ ๐ผ๐๐ฃ๐๐๐ ๐ ๐
๐ด๐ ๐๐๐๐๐๐รณ๐ ๐ท๐๐๐๐๐ก๐
Para determinar el grado de asociaciรณn entre las variables cualitativas de una tabla
de contingencias se pueden utilizar los siguientes coeficientes de asociaciรณn.
2.6.2 Riesgo Relativo
El Riesgo Relativo puede calcularse tanto por filas como por columnas. Si es por
columnas permite establecer que tan probable es que se dรฉ ๐จ dado que se ha dado
๐ฉ en relaciรณn a los casos en los que no se ha presentado ๐ฉ. El riesgo relativo por
filas muestra que tanto mรกs probable es la presencia de ๐ฉ dado que ha ocurrido ๐จ
en relaciรณn a aquellos casos en los que no se presenta ๐จ (Caรฑadas G. , Contreras,
Arteaga, & Gea, 2013)
๐ ๐ ๐ถ = ๐(๐ด/๐ต)
๐(๐ด/๐๐ ๐ต) =
๐/(๐+๐)
๐/(๐+๐)=
๐(๐+๐)
๐(๐+๐) (24)
๐ ๐ ๐น = ๐(๐ต/๐ด)
๐(๐ต/๐๐ ๐ด)=
๐/(๐+๐)
๐/(๐+๐)=
๐(๐+๐)
๐(๐+๐) (25)
20 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
Para este indicador se establecen las siguientes interpretaciones
Tabla 7: Interpretaciones de los valores del cรกlculo de Riesgos Relativos
๐ ๐ < 1 Existe asociaciรณn negativa entre las variables
๐ ๐ = 1 No existe asociaciรณn entre las variables
๐ ๐ > 1 Existe asociaciรณn positiva entre las variables
2.6.3 Riesgo de Productos Cruzados
Es el cociente que se calcula entre el producto de las celdas favorables a la
asociaciรณn positiva y el de las celdas que son favorables a la asociaciรณn negativa
Para calcular el riesgo de productos cruzado se procede asรญ
1) Se calcula la razรณn entre los caso favorables a que se dรฉ ๐ฉ dado que ha
ocurrido ๐จ y los casos favorables a que no se de ๐ต dado que ha ocurrido ๐จ
๐ 1 = ๐(๐ต|๐ด)
๐(๐๐ ๐ต|๐ด)=
๐
๐+๐
๐
๐+๐
= ๐(๐+๐)
๐(๐+๐)=
๐
๐
2) Se calcula la razรณn entre los caso favorables a que se dรฉ ๐ฉ dado que no ha
ocurrido ๐จ y los casos favorables a que no se de ๐ต dado que no ha ocurrido
๐จ
๐ 2 = ๐(๐ต|๐๐ ๐ด)
๐(๐๐ ๐ต| ๐๐ ๐ด)=
๐
๐+๐
๐
๐+๐
= ๐(๐+๐)
๐(๐+๐)=
๐
๐
3) Finalmente se calcula la razรณn entre ๐ 1 y ๐ 2
๐ ๐ถ = ๐ 1
๐ 2=
๐
๐
๐
๐
= ๐๐
๐๐
En resumen
๐ ๐ถ = ๐๐
๐๐ (26)
MARCO TEรRICO 21
Para este indicador se establecen las siguientes interpretaciones
Si ๐ ๐ถ < 1: Se dice que las variables de la tabla de contingencias presentan
asociaciรณn inversa.
Si ๐ ๐ถ = 1: Se dice que las variables de la tabla de contingencias presentan
independencia entre sรญ.
Si ๐ ๐ถ > 1: Se dice que las variables de la tabla de contingencias presentan
asociaciรณn directa.
2.7 Asociaciรณn en Tablas de Contingencia 2X2, y el
coeficiente ๐ฝ (Phi) de Pearson
El coeficiente Phi de Pearson utiliza el valor de Chi-cuadrado y toma valores entre
โ 1 y 1. Puede calcularse utilizando una de las siguientes fรณrmulas (Caรฑadas G., et
al. 2013)
ฮฆ = โ๐2
๐ (27.1)
ฮฆ = ๐๐๐๐๐๐โ๐๐๐๐๐๐
โ๐๐.๐.๐๐๐.๐.๐ (27.2)
ฮฆ =๐๐ โ๐๐
โ(๐+๐)(๐+๐)(๐+๐ )(๐+๐ ) (27.3)
La equivalencia entre estas expresiones puede verificarse en el anexo D
Este coeficiente se calcula a partir de las distancias entre las frecuencias
observadas y las esperadas en caso de independencia. Si las variables son
22 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
independientes entonces no existe diferencia entre las frecuencias observadas y
las esperadas, por lo tanto, el resultado de este coeficiente es cero.
Para interpretar el resultado obtenido con este coeficiente se deben tener en cuenta
las siguientes observaciones:
1) Cuando la dependencia es directa y perfecta, todos los caso se concentran
en las celdas ๐ y ๐ , se obtiene el valor mรกximo de ๐. Cuanto mรกs se acerque
a ๐ la dependencia es mรกs alta.
2) Si la dependencia es inversa y perfecta, todos los caso se concentran en las
celdas ๐ y ๐, se obtiene el valor mรญnimo de โ๐. Cuanto mรกs se acerque a
โ๐ la dependencia inversa y mรกs alta.
3) Si existe total independencia, el valor del coeficiente es cero
4) Este coeficiente no depende las frecuencias marginales.
5) Si se dividen o multiplican todas las frecuencias de la tabla de contingencias
por el mismo nรบmero, el valor de este coeficiente no varรญa.
2.8 Representaciones Semiรณticas
A continuaciรณn se describen los elementos sugeridos por la teorรญa de las
representaciones semiรณticas para que los estudiantes logren la comprensiรณn o
conceptualizaciรณn de un objeto matemรกtico. En este caso en particular se utilizarรกn
en la enseรฑanza de conceptos de probabilidades conjuntas, marginales,
condicionales, condiciones de independencia y asociaciรณn, relacionados con tablas
de contingencias 2X2.
El aprendizaje de las matemรกticas estรก mediado por la utilizaciรณn de diferentes
representaciones semiรณticas que permiten la adquisiciรณn, construcciรณn y
manipulaciรณn de diversos conceptos, por ejemplo, si se piensa en un punto, una
recta o un cuadrado resulta casi imposible actuar sobre estos objetos matemรกticos
MARCO TEรRICO 23
sin recurrir a una imagen mental, una representaciรณn tabular o grรกfica que de ellos
se tenga.
Cuando se busca la comprensiรณn de un objeto matemรกtico, desde el enfoque
teรณrico que se quiere manejar, se deben tener en cuenta diversos aspectos dentro
de los cuales se resaltan:
Los grados de libertad, es decir, โlos registros de representaciรณn semiรณtica de
los que dispone un sujeto [en este caso el estudiante], para objetivarse รฉl mismo
[un concepto matemรกtico] o una idea aรบn confusaโ (Duval, 1999, pรกg. 29)
โLas representaciones semiรณticas son a la vez externas y conscientes, y
cumplen con las funciones cognitivas de transformaciรณn intencional, expresiรณn
y objetivaciรณn.โ (Duval, 1999, pรกg. 34). En este sentido son externas y
conscientes toda vez que posibilitan al individuo comunicar su comprensiรณn
acerca de un objeto.
Se debe lograr la congruencia entre representaciones, posibilitando una
correspondencia semรกntica de los elementos significantes [de cada
representaciรณn.] (Duval, 1999, pรกg. 50) es decir que los elementos
caracterรญsticos del objeto permanezcan invariantes ante el cambio de registro
de representaciรณn.
Cuando se comparan dos representaciones, por ejemplo, la tabular y la grรกfica
โLas organizaciones respectivas de las unidades significante de las dos
representaciones comparadas, [conducen] a que las unidades en
correspondencia semรกntica sean aprehendidas en el mismo orden en las dos
representaciones. (Duval, 1999, pรกgs. 50-51)
Las transformaciones al interior de los registros, los tratamientos, las
transformaciones externas, y conversiones de un objeto matemรกtico evidencian
el grado de conceptualizaciรณn que ha alcanzado el estudiante.
24 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
Por รบltimo segรบn (Duval, 1999, pรกgs. 13,14) โโฆno puede haber comprensiรณn
en matemรกticas si no se distingue un objeto de su representaciรณn. Desde esta
perspectiva es esencial no confundir jamรกs los objetos matemรกticos, es decir,
los nรบmeros, las funciones, las rectas, etc., con sus representaciones, es decir,
las escrituras decimales o fraccionarias, los sรญmbolos, los grรกficos, los trazados
de figurasโฆ, pues un mismo objeto matemรกtico puede darse a travรฉs de
representaciones muy diferentesโฆes el objeto matemรกtico representado lo que
importa y no sus diversas representaciones semiรณticas posibles (Deledicq al,
1979). Toda confusiรณn entre el objeto y su representaciรณn provoca, en un plazo
mรกs o menos amplio, una pรฉrdida de comprensiรณn: los conocimientos
adquiridos se hacen rรกpidamente inutilizables por fuera de su contexto de
aprendizaje, sea por no recordarlos o porque permanecen como
representaciones โinertesโ que no sugieren ninguna trasformaciรณn productora.
En virtud de su pluralidad potencial, las diversas representaciones semiรณticas
de los objetos matemรกticas serรญa, pues, segundarias y extrรญnsecas a la
aprehensiรณn conceptual de los objetosโฆ โ
2.9 Situaciones Didรกcticas
Segรบn (Godino, 2003) citando a Brousseau
โโฆel conocimiento existe y tiene sentido para el sujeto cognoscente sรณlo porque
representa una soluciรณn รณptima en un sistema de restricciones (Brousseau, 1986,
pรกg. 368)...โ
De acuerdo a esta teorรญa, el profesor puede diseรฑar artificialmente diferentes
situaciones con ciertas restricciones, que guiaran a los estudiantes en la
construcciรณn de nuevos conocimientos o en otros casos a modificar sus
conocimientos previos.
Brousseau, propone varios tipos de situaciones didรกcticas, cuya secuenciaciรณn
puede provocar la gรฉnesis artificial de un concepto matemรกtico. Dichos tipos de
situaciones son las siguientes:
MARCO TEรRICO 25
Tipos de situaciones didรกcticas propuestas por Brousseau (Godino, 2003)
1) Situaciones centradas sobre โla acciรณnโ
Son las situaciones en las que los estudiantes intentan, por primera vez,
resolver por sus propios medios, un problema planteado por el profesor.
2) Situaciones centradas en la โcomunicaciรณnโ
En este tipo de situaciones los estudiantes deben comunicar a sus
compaรฑeros y su profesor los resultados parciales o finales alcanzados al
intentar encontrar la soluciรณn al problema propuesto.
3) Situaciones centradas sobre la โvalidaciรณnโ
En estas situaciones los estudiantes deben argumentar sus hallazgos,
utilizando formalmente los conocimientos matemรกticos de los que disponen,
dejando de lado las simples conjeturas basadas en experiencia empรญricas.
4) Situaciones de institucionalizaciรณn
En este punto los estudiantes, despuรฉs de un proceso de diรกlogo con sus
compaรฑeros y con su profesor, resumen los procedimientos, las ideas y los
conceptos matemรกticos de acuerdo a la terminologรญa utilizada de forma
oficial.
En cada uno de los momentos de la clase ya mencionados se da un componente
que Brousseau designa como โadidรกcticoโ, en el que son los estudiantes los
responsables de gestionar autรณnomamente la situaciรณn en un tiempo y un espacio
determinado por el profesor.
3. Propuesta Didรกctica
3.1 Prueba diagnรณstica
Antes de iniciar la implementaciรณn de la propuesta se realiza una prueba
diagnรณstica en dos fases para determinar si los estudiantes cuentan con
conocimientos sobre el cรกlculo de probabilidades en una tabla de contingencias.
En la primera fase se propone que solucionen un cuestionario adaptado de un
ejercicio del libro โEstadรญstica Elemental de Freund John E. y Simรณn, G. A. (1992)โ.
(Ver Anexo A)
Se realiza una encuesta a 260 solteros, 400 casados y 340 viudos o divorciados,
sobre los aspectos que mรกs contribuyen a su felicidad. Los resultados se muestran
en la siguiente tabla.
Tabla 8: Datos cuestionario introductorio
Solteros Casados Divorciados o
viudos
Amigos y vida social 140 200 160
Trabajo/Estudio 40 120 120
Salud y condiciรณn fรญsica 80 80 60
Teniendo en cuenta la informaciรณn de la tabla de contingencias, los estudiantes
deben contestar preguntas como las siguientes:
PROPUESTA DIDรCTICA 27
1) Si se desea cuantificar la posibilidad de seleccionar una persona que
asegure que se siente mรกs feliz cuando esta con sus amigos departiendo en
reuniones sociales, en el estadio o en paseos. ยฟEl procedimiento sugerido
es?
2) Si se desea cuantificar la posibilidad de seleccionar una persona soltera que
asegure que se siente mรกs feliz cuando esta con sus amigos departiendo en
reuniones sociales, en el estadio o en paseos. ยฟEl procedimiento sugerido
es?
3) Si se desea cuantificar la posibilidad de seleccionar una persona divorciada
o viuda que asegure que se siente mรกs feliz cuando esta con sus amigos
departiendo en reuniones sociales, en el estadio o en paseos. ยฟEl
procedimiento sugerido es?
En la segunda fase se presenta a los estudiantes un Applet en GeoGebra (ver
anexo B) para familiarizarlos con las ventajas de organizar informaciรณn en tablas
de contingencia y adicionalmente mostrar que a partir de la informaciรณn registrada
es posible calcular:
1) Frecuencias por filas y columnas
2) Porcentajes
3) Razones que posteriormente se utilizarรกn para el cรกlculo de probabilidades
Figura 2: Applet, Prueba Introductoria Tablas de Contingencia
28 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
El Applet tambiรฉn permite mostrar a los estudiantes las representaciones grรกficas
de las tablas de contingencias utilizando diagramas de barras apilados y adosados.
Una vez los estudiantes han desarrollado el Applet, se pide que en clase contesten
preguntas como las siguientes:
1) ยฟQuรฉ frecuencias absolutas permiten calcular las siguientes probabilidades?
a. Probabilidad de seleccionar un estudiante que sea mujer y prefiera la
clase de Danzas.
b. Probabilidad de seleccionar un estudiante que sea hombre y prefiera la
clase de Sociales.
2) ยฟQuรฉ frecuencias relativas permiten calcular las siguientes probabilidades?
a. La probabilidad de que sea hombre si se sabe que prefiere las
matemรกticas.
b. La probabilidad de que prefiera a clase de sociales si se sabe que es
mujer.
3) ยฟCuรกl es la probabilidad de seleccionar un estudiante que sea mujer?
4) ยฟCuรกl es la probabilidad de seleccionar un estudiante que prefiera la clase de
danzas?
3.2 Problema Introductorio a Tablas de Contingencias 2x2
Se propone a los estudiantes la siguiente situaciรณn:
Se ha realizado un estudio a 90 bachilleres entre los 19 y 22 aรฑos, para determinar
quiรฉnes tienen mayor posibilidad de seguir sus estudios en instituciones de
educaciรณn superior.
PROPUESTA DIDรCTICA 29
El diseรฑo de la encuesta es el siguiente:
1) Indique el estrato socioeconรณmico al cual pertenece
1 2 3 4 5 6 O O O O O O
2) ยฟActualmente estรก matriculado en una instituciรณn de educaciรณn superior?
Si__ No__
Los resultados se registraron en la siguiente tabla de contingencias 2X2:
Tabla 9: Modelo Tabla de Contingencias Problema Introductorio
TC ๐ต1 ๐ต2 Totales
๐ด1 24 16 40
๐ด2 30 20 50
Totales 54 36 90
En donde las variables categรณricas se han definido asรญ:
๐ด1: Pertenece a los estratos socioeconรณmicos 4, 5 o 6
๐ด2: Pertenece a los estratos socioeconรณmicos 1, 2 o 3
๐ต1: Esta matriculado en una instituciรณn de educaciรณn superior
๐ต2: No estรก matriculado en ninguna instituciรณn de educaciรณn superior
Los estudiantes deben contestar preguntas como las siguientes:
1) ยฟLa probabilidad de seleccionar un estudiante que este matriculado en la
universidad y no pertenezca al estratos socioeconรณmicos 4, 5 o 6, es?
2) ยฟLa probabilidad de seleccionar un estudiante que pertenezca a los estratos
socioeconรณmicos 4, 5 o 6 y no este matriculado en alguna instituciรณn de
educaciรณn superior, es?
30 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
3) ยฟLa probabilidad de escoger aleatoriamente una persona que en la
actualidad no estรฉ estudiando es de?
4) ยฟLa probabilidad de seleccionar al azar una persona que pertenezca al
estrato socioeconรณmico 1, 2 o 3 es de?
5) Si se sabe que la persona seleccionada estรก matriculada en una instituciรณn
de educaciรณn superior ยฟLa probabilidad de que pertenezca a estrato
socioeconรณmico 4, 5 o 6 es de?
6) Si se sabe que la persona seleccionada pertenece a los estratos 1, 2 o 3
ยฟLa probabilidad de que no estรฉ matriculada en una instituciรณn de educaciรณn
superior es de?
Al finalizar esta actividad y despuรฉs de discutir los diferentes resultados obtenidos
por los estudiantes, se procede a formalizar los procedimientos que se deben
utilizar para analizar la informaciรณn registrada en tablas de contingencias 2X2.
Tabla 10: Tabla para la formalizaciรณn de cรกlculos en Tablas de Contingencia
TC ๐ต1 ๐ต2 Totales
๐ด1 ๐ ๐ ๐ + ๐ ๐ด2 ๐ ๐ ๐ + ๐
Totales ๐ + ๐ ๐ + ๐ ๐ = ๐ + ๐ + ๐ + ๐
Cรกlculo de Probabilidades Conjuntas
๐(๐ด1 โฉ ๐ต1) = ๐๐ = ๐
๐+๐+๐+๐=
๐
๐ (28) ๐(๐ด1 โฉ ๐ต2) = ๐๐ =
๐
๐+๐+๐+๐=
๐
๐ (29)
๐(๐ด2 โฉ ๐ต1) = ๐๐ = ๐
๐+๐+๐+๐ =
๐
๐ (30) ๐(๐ด2 โฉ ๐ต2) = ๐๐ =
๐
๐+๐+๐+๐=
๐
๐ (31)
PROPUESTA DIDรCTICA 31
Cรกlculo de Probabilidades Marginales
๐(๐ต1) = ๐+๐
๐+๐+๐+๐=
๐+๐
๐ (32) ๐(๐ต2) =
๐+๐
๐+๐+๐+๐=
๐+๐
๐ (33)
๐(๐ด1) = ๐+๐
๐+๐+๐+๐=
๐+๐
๐ (34) ๐(๐ด2) =
๐+๐
๐+๐+๐+๐ =
๐+๐
๐; (35)
Probabilidades Condicionales
๐(๐ต1|๐ด1) = ๐
๐+๐ (36) ๐(๐ต2|๐ด1) =
๐
๐+๐ (37)
๐(๐ด1|๐ต1) = ๐
๐+๐ (38) ๐(๐ด2|๐ต1) =
๐
๐+๐ (39)
Cuando se analiza la informaciรณn de una tabla de contingencias, no solo interesan
los cรกlculos de las probabilidades que ya se mencionaron, es muy importante
evaluar la independencia entre sus variables, por ello es indispensable verificar si
las probabilidades de los eventos ๐ด1, ๐ด2, ๐ต1 y ๐ต2 cumplen con las siguientes
condiciones de independencia.
Condiciones para verificar independencia:
1) La probabilidad de ocurrencia de (๐ด1) es independiente de la ocurrencia o no
ocurrencia de (๐ต1)
๐(๐ด1) = ๐(๐ด1|๐ต1)
2) La probabilidad de ocurrencia de (๐ต1) es independiente de la ocurrencia o no
ocurrencia de (๐ด1)
๐(๐ต1) = ๐(๐ต1|๐ด1)
3) La probabilidad conjunta de los eventos (๐ด1) y (๐ต1) es igual al producto de sus
probabilidades marginales
๐(๐ด1 โฉ ๐ต1) = ๐(๐ด1)๐(๐ต1)
32 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
Por รบltimo se orienta a los estudiantes en la construcciรณn de diagramas de barras
apilados y adosados para resumir grรกficamente la informaciรณn de la tabla de
contingencias.
3.3 Modelo Geomรฉtrico de una Tabla de Contingencias
2X2
Despuรฉs de utilizar diagramas de barras apilados y adosados se hacen las
siguientes preguntas a los estudiantes:
ยฟEs posible diseรฑar una representaciรณn grรกfica que de razรณn de las probabilidades
que se pueden calcular a partir de tablas de contingencia de dos filas y dos
columnas?
ยฟQuรฉ caracterรญsticas debe tener este modelo grรกfico?
ยฟCรณmo se puede verificar que realmente representa la informaciรณn registrada en la
tabla de contingencias?
Despuรฉs de discutir algunas alternativas propuestas se sugiere el siguiente
procedimiento:
Dada una tabla de contingencias como la que se muestra a continuaciรณn, dibujar
un cuadrado que permita representar la participaciรณn de la probabilidad de cada
uno de los eventos: ๐, ๐, ๐ y ๐ ; con relaciรณn a la probabilidad total.
Tabla 11: Modelo de tabla de contingencias 2X2 para elaborar la representaciรณn
grรกfica del modelo geomรฉtrico propuesto
TC 01 ๐ต1 ๐ต2 Totales
๐ด1 ๐ ๐ ๐ + ๐
๐ด2 ๐ ๐ ๐ + ๐
Totales ๐ + ๐ ๐ + ๐ ๐ + ๐ + ๐ + ๐ = ๐
PROPUESTA DIDรCTICA 33
Para establecer las razones que permitirรกn calcular diferentes probabilidades de la
tabla de contingencias, utilizando el modelo geomรฉtrico, se deben tener en cuenta
las siguientes consideraciones:
1) El รกrea total del cuadrado representarรก la ocurrencia de todos los eventos
registrados en la tabla de contingencias.
2) Horizontalmente el cuadrado se dividirรก en dos regiones (๐ + ๐) y (๐ + ๐)
3) Verticalmente el cuadrado se dividirรก en dos regiones (๐ + ๐) y (๐ + ๐)
4) El รกrea total del cuadrado serรก igual a ๐2, en donde ๐2 = (๐ + ๐ + ๐ + ๐)2
5) El cuadrado quedarรก dividido en cuatro รกreas mรกs pequeรฑas
๐ด๐ = (๐ + ๐)(๐ + ๐) (40) ๐ด๐ = (๐ + ๐)(๐ + ๐) (41) ๐ด๐ = (๐ + ๐)(๐ + ๐) (42) ๐ด๐ = (๐ + ๐)(๐ + ๐) (43)
Si el modelo geomรฉtrico funciona, entonces:
Las probabilidades marginales por columna y fila pueden ser calculadas asรญ:
๐(๐ด1) = ๐ด๐+๐ด๐
๐2 (44) ๐(๐ด2) = ๐ด๐+๐ด๐
๐2 (45)
๐(๐ต1) = ๐ด๐+๐ด๐
๐2 (46) ๐(๐ต2) = ๐ด๐+๐ด๐
๐2 (47)
Figura 3: Modelo Geomรฉtrico de una tabla de contingencias 2X2
34 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
Las probabilidades conjuntas pueden ser calculadas asรญ:
๐(๐ด1 โฉ ๐ต1) = ๐๐ = ๐ด๐
๐2 (48) ๐(๐ด1 โฉ ๐ต2) = ๐๐ = ๐ด๐
๐2 (49)
๐(๐ด2 โฉ ๐ต1) = ๐๐ = ๐ด๐
๐2 (50) ๐(๐ด2 โฉ ๐ต2) = ๐๐ = ๐ด๐
๐2 (51)
Algunas de las probabilidades condicionales pueden ser calculadas asรญ:
๐(๐ด1|๐ต1) = ๐ด๐
๐ด๐+๐ด๐ (52) ๐(๐ด2|๐ต1) =
๐ด๐
๐ด๐+๐ด๐ (53)
๐(๐ต1|๐ด1) = ๐ด๐
๐ด๐+๐ด๐ (54) ๐(๐ต2|๐ด1) =
๐ด๐
๐ด๐+๐ด๐ (55)
Ejemplo 01:
Utilizar el modelo geomรฉtrico propuesto para analizar la informaciรณn de la siguiente
tabla de contingencias y calcular las probabilidades que se solicitan a continuaciรณn:
Tabla 12: Tabla Ejemplo 01
TC ๐ต1 ๐ต2 Totales
๐ด1 42 18 60
๐ด2 14 6 20
Totales 56 24 80
1) Las probabilidades marginales
2) Las probabilidades conjuntas
3) Las siguientes probabilidades condicionales
๐(๐ต1|๐ด1); ๐(๐ต2|๐ด1); ๐(๐ด1|๐ต1) y ๐(๐ด2|๐ต1)
4) Verificar las condiciones de independencia para los eventos ๐ด1 y ๐ต1
5) Repetir los cรกlculos tomando la informaciรณn directamente de la tabla y
verificar si difieren o no los resultados, si esto ocurre cuantificar el error de
los resultados del modelo geomรฉtrico propuesto.
PROPUESTA DIDรCTICA 35
Desarrollo
1) Probabilidades marginales
๐(๐ต1) = ๐ด๐+๐ด๐
๐2 =(56)(60)+(56)(20)
802 = (56)(60+20)
(80)2 =56(80)
802 =56
80= 0,7
๐(๐ต2) = ๐ด๐+๐ด๐
๐2 = (24)(60)+(24)(20)
802 =(24)(60+20)
(80)2 =(24)(80)
(80)2 =24
80= 0,3
๐(๐ด1) = ๐ด๐+๐ด๐
๐2 = (56)(60)+(24)(60)
(80)2 =(80)(60)
(80)2 =60
80= 0,75
๐(๐ด2) = ๐ด๐+๐ด๐
๐2 =
(56)(20)+(24)(20)
(80)2=
(80)(20)
(80)2=
20
80= 0,25
2) Probabilidades conjuntas utilizando la representaciรณn geomรฉtrica
๐(๐ด1 โฉ ๐ต1) = ๐๐ = ๐ด๐
๐2 = (56)(60)
(80)2 =3360
6400= 0,525
๐(๐ด1 โฉ ๐ต2) = ๐๐ = ๐ด๐
๐2 =(24)(60)
802 =1440
6400= 0,225
๐(๐ด2 โฉ ๐ต1) = ๐๐ = ๐ด๐
๐2 = (56)(20)
(80)2 =1120
6400= 0,175 y
Figura 4: Modelo Geomรฉtrico aplicado al ejemplo 01
36 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
๐(๐ด1 โฉ ๐ต2) = ๐๐ = ๐ด๐
๐2 = (24)(20)
(80)2 =480
6400= 0,075
La suma de las probabilidades conjuntas debe ser igual a 1
0,525 + 0,225 + 0,175 + 0,075 = 1.000
Antes de seguir adelante se debe mostrar que los cรกlculos de las probabilidades
corresponden realmente a la informaciรณn registrada en la tabla; para hacer esto se
sugiere el siguiente razonamiento:
Si se multiplica el total de la tabla de contingencias por cada una de las
probabilidades conjuntas, este producto debe coincidir con los valores observados.
๐ = 80
๐ = ๐(๐ด1 โฉ ๐ต1)(๐) = ๐(๐ด1 โฉ ๐ต1)(80) = (0,525)(80) = 42
๐ = ๐(๐ด1 โฉ ๐ต2)(๐) = ๐(๐ด1 โฉ ๐ต2)(80) = (0,225)(80) = 18
๐ = ๐(๐ด2 โฉ ๐ต1)(๐) = ๐(๐ด2 โฉ ๐ต1)(80) = (0,175)(80) = 14
๐ = ๐(๐ด2 โฉ ๐ต2)(๐) = ๐(๐ด2 โฉ ๐ต2)(80) = (0,075)(80) = 6
Los cรกlculos han pasado la prueba
3) Probabilidades Condicionales
๐(๐ต1|๐ด1) = ๐ด๐
๐ด๐+๐ด๐ =
(56)(60)
(56)(60)+(24)(60)=
(56)(60)
(80)(60)=
56
80= 0,7
๐(๐ต2|๐ด2) = ๐ด๐
๐ด๐+๐ด๐ =
(24)(60)
(56)(60)+(24)(60)=
(24)(60)
(80)(60)=
24
80= 0,3
๐(๐ด1|๐ต2) = ๐ด๐
๐ด๐+๐ด๐ =
(56)(60)
(56)(60)+(56)(20)=
(56)(60)
(56)(80)=
60
80= 0,75
๐(๐ด2|๐ต1) = ๐ด๐
๐ด๐+๐ด๐ =
(56)(20)
(56)(60)+(56)(20)=
(56)(20)
(56)(80)=
20
80= 0,25
PROPUESTA DIDรCTICA 37
4) Condiciones para verificar independencia
1) ๐(๐ด) = ๐(๐ด|๐ต)
๐(๐ด) = 0.75 y ๐(๐ด|๐ต) = 0.75
2) ๐(๐ต|๐ด) = ๐(๐ต)
๐(๐ต) = 0,7 y ๐(๐ต|๐ด) = 0,7
3) ๐(๐ด โฉ ๐ต) = ๐(๐ด)๐(๐ต)
๐(๐ด โฉ ๐ต) = 0,525 y ๐(๐ด)๐(๐ต) = (0,75)(0,70) = 0,525
Se cumplen las condiciones de independencia
5) Cรกlculos de probabilidad tomado la informaciรณn directamente de la tabla
Probabilidades conjuntas
๐(๐ด1 โฉ ๐ต1) = ๐๐ = ๐
๐ =
๐
๐+๐+๐+๐ =
42
80= 0,525
๐(๐ด1 โฉ ๐ต2) = ๐๐ = ๐
๐ =
๐
๐+๐+๐+๐ =
18
80= 0,225
๐(๐ด2 โฉ ๐ต1) = ๐๐ = ๐
๐ =
๐
๐+๐+๐+๐ =
14
80= 0,175
๐(๐ด2 โฉ ๐ต2) = ๐๐ = ๐
๐ =
๐
๐+๐+๐+๐ =
6
80= 0,075
Probabilidades Marginales
๐(๐ต) = ๐+๐
๐+๐+๐+๐=
๐+๐
๐ =
56
80= 0,70
๐(~๐ต) = ๐+๐
๐+๐+๐+๐=
๐+๐
๐ =
24
80= 0,30
38 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
๐(๐ด) = ๐+๐
๐+๐+๐+๐=
๐+๐
๐ =
60
80= 0,75
๐(~๐ด) = ๐+๐
๐+๐+๐+๐=
๐+๐
๐ =
20
80= 0,25
Probabilidades condicionales
๐(๐ต|๐ด) = ๐
๐+๐=
42
60 0,70 ๐(~๐ต|๐ด) =
๐
๐+๐=
18
60 = 0,30
๐(๐ด|๐ต) = ๐
๐+๐=
42
56 = 0,75 ๐(~๐ด|๐ต) =
๐
๐+๐=
14
56 = 0,25
Condiciones para verificar independencia
๐(๐ด) = ๐(๐ด|๐ต)
๐(๐ด) = 0.75 y ๐(๐ด|๐ต) = 0.75
๐(๐ต|๐ด) = ๐(๐ต)
๐(๐ต) = 0,7 y ๐(๐ต|๐ด) = 0,7
๐(๐ด โฉ ๐ต) = ๐(๐ด)๐(๐ต)
๐(๐ด โฉ ๐ต) = 0,525 y ๐(๐ด)๐(๐ต) = (0,75)(0,70) = 0,525
Se cumplen las condiciones de independencia
No se presentan diferencias entre los resultados del modelo propuesto y los
resultados obtenidos tomando la informaciรณn directamente de la tabla.
PROPUESTA DIDรCTICA 39
Ejercicio:
Utilizar el modelo geomรฉtrico propuesto para analizar la informaciรณn de las
siguientes tablas de contingencias y calcular las probabilidades que se solicitan a
continuaciรณn:
1) Las probabilidades marginales
2) Las probabilidades conjuntas
3) Las siguientes probabilidades condicionales
๐(๐ต|๐ด); ๐(~๐ต|๐ด); ๐(๐ด|๐ต) y ๐(~๐ด|๐ต)
4) Verificar las condiciones de independencia para los eventos A y B
5) Repetir los cรกlculos utilizando directamente la informaciรณn de la tabla y
verificar si difieren o no con los resultados obtenidos con el modelo
geomรฉtrico propuesto, si esto ocurre, se debe cuantificar el error o
diferencia.
Ejemplo 02:
Utilizar el modelo geomรฉtrico propuesto para representar la siguiente tabla de
contingencias y ademรกs calcular las probabilidades solicitadas utilizando los dos
mรฉtodos en paralelo:
Tabla 15: Informaciรณn ejemplo 02
TC ๐ต1 ๐ต2 Totales
๐ด1 36 12 48
๐ด2 8 24 32
Totales 44 36 80
Tabla 14: Ejercicio propuesto 02
TC B ~B Totales
A 14 16 30
~A 21 24 45
Totales 35 40 75
Tabla 13: Ejercicio propuesto 01
TC B ~B Totales
A 20 12 32
~A 30 18 48
Totales 50 30 80
40 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
1) Las probabilidades marginales
2) Las probabilidades conjuntas
3) Las siguientes probabilidades condicionales
๐(๐ต1|๐ด1); ๐(๐ต2|๐ด1); ๐(๐ด1|๐ต1) y ๐(๐ด2|๐ต1)
4) Verificar las condiciones de independencia para los eventos ๐ด1 y ๐ต1
5) Repetir los cรกlculos tomando directamente la informaciรณn de la tabla y verificar
si difieren o no con los resultados obtenidos utilizando el modelo geomรฉtrico, si
esto ocurre, cuantificar el error o diferencia.
Desarrollo
1) Cรกlculos con el modelo geomรฉtrico
Probabilidades marginales
๐(๐ต1) = ๐ด๐+๐ด๐
๐2 =
(44)(48)+(44)(32)
802=
(44)(48+32)
802=
(44)(80)
802=
44
80=
11
20= 0,55
๐(๐ต2) = ๐ด๐+๐ด๐
๐2 = =(36)(48)+(36)(32)
802 =(36)(80)
802 =36
80=
9
20= 0,45
๐(๐ด1) = ๐ด๐+๐ด๐
๐2 = (44)(48)+(36)(48)
802 =(80)(48)
802 =48
80=
3
5= 0,60
๐(๐ด2) = ๐ด๐+๐ด๐
๐2 =
(44)(32)+(36)(32)
802=
(80)(32)
(80)2=
32
80= 0,40
Figura 5: Modelo Geomรฉtrico aplicado al ejemplo 02
PROPUESTA DIDรCTICA 41
Probabilidades conjuntas
๐(๐ด1 โฉ ๐ต1) = ๐๐ = ๐ด๐
๐2 = (44)(48)
(80)2 =2112
6400= 0,330
๐(๐ด1 โฉ ๐ต2) = ๐๐ =๐ด๐
๐2 =(36)(48)
802 =1728
6400= 0,270
๐(๐ด2 โฉ ๐ต1) = ๐๐ = ๐ด๐
๐2 =
(44)(32)
(80)2=
1408
6400= 0,220
๐(๐ด2 โฉ ๐ต2) = ๐๐ = ๐ด๐
๐2 = (36)(36)
(80)2 =1152
6400= 0,180
La suma de todas las probabilidades conjuntas debe ser igual a 1
0,330 + 0,270 + 0,220 + 0,180 = 1.000
Probabilidades Condicionales
๐(๐ต1|๐ด1) = ๐ด๐
๐ด๐+๐ด๐ =
(44)(48)
(44)(48)+(36)(48)=
(44)(48)
(80)(48)=
44
80= 0,55
๐(๐ต2|๐ด1) = ๐ด๐
๐ด๐+๐ด๐ =
(36)(48)
(44)(48)+(36)(48) =
(36)(48)
(80)(48)=
36
80= 0,45
๐(๐ด1|๐ต1) = ๐ด๐
๐ด๐+๐ด๐ =
(44)(48)
(44)(48)+(44)(32)=
(44)(48)
(44)(80)=
48
80=
3
5= 0,60
๐(๐ด2|๐ต1) = ๐ด๐
๐ด๐+๐ด๐ =
(44)(32)
(44)(48)+(44)(32)=
(44)(32)
(44)(80)=
32
80=
2
5= 0,40
Condiciones para verificar independencia de los eventos ๐ด1 y ๐ต1
๐(๐ด1) = ๐(๐ด1|๐ต1)
๐(๐ด1) = 0,60 y ๐(๐ด1|๐ต1) = 0,60
๐(๐ต1) = ๐(๐ต1|๐ด1)
๐(๐ต1) = 0,55 y ๐(๐ต1|๐ด1) = 0,55
๐(๐ด1 โฉ ๐ต1) = ๐(๐ด1)๐(๐ต1)
๐(๐ด1 โฉ ๐ต1) = 0,330 y ๐(๐ด1)๐(๐ต1) = (0,60)( 0,55) = 0.330
42 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
Los eventos ๐ด1 y ๐ต1 son independientes de acuerdo a las probabilidades
calculadas con el modelo geomรฉtrico
2) Cรกlculos de probabilidad utilizando el mรฉtodo tradicional, tomado directamente
los valores registrados en cada una de las celdas de la tabla de contingencias.
Probabilidades marginales observadas
๐(๐ต1) = ๐+๐
๐+๐+๐+๐=
44
80= 0,55 ๐(๐ต2) =
๐+๐
๐+๐+๐+๐=
36
80= 0,45
๐(๐ด1) = ๐+๐
๐+๐+๐+๐=
48
80= 0,60 ๐(๐ด2) =
๐+๐
๐+๐+๐+๐=
32
80= 0,40
Probabilidades conjuntas observadas
๐(๐ด1 โฉ ๐ต1) = ๐๐ = ๐
๐ =
๐
๐+๐+๐+๐=
36
80= 0,45
๐(๐ด1 โฉ ๐ต2) = ๐๐ = ๐
๐ =
๐
๐+๐+๐+๐=
12
80= 0,15
๐(๐ด2 โฉ ๐ต1) = ๐๐ = ๐
๐ =
๐
๐+๐+๐+๐=
8
80= 0,10
๐(๐ด2 โฉ ๐ต2) = ๐๐ = ๐
๐ =
๐
๐+๐+๐+๐=
24
80= 0,300
Probabilidades condicionales observadas
๐(๐ต1|๐ด1) = ๐
๐+๐=
42
60= 0,70 ๐(๐ต2|๐ด1) =
๐
๐+๐=
18
60= 0,30
๐(๐ด1|๐ต1) = ๐
๐+๐=
42
56= 0,75 ๐(๐ด2|๐ต1) =
๐
๐+๐=
14
56= 0,25
PROPUESTA DIDรCTICA 43
Condiciones para verificar independencia de los eventos ๐ด1 y ๐ต1 de acuerdo a la
informaciรณn de los datos observados.
๐(๐ด1) = ๐(๐ด1|๐ต1)
๐(๐ด1) = 0,60 y ๐(๐ด1|๐ต1) = 0,75
No se cumple
๐(๐ต1) = ๐(๐ต1|๐ด1)
๐(๐ต1) = 0,55 y ๐(๐ต1|๐ด1) = 0,70
No se cumple
๐(๐ด1 โฉ ๐ต1) = ๐(๐ด1)๐(๐ต1)
๐(๐ด1 โฉ ๐ต1) = 0,45 y ๐(๐ด1)๐(๐ต1) = (0,60)( 0,55) = 0.33
No se cumple
No se cumple ninguna condiciรณn de independencia.
Se presentan diferencias entre los resultados obtenidos con el mรฉtodo tradicional,
y los calculados a partir del modelo geomรฉtrico. Para establecer que tanto se
diferencian estos resultados se deben calcular los valores esperados utilizando las
probabilidades dadas por el modelo geomรฉtrico.
Valores esperados de acuerdo al modelo geomรฉtrico
๐๐ = ๐(๐ด1 โฉ ๐ต1)(๐) = ๐(๐ด1 โฉ ๐ต1)(80) = (0,330)(80) = 26,400
๐๐ = ๐(๐ด1 โฉ ๐ต2)(๐) = ๐(๐ด1 โฉ ๐ต2)(80) = (0,270)(80) = 21,600
๐๐ = ๐(๐ด2 โฉ ๐ต1)(๐) = ๐(๐ด2 โฉ ๐ต1)(80) = (0,220)(80) = 17,600
๐๐ = ๐(๐ด2 โฉ ๐ต2)(๐) = ๐(๐ด2 โฉ ๐ต2)(80) = (0,180)(80) = 14,400
Para cuantificar el error se deben determinar las diferencias entre los valores
observados en la tabla de contingencias original, y los valores esperados dados
por el modelo geomรฉtrico.
44 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
โ๐ = (๐ โ ๐๐) = 36 โ 26,400 = 9,600 โ๐ = (๐ โ ๐๐) = 12 โ 21,600 = โ9,600
โ๐ = (๐ โ ๐๐) = 8 โ 17,600 = โ9,600 โ๐ = (๐ โ ๐๐) = 24 โ 14,400 = 9,600
Resumir los errores de los valores esperados en relaciรณn a los observados en una
tabla
Tabla 16: Tabla resumen de los errores entre los valores esperados y observados
TC ๐ต1 ๐ต2 Totales
๐ด1 โ๐๐ โ๐๐ โ๐๐ + โ๐๐
๐ด2 โ๐๐ โ๐๐ โ๐๐ + โ๐๐
Totales โ๐๐ + โ๐๐ โ๐๐ + โ๐๐ โ๐๐ + โ๐๐ + โ๐๐ + โ๐๐
Tabla 17: Resumen de los errores entre los valores esperados y observados
ejemplo 2
Si se tiene en cuenta el error sin importar el signo, el error total en relaciรณn a los
valores esperados de acuerdo al modelo geomรฉtrico es de: (4)(9,600) = 38,4
๐ธ๐๐๐บ = 38,4
Ahora bien, se ha calculado el error entre los datos observados y los esperados,
pero, ยฟcuรกl es el error entre las probabilidades observadas y las probabilidades
esperadas?
โ๐(๐) = (๐(๐) โ ๐(๐๐)) = (0,450 โ 0,330) = 0.12
โ๐(๐) = (๐(๐) โ ๐(๐๐)) = (0,150 โ 0,270) = โ0.12
โ๐(๐) = (๐(๐) โ ๐(๐๐)) = (0,100 โ 0,220) = โ0.12
โ๐(๐) = (๐(๐) โ ๐(๐๐)) = (0,300 โ 0,180) = 0.12
TC ๐ต1 ๐ต2 Totales
๐ด1 9,600 -9,600 0
๐ด2 -9,600 9,600 0
Totales 0 0 0
PROPUESTA DIDรCTICA 45
En una tabla se resumen los errores de las probabilidades esperadas en relaciรณn
a los valores de las probabilidades observadas
Tabla 18: Resumen de los errores entre las probabilidades esperadas y las
observadas
TC ๐ต1 ๐ต2 Totales
๐ด1 โ๐(๐) โ๐(๐) โ๐(๐) + โ๐(๐)
๐ด2 โ๐(๐) โ๐(๐) โ๐(๐) + โ๐(๐)
Totales โ๐(๐) + โ๐(๐) โ๐(๐) + โ๐(๐) โ๐(๐) + โ๐(๐) + โ๐(๐) + โ๐(๐)
Tabla 19: Resumen de los errores entre las probabilidades esperadas y las
observadas del ejemplo 2
TC ๐ต1 ๐ต2 Totales
๐ด1 0.120 โ0.120 0
๐ด2 โ0.120 0.120 0
Totales 0 0 0
Si sรณlo se tiene en cuenta el error sin importar el signo, el error total es:
(4)(0.120) = 0.48
A esto lo llamaremos error de las probabilidades calculadas con el modelo
geomรฉtrico en relaciรณn con las probabilidades observadas directamente en la tabla
de contingencias.
๐ธ๐๐๐บ = 0.48
Los errores totales que se han obtenido son una primera aproximaciรณn a medidas
o coeficientes que permiten establecer el grado de relaciรณn o asociaciรณn, entre las
variables de una tabla de contingencias 2X2; cuando se ha establecido que no se
cumplen las condiciones de independencia, y ademรกs se observa que existen
diferencias entre los valores calculados con las probabilidades del modelo
geomรฉtrico (valores esperados) y los valores observados.
46 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
3.4 Applets de GeoGebra primera fase
En la pรกgina oficial de GeoGebra se diseรฑa un libro interactivo con los siguientes
capรญtulos:
1) Modelo Geomรฉtrico
Muestra cรณmo se puede representar cualquier tabla de contingencias 2X2
en un cuadrado dividido en cuatro regiones.
2) Applet para evaluar probabilidades conjuntas y marginales
Permite a los estudiantes adquirir habilidad para calcular las probabilidades
conjuntas y marginales en una tabla de contingencias.
3) Applet para calcular probabilidades condicionales
Permite a los estudiantes adquirir habilidad para calcular probabilidades
condicionales.
3.5 Formalizaciรณn de la Asociaciรณn en Tablas de
Contingencias 2x2
PROBLEMA PROPUESTO
En la facultad de educaciรณn de una prestigiosa universidad se propone que el
estado debe financiar programas de aprendizaje de una segunda lengua en todos
los colegios, sobre todo en los grados conformados por estudiantes entre los 7 y
12 aรฑos de edad. Este programa puede contribuir en beneficiar a los estudiantes
en aspectos como los siguientes:
1) Mejorar procesos asociados a la memoria
2) Facilidad para interactuar en diferentes contextos (acadรฉmicos, culturales,
etc.)
3) Mayores oportunidades a nivel educativo y laboral
4) Mayor desarrollo de habilidades comunicativas
PROPUESTA DIDรCTICA 47
Para sustentar estadรญsticamente su propuesta la universidad realizรณ una
investigaciรณn que involucraba diferentes pruebas y entrevistas, con el fin de evaluar
el grado de desarrollo de las habilidades y beneficios ya mencionados. Los
resultados se resumen en las siguientes tablas de contingencias:
Tabla 20: Tablas de Contingencias Problema Propuesto
Grupo 01: Bachilleres graduados entre 1998 y
2003
Grupo 02: Bachilleres graduados entre 2004 y
2010
TC ๐ต1 ๐ต2 Totales
๐ด1 189 126 315
๐ด2 111 74 185
Totales 300 200 500
TC ๐ต1 ๐ต2 Totales
๐ด1 360 10 370
๐ด2 8 122 130
Totales 368 132 500
๐ด1: Bachiller de colegio bilingรผe con รฉnfasis en el aprendizaje de una segunda
lengua desde primaria.
๐ด2: Bachiller de colegio no bilingรผe sin รฉnfasis en el aprendizaje de una segunda
lengua.
๐ต1: Bachiller que en las pruebas y entrevistas muestra gran desarrollo de las
habilidades objeto de estudio y la posibilidad de mejores oportunidades a nivel
acadรฉmico o laboral.
๐ต2: Bachiller que en las pruebas y entrevistas no muestra gran desarrollo de las
habilidades objeto de estudio, y ademรกs reconoce que tiene pocas oportunidades
a nivel acadรฉmico o laboral.
Con el modelo geomรฉtrico propuesto representar las tablas de contingencias de los
dos grupos, y ademรกs calcular las probabilidades solicitadas a continuaciรณn:
1) Las probabilidades conjuntas
2) Las probabilidades marginales
3) Las siguientes probabilidades condicionales
๐(๐ด1|๐ต1); ๐(๐ด2|๐ต2); ๐(๐ต1|๐ด1) y ๐(๐ต2|๐ด2);
48 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
4) Verificar las condiciones de independencia para los eventos ๐ด1 y ๐ต1
5) Verificar las condiciones de independencia para los eventos ๐ด2 y ๐ต2
6) Repetir los cรกlculos tomando directamente los datos registrados en la tabla
de contingencias y verificar si difieren o no los resultados, si esto ocurre
cuantificar el error entre los resultados obtenidos con el modelo geomรฉtrico
y los calculados con el mรฉtodo tradicional.
Contestar:
1) ยฟLa universidad puede sustentar su propuesta con los resultados obtenidos
por su investigaciรณn?
2) ยฟExiste alguna relaciรณn entre ser bachiller de colegio bilingรผe con รฉnfasis en
el aprendizaje de una segunda lengua desde primaria, y tener la posibilidad
de mejores oportunidades a nivel acadรฉmico o laboral, junto con los demรกs
beneficios objeto de estudio de la investigaciรณn de la universidad?
3) ยฟEs posible cuantificar la relaciรณn ya mencionada, en un rango entre 0 y 1,
en donde 0 indica que no existe ningรบn tipo de relaciรณn y 1 que la reacciรณn
existe y es muy fuerte?
Despuรฉs de que los estudiantes han calculado las probabilidades solicitadas, y han
propuesto respuestas a las preguntas planteadas, se presentan en clase algunas
medidas de asociaciรณn que pueden ser utilizadas para analizar si las variables
involucradas en la tabla de contingencias tienen o no tienen alguna relaciรณn de
dependencia.
Para estimar la asociaciรณn se utilizan las siguientes medidas en el desarrollo de
ejercicios en clase y con los algunos Applets de GeoGebra
PROPUESTA DIDรCTICA 49
1) Riesgo relativo por columnas
๐ ๐ ๐ถ = ๐(๐ด1/๐ต1)
๐(๐ด1/๐ต2) =
๐/(๐+๐)
๐/(๐+๐)=
๐(๐+๐)
๐(๐+๐)
2) Riegos relativos por filas
๐ ๐ ๐น =๐(๐ต1/๐ด1)
๐(๐ต1/๐ด2)=
๐/(๐ + ๐)
๐/(๐ + ๐)=
๐(๐ + ๐)
๐(๐ + ๐)
3) Riesgos relativos cruzados
๐ ๐ถ = ๐๐
๐๐
4) Cรกlculo Chi-Cuadrado para evaluar las distancias entre los valores
observados y esperados
๐2 = โ(๐โ๐)2
๐
5) Phi de Pearson
Al formalizar en la clase la teorรญa sobre asociaciรณn en tablas de
contingencias, y las formas de evaluar tanto la dependencia de las variables
como el grado de asociaciรณn se utiliza el coeficiente de Phi de Pearson.
ฮฆ = โ๐2
๐ o ฮฆ =
๐๐ โ๐๐
โ(๐+๐)(๐+๐)(๐+๐ )(๐+๐ )
Puesto que, de acuerdo al modelo geomรฉtrico, (๐ + ๐)(๐ + ๐) = ๐จ๐ y
(๐ + ๐ )(๐ + ๐ ) = ๐จ๐ , es posible escribir este coeficiente de una forma mรกs
simple
ฮฆ =๐๐ โ๐๐
โ(๐จ๐)(๐จ๐ ) (56)
50 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
Para calificar el grado de asociaciรณn entre las variables de la tabla de contingencias
se propone a los estudiantes la siguiente escala o tabla de valores.
Tabla 21: Valores para la Interpretaciรณn del Phi de Pearson
Coeficiente de Asociaciรณn
Interpretaciรณn de la asociaciรณn entre las variables cualitativas de la tabla de contingencia
-1.000 Indirecta y perfecta
-1 a -0.500 Indirecta y alta
-0.499 a 0 Indirecta y moderada
0 Ninguna. Total independencia
0.00 a 4.99 Directa y moderada
0.500 a 1.00 Directa y alta
1.000 Directa y perfecta
3.6 Applets de GeoGebra segunda fase
Una vez los estudiantes estรฉn familiarizados con los cรกlculos de los riesgos
relativos, el cรกlculo de Chi-Cuadrado y de Phi de Pearson, tendrรกn acceso a los
siguientes Applets:
1) Applet para evaluar riesgos relativos y Phi de Pearson
Permite a los estudiantes adquirir habilidad para calcular riesgos relativos y
Phi de Pearson en una tabla de contingencias.
2) Applet para calcular riesgos relativos y analizar la asociaciรณn
Permite a los estudiantes adquirir habilidad en el cรกlculo de riesgos relativos,
coeficiente Phi de Pearson, y evaluar si los datos de una tabla de
contingencia presentan o no asociaciรณn y si es asรญ, determinar si la
asociaciรณn es directa, inversa, alta o moderada.
PROPUESTA DIDรCTICA 51
3) Applet para calcular Chi-Cuadrado y evaluar independencia
Permite a los estudiantes adquirir habilidad para calcular Chi-Cuadrado y
evaluar la independencia en una tabla de contingencias.
3.7 Tareas enviadas al Moodle del Colegio
Los estudiantes deberรกn enviar evidencias, una captura de pantalla, del desarrollo
de las diferentes actividades desarrolladas en GeoGebra al Moodle del colegio
3.8 Soluciรณn de un caso hipotรฉtico
Despuรฉs de formalizar las medidas de estimaciรณn de la asociaciรณn, se entregarรก a
los estudiantes un problema que debe ser analizado con lo aprendido y en el cual
se pide determinar si existe o no relaciรณn entre las variables de la tabla de
contingencias, ademรกs se solicita cuantificar el grado de asociaciรณn utilizando el
Phi de Pearson.
EVALUACIรN SOBRE TABLAS DE CONTINGENCIA
De acuerdo a la siguiente informaciรณn conteste las preguntas 1 a 3
Se ha realizado un estudio estadรญstico a quinientas personas, mayores de 25 aรฑos,
sobre el cuidado de su condiciรณn fรญsica y su vida social, en relaciรณn a episodios de
alto nivel de estrรฉs o ansiedad. Las dos preguntas de la encuesta fueron las
siguientes:
1) ยฟAsiste al gimnasio con regularidad (3 a 4 veces por semana), se reรบne
frecuentemente con sus amigos o conocidos en reuniones sociales, viaja
fuera de la ciudad, por lo menos una vez al mes, va al cine?
Si ____ No____
52 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
2) ยฟEn los รบltimos 3 aรฑos ha sentido altos niveles de estrรฉs o ansiedad en el
trabajo o en casa, en tres o mรกs ocasiones por aรฑo? Si ____ No____
Tabla 22: Problema Evaluaciรณn Tablas de Contingencias 2X2
Tabla de Contingencias ๐ฉ๐ ๐ฉ๐ Totales
๐จ๐ 255 78
๐จ๐ 108 59
Totales
๐ด1 = Asiste al gimnasio con regularidad (3 a 4 veces por semana), se reรบne con
sus amigos en reuniones sociales, viaja fuera de la ciudad los fines de semana o
va al cine con frecuencia
๐ด2 = No asiste al gimnasio con regularidad, menos de dos veces a la semana, se
reรบne muy ocasionalmente con sus amigos en reuniones sociales, viaja con poca
frecuencia fuera de la ciudad los fines de semana, o va al cine en muy pocas
ocasiones.
๐ต1 = En los รบltimos 3 aรฑos no ha sufrido o sentido episodios que le indique que
sufre de altos niveles de estrรฉs, o ansiedad en el trabajo o en casa, en tres
ocasiones o mรกs por aรฑo.
๐ต2 = En los รบltimos 3 aรฑos ha sufrido o sentido episodios que le indique que sufre
de altos niveles de estrรฉs o ansiedad en el trabajo o en casa, en tres ocasiones o
mรกs por aรฑo.
PROPUESTA DIDรCTICA 53
Contestar:
1) ยฟSe puede afirmar que sufrir de estrรฉs o ansiedad se relaciona muy
estrechamente con el cuidado de la condiciรณn fรญsica y la vida social?
2) ยฟQuรฉ tanto mรกs probable es que sufra de estrรฉs la persona que descuida
su condiciรณn fรญsica y su vida social, comparada con una persona preocupada
por su condiciรณn fรญsica y con una vida social mรกs activa?
3) ยฟEs vรกlido concluir que existe una muy alta independencia entre sufrir
episodios de ansiedad y no mantener una vida social activa o ejercitarse con
frecuencia?
4. Conclusiones y recomendaciones
4.1 Conclusiones
Las actividades propuestas permitieron a los estudiantes de grado once, del
Colegio Saludcoop Sur I.E.D. jornada tarde, familiarizarse con los conceptos de
tablas de contingencias, asociaciรณn entre variables cuantitativas, probabilidad
conjunta, marginal, condicional, e independencia estadรญstica entre dos eventos.
Ademรกs, en el desarrollo de la propuesta se diseรฑaron objetos virtuales de
aprendizaje, en GeoGebra, que facilitaron a los estudiantes el anรกlisis de la
informaciรณn registrada en diferentes tablas de contingencia y la elaboraciรณn de
diferentes representaciones grรกficas como son diagramas apilados, adosados y el
modelo geomรฉtrico, para calcular las probabilidades esperadas de eventos
estadรญsticamente independientes en tablas de contingencia 2X2.
El modelo geomรฉtrico ofrece una primera aproximaciรณn a una medida de
distanciamiento de los valores teรณricos ideales esperados para eventos
estadรญsticamente independientes en relaciรณn a valores observados en una tabla de
contingencias 2X2.
En el proceso de anรกlisis de la informaciรณn tomada para construir las tablas de
contingencias, se destacรณ la importancia que tienen las tablas de contingencias
para el estudio estadรญstico de variables cualitativas.
56 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE VARIABLES
ALEATORIAS CUALITATIVAS
4.2 Recomendaciones
Para futuras aplicaciones se recomienda:
Diseรฑar previamente problemas o situaciones muy simples que puedan ser
representadas con facilidad en los cuadernos o en hojas milimetradas
pequeรฑas.
Tener en cuenta que no todos los estudiantes tiene acceso a un computador
todo el tiempo y se deben buscar otras alternativas.
En lo posible el diseรฑo de los Applets debe considerar pantallas de
computador pequeรฑas, e incluso que funcionen en celulares.
Tener presente que las primeras situaciones o problemas deben diseรฑarse
de tal forma que las predicciones del Modelo Geomรฉtrico coincidan
exactamente con los cรกlculos que se pueden realizar con el mรฉtodo
tradicional; posteriormente se presenta a los estudiantes un ejercicio
diferente que servirรก de pretexto para iniciar conjeturas sobre la relaciรณn
entre la independencia y el grado de asociaciรณn entre las variables
categรณricas objeto de estudio.
A. Anexo: Cuestionario Evaluaciรณn Diagnรณstica 57
A. Anexo: Cuestionario Evaluaciรณn Diagnรณstica
Se realiza una encuesta a 260 solteros, 400 casados y 340 viudos o divorciados
sobre los aspectos que mรกs contribuyen a su felicidad. Los resultados se muestran
en la siguiente tabla. Ejercicio adaptado del libro de Estadรญstica Elemental de
Freund John E y Simon Gary A., pรกgina 361(1992)
Tabla 23: Tabla de Contingencias Evaluaciรณn Diagnรณstica
Solteros Casados Divorciados
o viudos
Amigos y vida social 140 200 160
Trabajo/Estudio 40 120 120
Salud y condiciรณn fรญsica 80 80 60
Teniendo en cuenta la informaciรณn de la tabla de contingencias, contestar:
1) Si se desea cuantificar la posibilidad de seleccionar una persona que asegure
que se siente mรกs feliz cuando estรก con sus amigos departiendo en reuniones
sociales, en el estadio o en paseos. ยฟEl procedimiento sugerido es?
2) Si se desea cuantificar la posibilidad de seleccionar una persona soltera que
asegure que se siente mรกs feliz cuando estรก con sus amigos departiendo en
reuniones sociales, en el estadio o en paseos. ยฟEl procedimiento sugerido es?
3) Si se desea cuantificar la posibilidad de seleccionar una persona divorciada o
viuda que asegure que se siente mรกs feliz cuando estรก con sus amigos
58 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE VARIABLES
ALEATORIAS CUALITATIVAS
departiendo en reuniones sociales, en el estadio o en paseos. ยฟEl procedimiento
sugerido es?
4) Si se desea cuantificar la posibilidad o calcular la probabilidad de seleccionar
una persona divorciada o viuda que asegure que se siente mรกs feliz cuando estรก
estudiando o estรก trabajando ยฟEl procedimiento sugerido es?
5) Si se sabe que la persona seleccionada estรก casada ยฟcuรกl es la probabilidad
que se sienta mรกs feliz cuando asiste al gimnasio o prรกctica algรบn deporte?
6) Si se ha escogido una persona que se siente un poco mรกs feliz en su trabajo o
estudiando ยฟcuรกl es la probabilidad de que sea soltera?
7) Si se ha escogido una persona que se siente mรกs feliz cuando estรก departiendo
con sus amigos en reuniones sociales ยฟcuรกl es la probabilidad de que sea
casada?
8) Si se sabe que la persona seleccionada piensa que el trabajo o el estudio es lo
mรกs importante para lograr su felicidad ยฟcuรกl es la probabilidad de que no sea
casada?
9) ยฟLa probabilidad de seleccionar una persona que no prefiera estar con sus
amigos en reuniones sociales o en paseos para sentirse feliz, es?
10) ยฟCuรกl es la probabilidad de seleccionar una persona que no prefiera realizar
actividad deportiva alguna para sentirse feliz?
Anexo B. Libro de GoGebra 59
B. Anexo: Libro de GeoGebra
Direcciรณn electrรณnica https://ggbm.at/TZf4Yzcs
Figura 6: Libro de GeoGebra
Figura 7: Applet Introductorio Informaciรณn de Tablas de Contingencia
60 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE VARIABLES
ALEATORIAS CUALITATIVAS
Capรญtulos del libro GeoGebra
Figura 8: Modelo Geomรฉtrico
Figura 10: Applet para el cรกlculo de Riesgos Relativos Figura 9: Applet para el cรกlculo de porbabilidades condiciones
Figura 11: Applet para calcular probabilidades conjuntas y marginales
Anexo C. Anรกlisis Algebraico del Modelo Geomรฉtrico 61
C. Anexo: Anรกlisis Algebraico del Modelo
Geomรฉtrico
A continuaciรณn se desarrolla un anรกlisis algebraico para determinar la equivalencia
entre el modelo geomรฉtrico propuesto, y los cรกlculos de probabilidades tomado
directamente la informaciรณn de la tabla de contingencias, modelo tradicional, con
variables categรณricas estadรญsticamente independientes.
Dada la siguiente tabla de contingencias, determinar si es posible establecer alguna
relaciรณn entre el modelo propuesto y el mรฉtodo tradicional al momento de calcular
las probabilidades conjuntas.
Tabla 24: Para el anรกlisis algebraico del modelo geomรฉtrico
TC B ~B Totales
A ๐ ๐ ๐ + ๐
~A ๐ ๐ ๐ + ๐
Total
es
๐ + ๐ ๐ + ๐ ๐ + ๐ + ๐ + ๐ = ๐
C1. Primer Procedimiento Propuesto
Tabla 25: Comparativo cรกlculo de probabilidades procedimiento 1
Cรกlculo de la Probabilidad Conjunta
Mรฉtodo tradicional
Cรกlculo de la Probabilidad Conjunta
Modelo geomรฉtrico propuesto
๐(๐ด โฉ ๐ต) = ๐๐ = ๐
๐ =
๐
(๐+๐+๐+๐)
๐(๐ด โฉ ๐ต) = ๐๐ = ๐ด๐
๐2 = (๐+๐)(๐+๐)
(๐+๐+๐+๐)2
62 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE VARIABLES
ALEATORIAS CUALITATIVAS
Puesto que con los dos modelos, el tradicional y el geomรฉtrico, se obtienen los
mismos resultados cuando los valores de la tabla de contingencia son
independientes, debe ser posible equipararlos.
๐
(๐ + ๐ + ๐ + ๐)=
(๐ + ๐)(๐ + ๐)
(๐ + ๐ + ๐ + ๐)2
๐ (๐ + ๐ + ๐ + ๐)2
(๐ + ๐ + ๐ + ๐)= (๐ + ๐)(๐ + ๐)
๐ (๐ + ๐ + ๐ + ๐) = (๐ + ๐)(๐ + ๐)
๐2 + ๐๐ + ๐๐ + ๐๐ = ๐2 + ๐๐ + ๐๐ + ๐๐
๐2 โ ๐2 + ๐๐ โ ๐๐ + ๐๐ โ ๐๐ + ๐๐ = ๐๐
๐๐ = ๐๐ (57)
๐
๐=
๐
๐
๐: ๐ โท ๐: ๐
C2. Segundo Procedimiento Propuesto
En este procedimiento alternativo se considera que lo que se registra en la tabla de
contingencias no son los valores observados, sino sus probabilidades de
ocurrencia, de tal modo que al sumarlas se tiene como resultado 1, dicho de otro
modo, esta nueva tabla muestra todas las probabilidades conjuntas y marginales
de todos los eventos consignados en la tabla original.
Tabla 26: Tabla de contingencias construida a partir de probabilidades
TC B ~B Totales
A ๐ ๐ ๐ + ๐
~A ๐ ๐ ๐ + ๐
Total
es
๐ + ๐ ๐ + ๐ ๐ + ๐ + ๐ + ๐ = ๐ = 1
Anexo C. Anรกlisis Algebraico del Modelo Geomรฉtrico 63
Tabla 27: Comparativo cรกlculo de probabilidades procedimiento 2
Cรกlculo de la Probabilidad Conjunta
Mรฉtodo tradicional
Cรกlculo de la Probabilidad Conjunta
Modelo geomรฉtrico propuesto
๐(๐ด โฉ ๐ต) = ๐๐ = ๐
๐ =
๐
(๐+๐+๐+๐)
Se considera que
๐ = ๐ + ๐ + ๐ + ๐ = 1
๐(๐ด โฉ ๐ต) = ๐
๐(๐ด โฉ ๐ต) = ๐๐ = ๐ด๐
๐2 = (๐+๐)(๐+๐)
(๐+๐+๐+๐)2
Se considera que
๐ = ๐ + ๐ + ๐ + ๐ = 1
๐(๐ด โฉ ๐ต) = (๐ + ๐)(๐ + ๐)
Puesto que con los dos modelos, el tradicional y el geomรฉtrico, se obtienen los
mismos resultados cuando los valores de la tabla de contingencia son
independientes, debe ser posible equipararlos
๐ = (๐ + ๐)(๐ + ๐)
๐ = ๐2 + ๐๐ + ๐๐ + ๐๐
๐ = ๐(๐ + ๐ + ๐) + ๐๐
Al sustituir (๐ + ๐ + ๐) por (1 โ ๐) tenemos:
๐ = ๐(1 โ ๐) + ๐๐
๐ = ๐ โ ๐๐ + ๐๐
๐ โ ๐ + ๐๐ = ๐๐
๐๐ = ๐๐
๐
๐=
๐
๐
๐: ๐ โท ๐: ๐
64 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE VARIABLES
ALEATORIAS CUALITATIVAS
Como con los dos procedimientos hemos logrado los mismos resultados, esto nos
sugiere que:
Si se establece que los datos observados presentan la proporciรณn geomรฉtrica
๐: ๐ โท ๐: ๐, posiblemente estamos frente a un caso en donde la tabla de
contingencias muestra datos estadรญsticamente independientes.
C3. Cรกlculo de Probabilidades con el Modelo
Geomรฉtrico y su relaciรณn con los Cรกlculos del
Mรฉtodo Tradicional
Para todos los cรกlculos se debe tener en cuenta que ๐๐ = ๐๐, puesto que el
modelo geomรฉtrico funciona con tablas de contingencia cuando sus eventos son
estadรญsticamente independientes.
Probabilidades Marginales
๐(๐ด) = ๐ด๐+๐ด๐
๐2 = (๐+๐)(๐+๐)+(๐+๐)(๐+๐)
(๐+๐+๐+๐)2 = (๐+๐+๐+๐)(๐+๐)
(๐+๐+๐+๐)2 =(๐+๐)
(๐+๐+๐+๐)=
(๐+๐)
๐
๐(~๐ด) = ๐ด๐+๐ด๐
๐2 =(๐+๐)(c+๐)+(๐+๐)(๐+๐)
(๐+๐+๐+๐)2 = (๐+๐+๐+๐)(c+๐)
(๐+๐+๐+๐)2 =(c+๐)
(๐+๐+๐+๐)=
(c+๐)
๐
๐(๐ต) = ๐ด๐+๐ด๐
๐2 =
(๐+๐)(๐+๐)+(๐+๐)(๐+๐)
(๐+๐+๐+๐)2 =
(๐+๐)(๐+๐+๐+๐)
(๐+๐+๐+๐)2=
(๐+๐)
(๐+๐+๐+๐)=
(๐+๐)
๐;
๐(~๐ต) = ๐ด๐+๐ด๐
๐2 = (๐+๐)(๐+๐)+(๐+๐)(๐+๐)
(๐+๐+๐+๐)2 =(๐+๐)(๐+๐+๐+๐)
(๐+๐+๐+๐)2 = (๐+๐)
(๐+๐+๐+๐)=
(๐+๐)
๐;
Probabilidades Condicionales
๐(๐ด|๐ต) = ๐ด๐
๐ด๐+๐ด๐=
(๐+๐)(๐+๐)
(๐+๐)(๐+๐)+(๐+๐)(๐+๐) =
(๐+๐)(๐+๐)
(๐+๐+๐+๐)(๐+๐) =
๐2+๐๐+๐๐+๐๐
(๐+๐+๐+๐)(๐+๐)
๐(๐ด|๐ต) =๐2 + ๐๐ + ๐๐ + ๐๐
(๐ + ๐ + ๐ + ๐)(๐ + ๐)=
๐(๐ + ๐ + ๐ + ๐)
(๐ + ๐ + ๐ + ๐)(๐ + ๐)=
๐
(๐ + ๐)
Anexo C. Anรกlisis Algebraico del Modelo Geomรฉtrico 65
๐(~๐ด|๐ต) = ๐ด๐
๐ด๐+๐ด๐ =
(๐+๐)(๐+๐)
(๐+๐)(๐+๐)+(๐+๐)(๐+๐)=
๐๐+๐๐+๐2+๐๐
(๐+๐)(๐+๐+๐+๐)
๐(~๐ด|๐ต) = ๐๐+๐๐+๐2+๐๐
(๐+๐)(๐+๐+๐+๐)=
๐(๐+๐+๐+๐)
(๐+๐)(๐+๐+๐+๐)=
๐
(๐+๐)
๐(๐ต|๐ด) = ๐ด๐
๐ด๐+๐ด๐ =
(๐+๐)(๐+๐)
(๐+๐)(๐+๐)+(๐+๐)(๐+๐)=
๐2+๐๐+๐๐+๐๐
(๐+๐)(๐+๐+๐+๐)
๐(๐ต|๐ด) = ๐2+๐๐+๐๐+๐๐
(๐+๐)(๐+๐+๐+๐)=
๐(๐+๐+๐+๐)
(๐+๐)(๐+๐+๐+๐)=
๐
(๐+๐)
๐(~๐ต|๐ด) = ๐ด๐
๐ด๐+๐ด๐=
(๐+๐)(๐+๐)
(๐+๐)(๐+๐)+(๐+๐)(๐+๐) =
๐๐+๐๐+๐๐+๐๐
(๐+๐+๐+๐)(๐+๐)
๐(~๐ต|๐ด) = ๐๐+๐๐+๐๐+๐๐
(๐+๐+๐+๐)(๐+๐)=
๐(๐+๐+๐+๐)
(๐+๐+๐+๐)(๐+๐)=
๐
(๐+๐)
Probabilidades Conjuntas
๐(๐ด โฉ ๐ต) = ๐๐ = ๐ด๐
๐2 = (๐+๐)(๐+๐)
(๐+๐+๐+๐)2 = ๐2+๐๐+๐๐+๐๐
(๐+๐+๐+๐)2 =๐2+๐๐+๐๐+๐๐
(๐+๐+๐+๐)2
๐(๐ด โฉ ๐ต) =๐(๐+๐+๐+๐)
(๐+๐+๐+๐)2 =๐
(๐+๐+๐+๐) =
๐
๐
๐(๐ด โฉ ~๐ต) = ๐๐ = ๐ด๐
๐2 = (๐+๐)(๐+๐)
(๐+๐+๐+๐)2 = ๐๐+๐2+๐๐+๐๐
(๐+๐+๐+๐)2 = ๐๐+๐2+๐๐+๐๐
(๐+๐+๐+๐)2
๐(๐ด โฉ ~๐ต) =๐(๐+๐+๐+๐)
(๐+๐+๐+๐)2 =๐
(๐+๐+๐+๐)=
๐
๐
๐(~๐ด โฉ ๐ต) = ๐๐ = ๐ด๐
๐2 = (๐+๐)(๐+๐)
(๐+๐+๐+๐)2 =๐๐+๐๐+๐2+๐๐
(๐+๐+๐+๐)2 =๐๐+๐๐+๐2+๐๐
(๐+๐+๐+๐)2
๐(~๐ด โฉ ๐ต) =๐(๐+๐+๐+๐)
(๐+๐+๐+๐)2 =๐
(๐+๐+๐+๐)=
๐
๐
66 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE VARIABLES
ALEATORIAS CUALITATIVAS
๐(~๐ด โฉ ~๐ต) = ๐๐ = ๐ด๐
๐2 = (๐+๐)(๐+๐)
(๐+๐+๐+๐)2 = ๐๐+๐๐+๐๐+๐2
(๐+๐+๐+๐)2 = ๐๐+๐๐+๐๐+๐2
(๐+๐+๐+๐)2
๐(~๐ด โฉ ~๐ต) = ๐(๐+๐+๐+๐)
(๐+๐+๐+๐)2 =๐
(๐+๐+๐+๐)=
๐
๐
Anexo D. Formula simplificada para calcular el coeficiente de Phi de Pearson 67
D. Fรณrmula simplificada para calcular el
coeficiente de Phi de Pearson
Comprobaciรณn de la equivalencia entre las siguientes expresiones para calcular el
coeficiente Phi de Pearson
ฮฆ = โ๐๐
๐ y ฮฆ =
๐๐ โ๐๐
โ(๐+๐)(๐+๐)(๐+๐ )(๐+๐ ) son equivalentes
Para el desarrollo de este procedimiento se sustituye ๐ por ๐ป como las suma de las
frecuencias absolutas de la tabla de contingencias 2X2
๐ = ๐ป = ๐ + ๐ + ๐ + ๐
Tabal de Contingencias, datos observados
๐ต1 ๐ต2 Total
๐ด1 ๐ ๐ ๐ + ๐
๐ด2 ๐ ๐ ๐ + ๐
Total ๐ + ๐ ๐ + ๐ ๐ = ๐ + ๐ + ๐ + ๐
Los valores esperados de la tabla de contingencias se calculan utilizando las
siguientes fรณrmulas:
๐๐ =(๐ + ๐)(๐ + ๐)
๐ ๐๐ =
(๐ + ๐)(๐ + ๐)
๐
๐๐ = (๐ + ๐)(๐ + ๐)
๐ ๐๐ =
(๐ + ๐)(๐ + ๐)
๐
68 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE VARIABLES
ALEATORIAS CUALITATIVAS
Cรกlculo de ๐2
๐2 = โ(๐โ๐)2
๐=
(๐โ๐๐)2
๐๐+
(๐โ๐๐)2
๐๐+
(๐โ๐๐)2
๐๐+
(๐โ๐๐)2
๐๐
(๐ โ ๐๐)2
๐๐
๐๐ =(๐ + ๐)(๐ + ๐)
๐
(๐ โ ๐๐)2
๐๐
๐๐ =(๐ + ๐)(๐ + ๐)
๐
(๐ โ(๐ + ๐)(๐ + ๐)
๐)
2
(๐ + ๐)(๐ + ๐)๐
(๐ โ(๐ + ๐)(๐ + ๐)
๐)
2
(๐ + ๐)(๐ + ๐)๐
(๐๐ โ (๐ + ๐)(๐ + ๐)
๐)
2
(๐ + ๐)(๐ + ๐)๐
(๐๐ โ (๐ + ๐)(๐ + ๐)
๐)
2
(๐ + ๐)(๐ + ๐)๐
( ๐๐ โ (๐ + ๐)(๐ + ๐))2
(๐)2
(๐ + ๐)(๐ + ๐)๐
(๐๐ โ (๐ + ๐)(๐ + ๐))2
(๐)2
(๐ + ๐)(๐ + ๐)๐
๐(๐๐ โ ๐2 โ ๐๐ โ ๐๐ โ ๐๐)2
(๐ + ๐)(๐ + ๐)(๐)2
๐(๐๐ โ ๐๐ โ ๐2 โ ๐๐ โ ๐๐)2
(๐ + ๐)(๐ + ๐)(๐)2
(๐(๐ โ ๐ โ ๐ โ ๐) โ ๐๐))2
(๐ + ๐)(๐ + ๐)๐
(๐(๐ โ ๐ โ ๐ โ ๐) โ ๐๐)2
(๐ + ๐)(๐ + ๐)๐
Anexo D. Formula simplificada para calcular el coeficiente de Phi de Pearson 69
Sustituciรณn
(๐ โ ๐ โ ๐ โ ๐) = ๐
Sustituciรณn
(๐ โ ๐ โ ๐ โ ๐) = ๐
(๐๐ โ ๐๐)2
(๐ + ๐)(๐ + ๐)๐
( ๐๐ โ ๐๐)2
(๐ + ๐)(๐ + ๐)๐
(๐ โ ๐๐)2
๐๐
๐๐ = (๐ + ๐)(๐ + ๐)
๐
(๐ โ ๐๐)2
๐๐
๐๐ =(๐ + ๐)(๐ + ๐)
๐
(๐ โ(๐ + ๐)(๐ + ๐)
๐)
2
(๐ + ๐)(๐ + ๐)๐
(๐ โ(๐ + ๐)(๐ + ๐)
๐)
2
(๐ + ๐)(๐ + ๐)๐
(๐๐ โ (๐ + ๐)(๐ + ๐)
๐)
2
(๐ + ๐)(๐ + ๐)๐
(๐๐ โ (๐ + ๐)(๐ + ๐)
๐)
2
(๐ + ๐)(๐ + ๐)๐
(๐๐ โ (๐ + ๐)(๐ + ๐))2
(๐)2
(๐ + ๐)(๐ + ๐)๐
(๐๐ โ (๐ + ๐)(๐ + ๐))2
(๐)2
(๐ + ๐)(๐ + ๐)๐
๐(๐๐ โ ๐๐ โ ๐๐ โ ๐2 โ ๐๐))2
(๐ + ๐)(๐ + ๐)(๐)2
๐(๐๐ โ ๐๐ โ ๐๐ โ ๐๐ โ ๐2))2
(๐ + ๐)(๐ + ๐)(๐)2
70 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE VARIABLES
ALEATORIAS CUALITATIVAS
(๐(๐ โ ๐ โ ๐ โ ๐) โ ๐๐))2
(๐ + ๐)(๐ + ๐)๐
Sustituciรณn
(๐ โ ๐ โ ๐ โ ๐) = ๐
(๐(๐ โ ๐ โ ๐ โ ๐) โ ๐๐))2
(๐ + ๐)(๐ + ๐)๐
Sustituciรณn
(๐ โ ๐ โ ๐ โ ๐) = ๐
(๐๐ โ ๐๐)2
(๐ + ๐)(๐ + ๐)๐
(๐๐ โ ๐๐)2
(๐ + ๐)(๐ + ๐)๐
๐2 =(๐๐ โ ๐๐)2
(๐ + ๐)(๐ + ๐)๐+
( ๐๐ โ ๐๐)2
(๐ + ๐)(๐ + ๐)๐+
(๐๐ โ ๐๐)2
(๐ + ๐)(๐ + ๐)๐+
(๐๐ โ ๐๐)2
(๐ + ๐)(๐ + ๐)๐
Sustituciรณn
(๐๐ โ ๐๐)2 = ( ๐๐ โ ๐๐)2
๐2 =(๐๐ โ ๐๐)2
(๐ + ๐)(๐ + ๐)๐+
( ๐๐ โ ๐๐)2
(๐ + ๐)(๐ + ๐)๐+
(๐๐ โ ๐๐)2
(๐ + ๐)(๐ + ๐)๐+
(๐๐ โ ๐๐)2
(๐ + ๐)(๐ + ๐)๐
Factorizando (๐๐ โ ๐๐)2 y ๐, tenemos:
๐2 = ((๐๐โ๐๐)2
๐) (
1
(๐+๐)(๐+๐)+
1
(๐+๐)(๐+๐)+
1
(๐+๐)(๐+๐) +
1
(๐+๐)(๐+๐))
Sumando las fracciones utilizando la propiedad asociativa, tenemos:
๐2 = ((๐๐ โ ๐๐)2
๐) (
(๐ + ๐) + (๐ + ๐)
(๐ + ๐)(๐ + ๐)(๐ + ๐)+
(๐ + ๐) + (๐ + ๐)
(๐ + ๐)(๐ + ๐)(๐ + ๐))
Sustituciรณn
๐ = ๐ + ๐ + ๐ + ๐
Anexo D. Formula simplificada para calcular el coeficiente de Phi de Pearson 71
๐2 = ((๐๐ โ ๐๐)2
๐) (
๐
(๐ + ๐)(๐ + ๐)(๐ + ๐)+
๐
(๐ + ๐)(๐ + ๐)(๐ + ๐))
Se factoriza nuevamente ๐ y simplificando
๐2 = (๐(๐๐ โ ๐๐)2
๐) (
1
(๐ + ๐)(๐ + ๐)(๐ + ๐)+
1
(๐ + ๐)(๐ + ๐)(๐ + ๐))
๐2 = ( (๐๐ โ ๐๐)2
1) (
1
(๐ + ๐)(๐ + ๐)(๐ + ๐)+
1
(๐ + ๐)(๐ + ๐)(๐ + ๐))
๐2 = ( (๐๐ โ ๐๐)2
1) (
(๐ + ๐) + (๐ + ๐)
(๐ + ๐)(๐ + ๐)(๐ + ๐)(๐ + ๐))
Sustituciรณn
๐ = ๐ + ๐ + ๐ + ๐
๐2 = ( (๐๐ โ ๐๐)2
1) (
๐
(๐ + ๐)(๐ + ๐)(๐ + ๐)(๐ + ๐))
๐2 = (๐ (๐๐ โ ๐๐)2
(๐ + ๐)(๐ + ๐)(๐ + ๐)(๐ + ๐))
ฮฆ = โ๐๐
๐ป= โ
๐ (๐๐ โ ๐๐)2
(๐ + ๐)(๐ + ๐)(๐ + ๐)(๐ + ๐)
๐ป๐
= โ๐ (๐๐ โ ๐๐)2
๐(๐ + ๐)(๐ + ๐)(๐ + ๐)(๐ + ๐)
72 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE VARIABLES
ALEATORIAS CUALITATIVAS
ฮฆ = โ (๐๐ โ ๐๐)2
(๐ + ๐)(๐ + ๐)(๐ + ๐)(๐ + ๐) =
๐๐ โ ๐๐
โ(๐ + ๐)(๐ + ๐)(๐ + ๐)(๐ + ๐)
Utilizando las definiciones de las รกreas del modelo geomรฉtrico se llega a la
siguiente expresiรณn simplificada
ฮฆ =๐๐ โ ๐๐
โ(๐จ๐)(๐จ๐ )
Anexo E. Actividades registradas en el Moodle del colegio 73
E. Actividades registradas en el Moodle del
colegio
Figura 12: Tareas en Moodle sobre tablas de contingencia
Bibliografรญa 75
Bibliografรญa
Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2008). Estadรญstica para
Adeministraciรณn y Economรญa. Mรฉxico: Cengage Learning Editores, S.A.
Anderson, D. R., Sweeney, D. J., Williams, T., Camm, J. D., & Cochran, J. J. (2015).
Estadรญstica para Negocio y Economรญa. Mรฉxico: Cengage Learning.
Artega, P., Batanero, C., Contreras, J. M., & Caรฑadas, G. (marzo de 2011). Las Tablas y
Grรกficos Estadรญsticos como Objetos Culturales. Numeros Revista de Didรกctica de
las Matemรกticas, 76, 55-67.
Batanero , C., Contreras, J., Dรญaz , C., & Roa, R. (2013). El sentido estadรญstico y su
desarrollo. Nรบmeros Revista de Didactica de las Matemรกtica, 7-18.
Batanero, C. (2002). Los Retos de la Cultura Estadรญstica. Buenos Aires, 2002.
Camarero Rioja, L. A. (2014). Acerca de las medidas de asociaciรณn en investigaciรณn
social: un viejo problema que conviene no olvidar. (U. N. Distancia, Ed.) Obtenido
de http://www2.uned.es/dpto-sociologia-
I/departamento_sociologia/luis_camarero/asociacion.pdf
Canavos, G. C. (1988). Probabilidades y Estadรญstica Aplicaciones y mรฉtodos. Naucalpan
de Juarez, Mรฉxico, Mรฉxico: McGraw-Hill Interamericana de Mรฉxico, S.A.
Caรฑadas, G. (2010). Las tablas de contingencia en la formaciรณn de profesionales de
Psicologรญa. Universidad de Granada.
76 TABLAS DE CONTINGENCIA PARA LA ENSEรANZA DEL CONCEPTO DE ASOCIACIรN ENTRE
VARIABLES ALEATORIAS CUALITATIVAS
Caรฑadas, G. (2013). Comprensiรณn intuitiva y aprendizaje formal de las tablas de
contingencia en alumnos de Psicologรญa. Granada, Espaรฑa: Universidad de
Granada. Obtenido de http://hdl.handle.net/10481/26383
Contreras, J. M., Caรฑadas, G., Gea, M. M., & Arteaga, P. (2012). Comprensiรณn de
Frecuencias y Representaciones Asociadas a las Tablas de Contingencia. En F.
Espaรฑa Pรฉrez, & M. B. Sรฉpulveda Lucena (Ed.), XIV Congreso de enseรฑanza y
aprendizaje de las matemรกticas "Diversidad y Matemรกticas" (pรกgs. 129-138).
Mรกlaga: Sociedad Andaluza de Educaciรณn Matemรกtica THALES. Obtenido de
http://thales.cica.es/xivceam/actas/pdf/actas.pdf
Contreras, J., Caรฑadas, G., & Artea, P. (Junio de 2013). Problemรกtica y recursos en la
interpretaciรณn de las tablas. Uniรณn Revista Iberoamericana de Educaciรณn
Matemรกtica, 86 - 95.
Dรญaz, C., & De la Fuente, E. (Diciembre de 2005). Conflictos semiรณticos en el cรกlculo de.
Biaix 24, 85-91.
Duval, R. (1999). Semiosis y Pensamiento Humano. Cali: Universidad de Valle Instituto
de Educaciรณn y Pedagogรญa Grupo de Educaciรณn Matemรกtica.
Freund, J. E., & Simon, G. A. (1992). Estadistica Elemental. Naucalpna de Juarez,
Mรฉxico, Mexรญco: Pearson Prentice Hall.
Godino, J. D. (2003). Teorรญa de las Funciones Semiรณticas. Granada: Universidad de
Granada.
Goldino, G., & Janvier, C. (1998). Representacion and the psychology of. Journal of
Mathematics Behaviour, 1-4.
Otero, J. V., & Medina Mora, E. (2005). Anรกlisis de datos cualitativos. Obtenido de
https://www.uam.es/personal_pdi/economicas/eva/pdf/tab_conting.pdf
Sanchez Rivero, M. (1998). Modelizaciรณn Estadรญstica de Tablas de Contingencia:
Aplicaciรณn Al Anรกlisis de la Demanda Turรญstica Espaรฑola. BADAJOZ,, Espaรฑa:
Universidad de Extremadura.
Bibliografรญa 77
Spiegel, M. R., & Stephens, L. J. (2009). Estadรญstica. Mรฉxico: McGraw-Hill Companies,
Inc.
Wild, C., & Pfannkuch, M. (1999). Statistical Thinking in Empirical Enquiry. International
Statistical, 67(3), 221-248. Obtenido de http://www.jstor.org/stable/1403699 .