variables bidimensional

18
Variables Bidimensionales 1. Relación funcional Dos variables x e y están relacionadas funcionalmente cuando conocida la primera se puede saber con exactitud el valor de la segunda. Ejemplo Si se deja caer una piedra, existe una fórmula que nos permite calcular exactamente, la altura a la que se encuentra en función del tiempo transcurrido. h = ½ g t². 2. Relación estadística Dos variables x e y están relacionadas estadísticamente cuando conocida la primera se puede estimar aproximadamente el valor de la segunda. Ejemplos Ingresos y gastos de una familia. Producción y ventas de una fábrica. Gastos en publicidad y beneficios de una empresa. Horas de estudio y calificaciones 3. Variable estadística bidimensional

Upload: leonardo-rivas-ramos

Post on 30-Sep-2015

12 views

Category:

Documents


9 download

DESCRIPTION

Variables Bidimensional

TRANSCRIPT

Variables Bidimensionales

1. Relacin funcionalDos variables x e y estn relacionadas funcionalmente cuando conocida la primera se puede saber con exactitud el valor de la segunda. EjemploSi se deja caer una piedra, existe una frmula que nos permite calcular exactamente, la altura a la que se encuentra en funcin del tiempo transcurrido.h = g t.

2. Relacin estadsticaDos variables x e y estn relacionadas estadsticamente cuando conocida la primera se puede estimar aproximadamente el valor de la segunda.EjemplosIngresos y gastos de una familia.Produccin y ventas de una fbrica.Gastos en publicidad y beneficios de una empresa.Horas de estudio y calificaciones

3. Variable estadstica bidimensionalUna variable bidimensional es una variable en la que cada individuo est definido por un par de caracteres, (X, Y). Estos dos caracteres son a su vez variables estadsticas en las que s existe relacin entre ellas, una de las dos variables es la variable independiente y la otra variable dependiente.

4. Distribuciones bidimensionalesSon aquellas en las que a cada individuo le corresponden los valores de dos variables, las representamos por el par (xi, yi).Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube de puntos o diagrama de dispersin.Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada recta de regresin.EjemploEl puntaje obtenido por 12 alumnos en las pruebas de Matemtica y Fsica en un curso son los siguientes:Matemticas23445667781010

Fsica1324446467910

5. Tabla Bidimensional Tabla de doble entrada. Est formada por tantas filas y columnas como valores tengamos de cada una de las variables, ms una fila y una columna ms para indicar los totales. Est indicada para casos con bastantes datos, en los que para cada valor de una variable, existen varios valores de la otra.

x1x2...xi...xmFrecuencia absoluta de la variable Y

y1f11f21...fi1...fm1fi1

y2f12f22...fi2...fm2fi2

........................

yjf1jf2j...fij...fmjfij

........................

ynf1nf2n...fin...fmnfin

Frecuencia absoluta de la variable Xf1jf2j...fij...f1nN

Escogiendo la primera y la ltima fila, tenemos la tabla estadstica correspondiente a la primera variable unidimensional. Con la primera y ltima columnas construimos la tabla correspondiente a la segunda variable unidimensional. Estas dos distribuciones reciben el nombre de distribuciones marginales. En la ltima celda aparecer el total de la ltima fila y de la ltima columna, es decir, el nmero total de elementos estudiados (N).Adems, en esta tabla puede resultar de inters estudiar distribuciones unidimensionales correspondientes a un valor determinado de alguna de las variables, llamadas distribuciones condicionadas.Ejemplo:En un curso de 30 alumnos y alumnas se ha realizado un estudio sobre el nmero de horas diarias de estudio X y el nmero de asignaturas reprobadas al final de curso Y, obteniendo los siguientes datos: (2,0) ; (2,2) ; (0,5) ; (2,1) ; (1,2) ; (2,1) ; (3,1) ; (4,0) ; (0,4) ; (2,2) ; (2,1) ; (2,1) ; (4,0) ; (3,1) ; (2,4) ; (2,1) ; (1,2) ; (2,1) ; (2,0) ; (3,0) ; (3,1) ; (2,2) ; (2,2) ; (2,1) ; (0,5) ; (1,3) ; (2,2) ; (2,1) ; (1,3) ; (1,4) Construir una tabla de doble entrada y calcular la media y la desviacin estndar de cada una de las variables.

Tabla de doble entradaY \ X01234Frec abs Y

02125

18311

2257

322

41113

522

Frec abs X35164230=n

Distribucin Marginal de Xxi fi

03

15

216

34

42

30

Distribucin Marginal de Yyifi

05

111

27

32

43

52

30

6. Covarianza

La covarianza de una variable bidimensional es la media aritmtica de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas.La covarianza se representa por sxy o xy.

La covarianza indica el sentido de la correlacin entre las variablesSi xy > 0 la correlacin es directa.Si xy < 0 la correlacin es inversa.La covarianza presenta como inconveniente, el hecho de que su valor depende de la escala elegida para los ejes.Es decir, la covarianza variar si expresamos la altura en metros o en centmetros. Tambin variar si el dinero lo expresamos en euros o en dlares.

Ejemplos1. El puntaje obtenido por 12 alumnos en las pruebas de Matemtica y Fsica son los siguientes:Matemticas23445667781010

Fsica1324446467910

Hallar la covarianza de la distribucin.xiyixi yi

212

339

428

4416

5420

6424

6636

7428

7642

8756

10990

1010100

7260431

Despus de tabular los datos hallamos las medias aritmticas:

2. Los valores de dos variables X e Y se distribuyen segn la tabla siguiente:Y/X024

1213

2142

3250

Hallar la covarianza de la distribucin.En primer lugar convertimos la tabla de doble entrada en tabla simple y calculamos las medias aritmticas.xiyifixi fiyi fixi yi fi

012020

021020

032060

211212

2248816

235101530

41312312

4228416

20404176

7. Correlacin

La correlacin trata de establecer la relacin o dependencia que existe entre las dos variables que intervienen en una distribucin bidimensional.Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables estn correlacionadas o que hay correlacin entre ellas.Tipos de correlacin1 Correlacin directaLa correlacin directa se da cuando al aumentar una de las variables la otra aumenta.La recta correspondiente a la nube de puntos de la distribucin es una recta creciente.

2 Correlacin inversaLa correlacin inversa se da cuando al aumentar una de las variables la otra disminuye. La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente.

3 Correlacin nulaLa correlacin nula se da cuando no hay dependencia de ningn tipo entre las variables.En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.

Grado de correlacinEl grado de correlacin indica la proximidad que hay entre los puntos de la nube de puntos. Se pueden dar tres tipos:1. Correlacin fuerteLa correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.

2. Correlacin dbilLa correlacin ser dbil cuanto ms separados estn los puntos de la recta.

3. Correlacin nula El coeficiente de correlacin lineal es el cociente entre la covarianza y el producto de las desviaciones tpicas de ambas variables.El coeficiente de correlacin lineal se expresa mediante la letra r.

Propiedades del coeficiente de correlacin1. El coeficiente de correlacin no vara al hacerlo la escala de medicin. Es decir, si expresamos la altura en metros o en centmetros el coeficiente de correlacin no vara.2. El signo del coeficiente de correlacin es el mismo que el de la covarianza.Si la covarianza es positiva, la correlacin es directa.Si la covarianza es negativa, la correlacin es inversa.Si la covarianza es nula, no existe correlacin.

3. El coeficiente de correlacin lineal es un nmero real comprendido entre 1 y 1.1 r 14. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es dbil.7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional.

EjemplosEl puntaje obtenido por 12 alumnos en las pruebas de Matemticas y Fsica son los siguientes:Matemticas23445667781010

Fsica1324446467910

Hallar el coeficiente de correlacin de la distribucin e interpretarlo.xiyixi yixi2yi2

21241

33999

428164

44161616

54202516

64243616

66363636

74284916

76424936

87566449

1099010081

1010100100100

7260431504380

1 Hallamos las medias aritmticas.

2 Calculamos la covarianza.

3 Calculamos las desviaciones estndar.

4 Aplicamos la frmula del coeficiente de correlacin lineal.

Al ser el coeficiente de correlacin positivo, la correlacin es directa. Como coeficiente de correlacin est muy prximo a 1 la correlacin es muy fuerte.Los valores de dos variables X e Y se distribuyen segn la tabla siguiente:Y/X024

1213

2142

3250

Determinar el coeficiente de correlacin.Convertimos la tabla de doble entrada en tabla simple.xiyifixi fixi2 fiyi fiyi2 fixi yi fi

01200220

02100240

032006180

21124112

22481681616

2351020154530

41312483312

4228324816

2040120419776

Al ser el coeficiente de correlacin negativo, la correlacin es inversa. Como coeficiente de correlacin est muy prximo a 0 la correlacin es muy dbil.8. Recta de regresin

La recta de regresin es la que mejor se ajusta a la nube de puntos.La recta de regresin pasa por el punto llamado centro de gravedad.Recta de regresin de Y sobre XLa recta de regresin de Y sobre X se utiliza para estimar los valores de la Y a partir de los de la X.La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable X.

Recta de regresin de X sobre YLa recta de regresin de X sobre Y se utiliza para estimar los valores de la X a partir de los de la Y.La pendiente de la recta es el cociente entre la covarianza y la varianza de la variable Y.

Si la correlacin es nula, r = 0, las rectas de regresin son perpendiculares entre s, y sus ecuaciones son:y = x =

EjemploEl puntaje obtenido por 12 alumnos en una prueba de Matemticas y Fsica son los siguientes:Matemticas23445667781010

Fsica1324446467910

Hallar las rectas de regresin y representarlas.xiyixi yixi2yi2

21241

33999

428164

44161616

54202516

64243616

66363636

74284916

76424936

87566449

1099010081

1010100100100

7260431504380

1 Hallamos las medias aritmticas.

2 Calculamos la covarianza.

3 Calculamos las varianzas.

4Recta de regresin de Y sobre X.

4Recta de regresin de X sobre Y.