manejo de datos bivariados

20
MANEJO DE DATOS BIVARIADOS PROBABILIDAD Y ESTADÍSTICA UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE INGENIERÍA DIVISIÓN DE CIENCIAS BÁSICAS

Upload: carlos-simbron

Post on 11-Nov-2015

106 views

Category:

Documents


4 download

DESCRIPTION

Manejo de Datos Bivariados

TRANSCRIPT

ANLISIS DE DATOS BIVARIADOS

MANEJO DE DATOS BIVARIADOSPROBABILIDAD Y ESTADSTICA

UNIVERSIDAD NACIONAL AUTNOMA DE MXICOFACULTAD DE INGENIERADIVISIN DE CIENCIAS BSICASEn general una curva de regresin es una funcin que relaciona cada valor particular de x de una variable independiente X, con el correspondiente valor esperado de la variable independiente Y Esta funcin se encuentra obteniendo la esperanza de Y con la condicin X=x:

O bien:

Cuando las variables aleatorias son independientes en el sentido probabilstico, la distribucin condicional de Y dado x es igual a la distribucin marginal de Y, con lo cual, en el caso continuo:

Para obtener la curva de regresin de acuerdo con las expresin (1) es necesario establece la distribucin de probabilidad conjunta.Mtodos de estimacinExisten mtodos para estimar la curva de regresin a partir de una muestra representativa de la poblacin. Entre ellos se encuentran el mtodo grfico y el mtodo de los mnimos cuadrados.Mtodo GrficoSe basa en un diagrama denominado de dispersin , en el cual se encuentran graficados los n nmeros o puntos (Xi, Yi) con i=1,2..,n obtenidos de una muestra representativa.Lnea recta con pendiente positiva

b) Lnea recta con pendiente negativa c) Parbola

|

d) Ninguna relacin.

Este mtodo para estimar la curva de regresin es subjetivo y, por tal razn, cambia de una persona a otra

La curva de regresin de Y dado x es una lnea recta de la forma Donde a y b son constantes.Mtodo de los mnimos cuadradosConsiste en estimar la curva de regresin de Y dado x mediante una funcin y=f(x), de tal manera que para una muestra n se minimice la funcin D^2, tal que:

Donde yi son los valores muestrales de Y , cuya grfica se muestra a continuacin.

Mtodo de los mnimos cuadradosMtodo de los mnimos cuadradosSin detallar el procedimiento, se dar simplemente el resultado.

donde n es el nmero de medidas y representa la suma de todos los datos que se indican. Es importante notar que el mtodo de mnimos cuadrados se basa en las distancias verticales entre los puntos de la muestra y las ordenadas correspondientes de la recta y no toma en cuenta las distancias horizontales

CORRELACINEn probabilidad y estadstica, el concepto de correlacin indica la relacin que existe entre dos o ms variables aleatorias. Generalmente se habla de correlacin cuando se desea hacer predicciones de una variable aleatoria, dado que otra toma un valor determinado.La funcin referida es la curva de regresin, pues ella relaciona cada valor de la variable independiente x con el valor esperado de Y. y si la correlacin es perfecta, para cada x existe un solo valor de y, de manera que todos los posibles puntos (x,y) se encuentran en la curva de regresin de y dado x.CorrelacinCorrelacin perfecta b) Se puede considerar que existe correlacin , aunque no es perfecta.

Correlacinc) No existe correlacin Debido a que la correlacin est directamente relacionada con la dispersin de los datos con respecto a la curva de regresin, se define la desviacin estndar condicional de y dado x como:

CorrelacinUn buen estimador puntual de la desviacin estndar condicional de y dado x (llamado error estndar) es:

El coeficiente de correlacin de una muestra se define como el cociente de la covariancia entre el producto de las desviaciones estndar de cada variable, pero en este caso muestrales, de manera que:

CorrelacinEl coeficiente de correlacin es la medida de correlacin lineal mas utilizada pues, a diferencia de la covariancia y el error estndar, es adimensional y vara entre menos uno y uno, indicando mayor correlacin lnea cuando, en valor absoluto, se aproxima a la unidad.

EJEMPLO

EJEMPLO

EJEMPLO

EJEMPLO

EJEMPLO