distribuciones bidimensionales ((cuaderno para prof. jaime garcía)).docx
TRANSCRIPT
DISTRIBUCIONES BIDIMENSIONALES
Cuando una variable predice exactamente a la otra es una relacin funcional.Si la variable da aproximadamente la otra se dice que es una relacin estadstica.
Nota: En las relaciones tenemos siempre dos datos; Ejemplo de relaciones estadsticas:
Nota: Cuando tomamos toda la poblacin para el estudio se est realizando un censo, pero la estadstica se basa en una muestra representativa.
, La Covarianza es la media de las desviaciones lineales.
Covarianza Muestral: (Tambin conocida como la varianza)
Covarianza Poblacional:
La Desviacin es el grado de alejamiento de un dato con respecto a su media.
R= a + bx
Relacin estadstica mltiple
Tendencia lineal de sus variables, asociacin directa.
La relacin entre x e y se muestra en una ecuacin, para este caso:
R= a + bx
Figura 1. Comportamiento grfico de la recta[footnoteRef:1] [1: Recuperado de: http://wiki.monagas.udo.edu.ve/index.php?title=M%C3%ADnimos_Cuadrados_Regresi%C3%B3n_y_Correlaci%C3%B3n_Lineal_M%C3%BAltiple.&oldid=2996]
La variable independiente se denomina factor, y la variable dependiente se denomina respuesta.Coeficiente de Correlacin: Muestra que tanto una variable determina a la otra.
El coeficiente de correlacin debe estar entre -1 y 1. La covarianza y el coeficiente de correlacion sirven para medir el grado de asociacion entre las variables (x,y).Ejercicio: A partir de los siguientes datos de pesos y estaturas tomados de los estudiantes de la clase de estadstica I del segundo semestre de 2013, determine: Covarianza en el caso de los hombres, mujeres y de manera mixta. Coeficiente de Correlacin en el caso de los hombres, mujeres y de manera mixta.
Base Datos Mixtos
EstaturaPeso
1,5550
1,5753
1,651
1,650
1,648
1,650
1,660
1,650
1,664
1,6163
1,6149
1,6248
1,6464
1,6560
1,6855
1,6968
1,768
1,763
1,760
1,765
1,753
1,7158
1,7255
1,7260
1,7884
1,870
1,865
1,8265
Base Datos de Mujeres
EstaturaPeso
1,5550
1,5753
1,648
1,650
1,651
1,660
1,664
1,6149
1,6163
1,6248
1,6464
1,753
1,760
1,768
1,7884
1,650
1,650
Base Datos de Hombres
EstaturaPeso
1,6968
1,6855
1,763
1,8265
1,6560
1,7255
1,870
1,7260
1,865
1,7158
1,765
Solucin:1. Base Datos MixtosBase Datos Mixtos
EstaturaPeso
1,5511,55501501,039
1,5711,57531530,570
1,611,6511510,527
1,611,6501500,594
1,611,6481480,727
1,611,6501500,594
1,611,660160-0,074
1,611,6501500,594
1,611,664164-0,341
1,6111,6163163-0,233
1,6111,61491490,562
1,6211,62481480,510
1,6411,6464164-0,137
1,6511,6560160-0,019
1,6811,6855155-0,051
1,6911,69681680,211
1,711,7681680,302
1,711,7631630,136
1,711,7601600,037
1,711,7651650,203
1,711,753153-0,196
1,7111,7158158-0,039
1,7211,7255155-0,207
1,7211,72601600,059
1,7811,78841842,842
1,811,8701701,480
1,811,8651650,814
1,8211,82651650,936
2846,6728164911,440
0,01479,083
0,00934,726
0,00462,297
0,00479,083
0,004118,654
0,00479,083
0,0041,226
0,00479,083
0,00426,083
0,00316,869
0,00397,869
0,002118,654
0,00126,083
0,0001,226
0,00015,154
0,00182,940
0,00182,940
0,00116,869
0,0011,226
0,00137,297
0,00134,726
0,0020,797
0,00315,154
0,0031,226
0,013630,369
0,018123,369
0,01837,297
0,02337,297
Totales0,1491936,679
2. Base Datos de Mujeres
Base Datos de Mujeres
EstaturaPeso
1,5511,55501500,53
1,5711,57531530,22
1,611,6481480,25
1,634,85031500,57
1,611,6511510,16
1,611,660160-0,09
1,611,664164-0,20
1,6111,61491490,14
1,6111,6163163-0,11
1,6211,62481480,07
1,6411,64641640,09
1,711,753153-0,27
1,711,7601600,23
1,711,7681680,81
1,7811,78841844,13
Totales:1727,68179656,52
EstaturaPeso
1,5510,0065045,76
1,5710,0035314,17
1,610,0014876,82
1,630,00250137,28
1,610,0015133,23
1,610,0016010,47
1,610,0016452,35
1,6110,0004960,29
1,6110,0006338,88
1,6210,0004876,82
1,6410,0006452,35
1,710,0055314,17
1,710,0056010,47
1,710,00568126,23
1,7810,02384741,76
0,051491,06
3. Base Datos de Hombres
Base Datos de Hombres
EstaturaPeso
1,6511,6560600,17
1,6811,6855550,33
1,6911,696868-0,21
1,711,76363-0,02
1,711,76565-0,07
1,7111,7158580,07
1,7211,7255550,05
1,7211,7260600,01
1,811,870700,58
1,811,865650,21
1,8211,8265650,26
Totales:1118,996841,37
EstaturaPeso
1,6510,0064604,75
1,6810,00255551,55
1,6910,00166838,87
1,710,0009630,67
1,710,0009657,95
1,7110,00045811,47
1,7210,00015551,55
1,7210,0001604,75
1,810,0049707,95
1,810,00496561,15
1,8210,0081657,95
0,0299249,61
MOMENTOS
Son medidas para calcular los parmetros y/o estadsticos que caracterizan una poblacin o muestra.
EstadsticosParmetrosPoblacin Objetivo (Parte de la poblacin que tiene la caracterstica en estudio).Poblacin (N)Poblacin ObjetivoMuestra (n)
ParmetrosEstadsticos
Toda la poblacin objetivo.
Media poblacional. Varianza Poblacional. Moda Poblacional. Mediana Poblacional. Curtosis.Estudio de muestras.
Media Muestral. Varianza Muestral. Moda Muestral. Mediana Muestral.
A partir de los resultados obtenidos en la muestra se puede inferir para la poblacin en general.
1. Momento con respecto al origen.2. Momento con respecto a la media.3. Momento con respecto a un valor arbitrario k.
1. Momento de orden r con respecto al origen
Definicin Universal:
Caso Discreto:
Nota:
Caso Continuo:
Nota:
2. Momento de orden r con respecto a la media
Definicin Universal:
Caso Discreto:
Caso Continuo:
3. Momento con respecto a un valor arbitrario k.El valor arbitrario lo fijan los investigadores o especialistas para restringir la tolerancia, de esta manera los datos salen referidos a la norma que se desee fijar. Definicin Universal:
Caso Discreto:
Caso Continuo:
COEFICIENTE DE ASIMETRA
Simetra: Una distribucin es simtrica cuando en un punto la media, moda y mediana son iguales; es decir, hay una equidistancia entre ambo ejes (simetra con respecto a ambos ejes).
Las medidas de asimetra son indicadores que permiten establecer el grado de simetra (o asimetra) que presenta una distribucin de probabilidad de una variable aleatoria sin tener que hacer su representacin grfica. [footnoteRef:2] [2: Recuperado de: http://es.wikipedia.org/wiki/Asimetr%C3%ADa_estad%C3%ADstica]
As= 0(existe la misma concentracin de valores a la derecha y a la izquierda de la media)As< 0(existe mayor concentracin de valores a la izquierda de la media que a su derecha)As > 0 (existe mayor concentracin de valores a la derecha de la media que a su izquierda)
Posibles Resultados Tras Medir El Nivel De Asimetra.[footnoteRef:3] [3: Recuperado de: http://www.aulafacil.com/CursoEstadistica/Lecc-8-est.htm]
Nota: Por efecto de los valores extremadamente altos puede ocurrir un sesgo, es importante resaltar que la media es muy sensible a valores extremos. Algunas veces se puede reemplazar a la media como parmetro por la moda o la mediana, ya que estas medidas no se dejan influenciar por datos extremos, un ejemplo de esto se da en los salarios.
1. Coeficiente De Asimetra De Pearson
2. Coeficiente De Asimetra De Fisher
COEFICIENTE DE CURTOSIS
Esta medida determina el grado de concentracin que presentan los valores en la regin central de la distribucin. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentracin de valores (Leptocrtica), una concentracin normal (Mesocrtica) o una baja concentracin (Platicrtica).[footnoteRef:4] [4: Recuperado de: http://www.spssfree.com/spss/analisis3.html]
[footnoteRef:5] [5: Recuperado de: http://www.spssfree.com/spss/analisis3.html]
1. Coeficiente De Curtosis De Fisher
DISTRIBUCIONES BIVARIANTES
Las distribuciones bivariantes son la representacin de dos variables sujetas a estudio.
Tablas de Doble Entrada:Estas tablas se utilizan mucho en procesos de tabulacin.
Variables Cualitativas: Representan una categora.Tablas de Contingencia.Tienen un sentido de medicin de las proporciones.
Variables Cuantitativas: Nos indican si las variables son dependientes o independientes.
Ocurren simultneamente las caractersticas .Nmero de individuos que tienen simultneamente las caractersticas .1. Distribucin Marginal:
Se llama marginal porque no tiene en cuenta o no la afectan las dems caractersticas que intervienen.
As para obtener la distribucin marginal de x se calculan en el recorrido de y o j.
Para la ocurrencia de la clase con :
Ejemplo:
2. Distribucin CondicionalCual es la frecuencia de que ocurra la caracterstica dado que se da ?
Frecuencias Relativas:ConjuntaMarginalCondicional
Coeficiente de Correlacin: Muestra que tan independiente es una variable de la otra.Las variables de orden cualitativo son dependientes, por ejemplo en los experimentos biolgicos o genticos.Grado de Asociacin: Covarianza.
MEDIA GEOMTRICA (G)No es sensible a valores extremos. Presenta un crecimiento potencial.Es aplicable para clculos financieros a inters compuesto, se emplea en el clculo de tasas de incremento de poblaciones.La media geomtrica no puede tener valores cero y/o un nmero impar de valores negativos.
Frecuencias Unitarias:
De lo anterior deducimos la ecuacin de la media geomtrica:
La media geomtrica se aplica a los consumos asociados a las poblaciones demogrficas.
Dnde:
Ejercicio:La poblacin en Sogamoso en 1940 era de 35000 personas y en el 2012 de 125000 personas.Cul fue la tasa media de crecimiento anual en Sogamoso en el perodo enunciado?Solucin:
Despejando
Sogamoso vienen creciendo a una tasa de 0,02 promedio/anual.Ejercicio:Si se mantienen las condiciones demogrficas. Cul ser la poblacin esperada en 2030?Solucin:
La poblacin esperada en 2030 si se mantienen las condiciones demogrficas ser de personas.
MEDIA ARMNICA (H)
Es el recproco de la media aritmtica de los recprocos de los valores de la serie.
IMPORTANTE:
Ejemplo:Se tienen dos registros de produccin, uno tipo A y otro tipo B.
Cul fue la produccin media de los operarios? Solucin:Del enunciado podemos deducir:
OperarioRegistros Tipo ARegistros Tipo B
18 Camisas/Turno1 Camisa/1 Hora
27 Camisas/Turno1 Camisa/1 y 1/4 Hora
39 Camisas/Turno1 Camisa/55 minutos
46 Camisas/Turno1 Camisa/1 y 1/2 hora
57 Camisas/Turno1 Camisa/1 Hora y 10 minutos
68 Camisas/Turno1 Camisa/1 Hora y 5 minutos
79 Camisas/Turno1 Camisa/50 minutos
86 Camisas/Turno1 Camisa/1 Hora y 35 minutos
97 Camisas/Turno1 Camisa/1 Hora y12 minutos
108 Camisas/Turno1 Camisa/1 Hora y 7 minutos
Ejercicio: Calcular la media aritmtica, acotada, Windsor, geomtrica y armnica para el ejercicio 1 de las estaturas.Solucin:1. Media AritmticaNmero de IntervalosMarca de Clase (xi)nixi*ni
1150,51150,5
2154,500
3158,54634
4162,53487,5
5166,5233829,5
6170,5539036,5
7174,5203490
8178,5142499
9182,53547,5
10186,53559,5
11190,52381
12621615
Media Aritmtica =171,55
2. Media Acotada126100
16
=12,70
/2 =6,35
Nmero de IntervalosMarca de Clase (xi)niMarca de Clase (xi) Acotadani (acotada)xi*ni
1150,51
2154,50
3158,54
4162,53
5166,523166,5233829,5
6170,553170,5539036,5
7174,520174,5203490
8178,514178,5142499
9182,53
10186,53
11190,52
12611018855
Media Acotada =171,41
3. Media WindsorNmero de IntervalosMarca de Clase (xi)niMarca de Clase (xi) Acotadaxi*ni
1150,51166,5166,5
2154,50166,50
3158,54166,5666
4162,53166,5499,5
5166,523166,53829,5
6170,553170,59036,5
7174,520174,53490
8178,514178,52499
9182,53178,5535,5
10186,53178,5535,5
11190,52178,5357
12621615
Media Windsor =171,55
4. Media GeomtricaNmero de IntervalosMarca de Clase (xi)nilog(xi)log(xi)*ni
1150,512,182,18
2154,502,190,00
3158,542,208,80
4162,532,216,63
5166,5232,2251,09
6170,5532,23118,28
7174,5202,2444,84
8178,5142,2531,52
9182,532,266,78
10186,532,276,81
11190,522,284,56
12624,54281,50
Media Geomtrica =171,44
5. Media ArmnicaNmero de IntervalosMarca de Clase (xi)ni1/xi1/xi(ni)
1150,510,006644520,00664452
2154,500,006472490
3158,540,006309150,02523659
4162,530,006153850,01846154
5166,5230,006006010,13813814
6170,5530,005865100,31085044
7174,5200,005730660,11461318
8178,5140,005602240,07843137
9182,530,005479450,01643836
10186,530,005361930,01608579
11190,520,005249340,01049869
1260,064874740,73539862
Media Armnica =171,34
Comparando las medias:M. Aritmtica171,55
M. Acotada171,44
M. Windsor171,55
M. Geomtrica171,44
M. Armnica171,34
MODELO DE ORDEN LINEAL (Regresin Lineal)
El grado de relacin o de tendencia nos sirve para predecir comportamientos futuros histricamente cercanos.Ecuacin Matriz:
El modelo estimado es:, esta es la ecuacin de regresin lineal y de tendencia (Si x e y son magnitudes). Ejemplo 1: (Para n: Perodos Par)Cuando x: Tiempo e y: Magnitud.Las ventas anuales en los ltimos 20 aos:XY
aosmagnitud
::
::
XY
-7
-5
-3
-1
1
3
5
7
n=8
XY
-3
-2
-1
0
1
2
3
n=8
Ejemplo 2:Las exportaciones de durazno boyacense en fresco hechas a Estados Unidos durante los ltimos aos fueron (cantidades en miles de millones): Determinar la ecuacin de regresin y a partir de este calcular las exportaciones para el 2015.Solucin:AosCantidades Exportadas (US $) (OOO)xxy
20013,5-11-38,5121
20024,2-9-37,881
20034,7-7-32,949
20045,6-5-2825
20055,9-3-17,79
20066,7-1-6,71
20076,716,71
200883249
20098,254125
20108,7760,949
20118,9980,181
201210,511115,5121
Totales81,60166,6572
Exportaciones para 2015:
Las exportaciones esperadas para el 2015 son de 11751,386.
Ejemplo 3: (Para n: Perodos Impar)X: Ingresos, Y: Consumo (En $ 000.000)Calcular el consumo para un ingreso de 5.000.000.
xyxy
0,60,60,360,36
0,90,90,810,81
1,111,11,21
1,91,93,613,61
2,62,56,56,76
2,92,98,418,41
3,53,512,2512,25
3,83,513,314,44
4,6418,421,16
6,5532,542,25
9,2873,684,64
37,633,8170,84195,9
Ecuacin:
Para un ingreso de 5.000.000:
AJUSTE DE ORDEN CUADRTICO O PARABLICO
Ejemplo:Los siguientes datos siguen un modelo ? Hallar Para un x=0,0015, x=0,0075 y x=0,005. Cul sera la ganancia?xy
0,0011000
0,00210000
0,00340000
0,00460000
0,00570000
0,00660000
0,00750000
0,028291000
xyxy
0,00110000,0000011E-091E-1210,001
0,002100000,0000048E-091,6E-11200,04
0,003400000,0000092,7E-088,1E-111200,36
0,004600000,0000166,4E-082,56E-102400,96
0,005700000,0000251,3E-076,25E-103501,75
0,006600000,0000362,2E-071,3E-093602,16
0,007500000,0000493,4E-072,4E-093502,45
Totales0,0282910000,000147,8E-074,68E-0914417,721
Sustituyendo en los determinantes y desarrollndolos se obtiene:
XY
0,00158401,7855
0,007545258,9275
0,005-23991,0715
TIP INFORMTICO:
Pasos para graficar el anterior ejercicio en Excel:1. Seleccionar los datos que se desean graficar.2. Clic en insertar.(Los grficos de barras y reas se pueden utilizar para las variables bidimensionales).3. Seleccionar la opcin Grficos de Dispersin, y escoger la nube de puntos. Gracias a este podremos observar la tendencia de los datos y escoger el modelo ms adecuado.4. Agregar lnea de tendencia.
Podemos ver que la formula generada por Excel es similar a la obtenida mediante el uso de determinantes.Coeficiente de determinacin:Sirve para calificar el modelo terico hallado, en otras palabras nos dice que tan bueno es el modelo. Conocido tambin como coeficiente de bondad de ajuste.
La idea es buscar un modelo con un lo ms cercano a 1.
Gracias a Excel se puedo determinar que el modelo que mejor se ajusta a la situacin es una lnea de tendencia polinmica de orden 4.HISTOGRAMAEn el eje y van los , el ancho es la amplitud y el largo la frecuencia.Los rectngulos son el histograma y la lnea que une los puntos medios de cada uno de estos se llama polgono de frecuencias absolutas, es el grafico lineal del fenmeno.1. Histograma de Frecuencias Absolutas (Ejercicio 1 de edades)
La lnea vertical azul es la moda, mo=170,49.2. Histograma de Frecuencias Acumuladas (Ejercicio 1 de edades)