Download - Proyecto Grupal a Ultima Parte 2
ESTADISTICAPROYECTO FINAL
Presentado Por:Judith Lázaro PabónCarolín Aponte Wilches
Profesora. Diana Velásquez
III semestrePolitécnico Grancolombiano2009
v1 = SALDO DE CUENTA (en miles de pesos) v2 = NUMERO DE TRANSACCIONES EN CAJERO AUTOMATICO AL MES v3 = NUMERO DE OTROS SERVICIOS BANCARIOS UTILIZADOS v4 = TIENE TARJETA DEBITO (1=SI, 0=NO) v5 = RECIBE INTERESES SOBRE SU CUENTA (Si =1; No =2) v6 = SUCURSAL DONDE SE MANEJA LA CUENTA (Unicentro =1; Suba=2; Chapinero = 3; Restrepo = 4) v7 = ESTADO CIVIL (Soltero =1; Casado=2;Divorciado= 3; Otro = 4) v8 = NÚMERO DE HIJOS v9= NIVEL EDUCATIVO (Postgrado =1; Universidad =2;Técnico = 3; Bachiller = 4; 5 Primaria ) v10= VALOR PRESTAMO SOLICITADO PARA VIVIENDA (Cien miles de pesos) v11 = HA SOLICITADO PRESTAMO BANCARIO (Si =1; No =2)
1. Considere aleatoriamente sólo uno de los encuestados y el evento elegir una persona aleatoriamente que tenga tarjeta débito; puede esta ser una variable aleatoria de tipo Bernoulli?
Rta/ Sí Por que cada persona sólo tiene dos posibles resultados o tiene tarjeta debito o no tiene
tarjeta debito y cada evento es el complemento del otro.
Y = 0, 1X = 0 significa que la persona no tiene tarjeta débitoX = 1 significa que la persona tiene tarjeta débito
Encuestado Nro. v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v111 2000 13 4 0 1 2 2 3 1 3000 12 3100 9 2 1 0 1 2 2 1 4650 13 800 10 1 0 0 1 1 0 5 1200 14 3800 10 4 0 1 3 1 1 1 5700 15 2800 6 4 0 0 4 4 2 5 4200 16 1550 18 6 0 0 2 4 1 4 2325 17 1300 12 6 1 0 3 2 0 3 1950 18 800 15 4 1 0 3 2 0 3 1200 19 3800 4 3 0 0 4 1 1 1 4750 1
10 650 9 5 1 1 3 2 3 2 812,5 111 3500 8 4 1 0 4 2 5 5 4375 112 550 12 3 0 1 2 4 5 4 715 113 3500 17 3 0 1 1 2 4 5 4550 114 2800 6 3 0 0 3 4 2 5 3640 115 1550 10 8 1 0 1 4 1 4 2015 116 3800 6 4 0 0 4 1 1 1 4940 117 1100 18 6 0 0 2 3 3 1 1430 118 3100 7 5 1 0 1 2 1 1 3410 119 750 6 5 0 0 1 1 0 3 825 120 400 10 3 1 0 1 1 1 3 021 400 10 3 1 0 1 1 1 3 022 500 12 4 0 0 1 1 0 5 023 1100 20 3 1 0 4 2 1 5 1210 124 800 7 2 0 0 3 2 1 5 880 125 200 20 7 1 0 4 4 1 1 026 800 15 4 1 0 3 2 0 3 1440 127 800 11 2 0 1 1 1 0 1 1440 128 400 10 3 1 0 1 1 1 3 029 650 6 3 0 0 3 2 3 2 1170 130 3500 10 8 1 0 1 2 4 5 6300 1
2. Considere el número de encuestados que tienen tarjeta débito:
a.- Es ésta una variable aleatoria? Es discreta o continua? ¿Qué tipo de variable aleatoria, de las vistas en clase o en las lecturas, Bernoulli, Binomial, Poisson o Normal, es esta variable.
Es una variable aleatoria discreta, tipo Binomial, porque en cada prueba del experimento se tiene
sólo dos posibles resultados, o tiene tarjeta debito o no tienen. Permiten realizar n ensayos
Bernoulli independientes.
b. Según su base de datos, ¿cuál es la probabilidad de elegir aleatoriamente una persona con tarjeta débito? Ahora considere su base de datos como la población y determine la probabilidad de que 7 personas elegidas al azar de una muestra aleatoria de 15 personas tengan tarjeta débito.
N=30
X=número de personas con tarjetas debito
P=14/30= 0.46666
q=1-p = 1-0.4666
= 0.53333
Para el análisis de una sola persona, teniendo como base de datos n=30, nuestra variable aleatoria
tener o no tener tarjeta débito es de tipo Bernoulli.
c. Realice una tabla de la distribución de probabilidad de la variable aleatoria número de personas que tienen tarjeta débito. Ésta en Excel para los siguientes tamaños de muestra: n=15, n=20, n=30 dejando fija la p que le dio en el literal b.
Tamaño de la muestra
15Tamaño de la muestra
20Tamaño de la muestra
30
Probabilidad 0.4666 Probabilidad 0.4666 Probabilidad 0.4666
Número de personas con tarjeta débito
P(X=x)Número de
personas con tarjeta débito
P(X=x)Número de
personas con tarjeta débito
P(X=x)
0 8.04999E-05 0 3.47584E-06 0 6.4802E-09
1 0.001056278 1 6.0811E-05 1 1.7006E-07
2 0.006467969 2 0.000505356 2 2.1571E-06
3 0.024517813 3 0.002652408 3 1.7611E-05
4 0.064342023 4 0.009860999 4 0.00010399
5 0.123825223 5 0.027603401 5 0.00047302
6 0.180530087 6 0.060366269 6 0.0017241
7 0.203041954 7 0.105612677 7 0.00517092
8 0.177614127 8 0.150127807 8 0.0130046
9 0.120843908 9 0.175102199 9 0.02780795
10 0.06342606 10 0.168490729 10 0.05108342
11 0.025219518 11 0.133990821 11 0.08124732
12 0.007353723 12 0.087907926 12 0.11253124
13 0.001484489 13 0.04732236 13 0.13629941
14 0.000185511 14 0.020697987 14 0.14477934
15 1.08186E-05 15 0.007242355 15 0.13509119
16 0.001979801 16 0.11078732
17 0.000407497 17 0.07981066
18 5.94107E-05 18 0.05042239
19 5.47057E-06 19 0.02785754
20 2.39274E-07 20 0.01340285
21 0.00558303
22 0.00199793
23 0.0006079
24 0.0001551
25 3.2562E-05
26 5.4778E-06
27 7.0989E-07
28 6.6535E-08
29 4.0139E-09
30 1.1704E-10
Para la muestra de tamaño 15 determine la probabilidad de que:
i. Tres personas tengan tarjeta débito.
Como se observa en la tabla de tamaño de muestra 15, p=0.4666, la probabilidad de que 3 personas tengan tarjeta debito es de 0,024517813.
De manera analítica se expresa de la siguiente forma:
n=15 x=3 p= 0.4666 q= 0.5333
p(3) = (153 )(0.4666)3(0.5333)12
p(3) = 0,024517813
ii. Ninguna persona tenga tarjeta débito.
Como se observa en la tabla de tamaño de muestra 15, p=0.4666, la probabilidad de que
ninguna persona tengan tarjeta debito es de 8,04999E-05 = 0.0000804999.
iii. Diez personas tengan tarjeta débito.
Como se observa en la tabla de tamaño de muestra 15, p=0.4666, la probabilidad de que
10 personas tengan tarjeta debito es de 0,06342606.
d. Realice una tabla de distribución de probabilidades acumuladas para n=15 y determine la probabilidad de que:
Tamaño de la muestra 15
Probabilidad 0.4666
Número de personas con tarjeta débito
P(X=x)
0 8.04999E-05
1 0.001136778
2 0.007604746
3 0.03212256
4 0.096464583
5 0.220289806
6 0.400819893
7 0.603861846
8 0.781475974
9 0.902319881
10 0.965745941
11 0.990965459
12 0.998319181
13 0.99980367
14 0.999989181
15 1
i. Al menos tres personas tengan tarjeta débito.
Como se observa en la tabla de tamaño de muestra 15, p=0.4666, la probabilidad de que al menos 3 personas tengan tarjeta debito es de 0,991190352. Para calcular este valor hay que usar la propiedad del complemento:
n=15 x=0 p= 0.4666 q= 0.5333
p(0) = (150 )(0.4666)0(0.5333)15
p(0) = 0,000080499
p(1) = (151 )(0.4666)1(0.5333)14
p(1) = 0,001136778
p(2) = (152 )(0.4666)2(0.5333)13
p(2) = 0,007604746
P(X<3) = P(X≤2) = P(X¿0) P(X¿1) P(X¿2)P(X<3) = P(X≤2) = 0,000080499 + 0,001136778 + 0,007604746P(X<3) = P(X≤2) = 0.008822024P(X<3) = 1 -P(X≤2) = 1 – 0.008822024 = 0.991177976
ii. Como máximo 8 personas tengan tarjeta débito.
Como se observa en la tabla de tamaño de muestra 15, p=0.4666, la probabilidad de que máximo 8 personas tengan tarjeta debito es de 2.143856686.
iii. Entre 4 y 10 personas tengan tarjeta débito
Como se observa en la tabla de tamaño de muestra 15, p=0.4666, la probabilidad de que entre 4 y 10 personas tengan tarjeta debito es de 3.970977924.
e. Realice la gráfica de dichas distribuciones. En Excel. ¿Observa algún cambio de la gráfica cuando el tamaño de muestra cambia?
Muestra: 15 personas
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 160
0.05
0.1
0.15
0.2
0.25
Número de Personas con tarjeta débito
P(X)
0 1 2 3 4 5 6 78.04999E-05 0.001056278 0.006467969 0.024517813 0.064342023 0.123825223 0.180530087 0.203041954
8 9 10 11 12 13 14 150.17761412
7 0.120843908 0.06342606 0.025219518 0.007353723 0.001484489 0.000185511 1.08E-05
Muestra: 20 personas
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 210
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0.2
Número de personas con TD
P(X)
0 1 2 3 4 5 6
3.47584E-06 6.0811E-05 0.000505356 0.002652408 0.009860999 0.027603401 0.060366269
7 8 9 10 11 12 13
0.105612677 0.150127807 0.175102199 0.168490729 0.133990821 0.087907926 0.04732236
14 15 16 17 18 19 20
0.020697987 0.007242355 0.001979801 0.000407497 5.94E-05 5.47057E-06 2.39274E-07
Muestra: 30 personas
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 310
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
Número de personas con TD
P(X)
0 1 2 3 4 5
6.48023E-09 1.7006E-07 2.15706E-06 1.76113E-05 0.000103989 0.000473023
6 7 8 9 10 11
0.001724101 0.005170916 0.013004603 0.02780795 0.051083424 0.081247317
12 13 14 15 16 17
0.112531241 0.136299413 0.14477934 0.135091194 0.110787316 0.079810655
18 19 20 21 22 23
0.050422392 0.027857543 0.013402852 0.005583026 0.001997934 0.000607904
24 25 26 27 28 29
0.000155101 3.25624E-05 5.47778E-06 7.09893E-07 6.65346E-08 4.01395E-09
30
1.17042E-10
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
Tamaño de la muestra 15 Tamaño de la muestra 20 Tamaño de la muestra 30
f. Calcule el valor esperado y la varianza de la variable aleatoria número de encuestados con tarjeta débito y explique su significado en lenguaje cotidiano (no matemático).
Valor esperado:E (X)= n*p E (15) = (15)(0.4666) = 6.999 =7 personas
Esperamos que 7 personas tengan tarjeta debido de la muestra analizada.
Varianza (X)
g. Ahora realice una tabla de distribución de probabilidad de la variable aleatoria número de personas que tienen tarjeta débito. Ésta en Excel pero ahora deje fijo el tamaño de muestra de 15 personas y cambie la probabilidad que le dio en el literal d. Por ejemplo, si p le dio 0.2 determine la distribuciones para p=0.1, 0.4, 0.5, 0.7, 0.8, observe… son dos números antes y tres después pero en su ejercicio es obligatorio que aparezca 0.5.
Tamaño de la muestra
15 Tamaño de la muestra
15 Tamaño de la muestra
15
Probabilidad 0.15 Probabilidad 0.25 Probabilidad 0.5
Número de personas
con tarjeta débito
P(X=x)Número de
personas con tarjeta débito
P(X=x)Número de
personas con tarjeta débito
P(X=x)
0 0.087354219 0 0.013363461 0 3.05176E-05
1 0.231231756 1 0.066817305 1 0.000457764
2 0.285639229 2 0.155907045 2 0.003204346
3 0.218429998 3 0.225199065 3 0.013885498
4 0.115639411 4 0.225199065 4 0.041656494
5 0.044895301 5 0.165145981 5 0.091644287
6 0.0132045 6 0.091747767 6 0.152740479
7 0.002995979 7 0.039320472 7 0.196380615
8 0.000528702 8 0.013106824 8 0.196380615
9 7.2567E-05 9 0.003398065 9 0.152740479
10 7.68356E-06 10 0.000679613 10 0.091644287
11 6.16328E-07 11 0.000102972 11 0.041656494
12 3.62546E-08 12 1.14413E-05 12 0.013885498
13 1.47643E-09 13 8.801E-07 13 0.003204346
14 3.7221E-11 14 4.19095E-08 14 0.000457764
15 4.37894E-13 15 9.31323E-10 15 3.05176E-05
Tamaño de la muestra
15 Tamaño de la muestra
15
Probabilidad 0.65 Probabilidad 0.75
Número de personas con tarjeta débito
P(X=x)Número de
personas con tarjeta débito
P(X=x)
0 1.44884E-07 0 9.31323E-10
1 4.03606E-06 1 4.19095E-08
2 5.24687E-05 2 8.801E-07
3 0.000422248 3 1.14413E-05
4 0.002352527 4 0.000102972
5 0.009611752 5 0.000679613
6 0.029750661 6 0.003398065
7 0.071037293 7 0.013106824
8 0.131926401 8 0.039320472
9 0.190560357 9 0.091747767
10 0.212338683 10 0.165145981
11 0.179246941 11 0.225199065
12 0.110962392 12 0.225199065
13 0.047555311 13 0.155907045
14 0.012616715 14 0.066817305
15 0.001562069 15 0.013363461
h. Realice la grafica de dichas distribuciones En Excel. ¿Observa algún cambio de la gráfica cuando la probabilidad cambia?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 160
0.05
0.1
0.15
0.2
0.25
0.3
P=0.15
Número de personas con TD
P(X)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 160
0.05
0.1
0.15
0.2
0.25
P=0.25
Número de Personas con TD
P(X)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 160
0.05
0.1
0.15
0.2
0.25
P=0.5
Número de Personas con TD
P(X)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 160
0.05
0.1
0.15
0.2
0.25
P=0.65
Número de Personas con TD
P(X)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 160
0.05
0.1
0.15
0.2
0.25
P=0.75
Número de Personas con TD
P(X)
Si. Ya que la curva de acuerdo a la probabilidad asignada para el evento, va asumiendo un comportamiento simétrico o asimétrico.
i. Indique en qué casos la gráfica da simétrica, es decir que el área observado a la derecha es idéntico al observado a la izquierda.
Según los resultados observados en la gráfica número 3 con probabilidad de 0.5 es simétrica, ya que el área es idéntica tanto a la derecha como a la izquierda.
3. Con base en sus anteriores respuestas, escriba otra variable aleatoria que sea Binomial dentro de la base de datos y expliqué el razonamiento que realizó para determinar que efectivamente es de tipo Binomial.
Nuestra variable de análisis: tiene tarjeta de debito (1=SI, 0=NO) tiene comportamiento Binomial por las razones expuestas y que sustentamos
Para la nueva variable de análisis: ha solicitado préstamo bancario (1=SI, 2=NO). Esta variable propuesta tiene comportamiento Binomial, porque;
1. En cada prueba del experimento solo se tienen dos posibles resultados; ÉXITO=SI, FRACASO=NO.
2. Permite realizar “n” ensayos Bernulli independientes. La probabilidad que una persona haya solicitado un préstamo bancario, es totalmente independiente que otra persona de la base de datos lo haya solicitado
3. La probabilidad de suceso: personas que han solicitado préstamo bancario, es constante a través de las pruebas y no varía de una prueba a otra.
4. ¿Identifica usted dentro de las variables aleatorias alguna que sea de tipo Poisson? Si su respuesta es negativa, ¿puede usted establecer alguna variable aleatoria que relacione alguno de los diferentes contextos que trabaja la base de datos? Escriba alguna.
La distribución de Poisson describe la probabilidad como un acontecimiento fortuito ocurrido en un tiempo o intervalo de espacio bajo las condiciones que la probabilidad de un acontecimiento ocurre es muy pequeña, pero el número de intentos es muy grande, entonces el evento actual ocurre algunas veces.
Las variables tipo Poisson indican: Está formulada sobre éxitos y fracasos, pero en un tiempo determinado. La probabilidad de ocurrencia del fenómeno es constante en el tiempo o en
el espacio.
En nuestra base de datos podemos observar que la variable que se acoge a los términos definidos anteriormente es:
v2 = NUMERO DE TRANSACCIONES EN CAJERO AUTOMATICO AL MES.
5. Basados en el ejercicio 2 si el tamaño de muestra fuera grande por ejemplo de 100 o más datos en una muestra, ¿cree usted que la variable aleatoria Binomial número de encuestados con tarjeta débito podría tender a convertirse en una distribución normal?
Según la información proporcionada, las características de la distribución normal son: Las tres medidas son iguales (media, mediana y moda) y se ubican en el
pico de la curva. La distribución es simétrica con respecto a su promedio. La curva es asintótica con respecto al eje X.
Una de sus características más importantes de la distribución normal es que casi cualquier distribución de probabilidad, tanto discreta como continua se puede aproximar por una normal bajo ciertas condiciones por lo que asumimos que: entre mayor sea el número de la muestra (n) mayor será la posibilidad de convertirse en una distribución normal.
A partir del gráfico anterior, podemos observar que podemos aproximar la probabilidad de que una variable Binomial tome un determinado valor mediante la f.d.p. de una distribución normal. Así, por ejemplo, podemos estimar P(X=7) (área en azul) por P(6,5 < X < 7,5) área comprendida entre la curva roja y ambos puntos). En el primer caso estamos considerando que la variable X es Binomial, mientras que en el segundo consideramos que dicha variable es normal (y por tanto hacemos uso de la aproximación por continuidad, puesto que para cualquier variable continua la probabilidad puntual es cero).