algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones...

20

Click here to load reader

Upload: luis-alejandro-masmela-caita

Post on 28-Jul-2015

2.053 views

Category:

Documents


3 download

DESCRIPTION

Las nuevas tecnologías computacionales han permitido utilizar métodos alternativos parapresentar conceptos matemáticos, variando así el paradigma en cuanto a la relación cognitivaentre el estudiante y el objeto del conocimiento. Se presenta aquí, utilizando la hoja de cálculoExcel, algunas simulaciones que pretenden ilustrar conceptos particulares de la probabilidady la estadística inferencial como son: el cálculo de probabilidades en modelos distribucionalesbinomial y normal, además del teorema del límite central y su aplicación en un problema queilustra la toma de decisiones soportado en el concepto de probabilidad.

TRANSCRIPT

Page 1: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

Algunos conceptos de probabilidad y estadísticainferencial ilustrados mediante simulaciones

utilizando Excel

Luis Alejandro Másmela Caita*

Universidad Distrital Francisco José de CaldasUniversidad Autónoma de Colombia

Resumen

Las nuevas tecnologías computacionales han permitido utilizar métodos alternativos parapresentar conceptos matemáticos, variando así el paradigma en cuanto a la relación cognitivaentre el estudiante y el objeto del conocimiento. Se presenta aquí, utilizando la hoja de cálculoExcel, algunas simulaciones que pretenden ilustrar conceptos particulares de la probabilidady la estadística inferencial como son: el cálculo de probabilidades en modelos distribucionalesbinomial y normal, además del teorema del límite central y su aplicación en un problema queilustra la toma de decisiones soportado en el concepto de probabilidad.

Palabras y Frases Claves: Distribución binomial, distribución normal, teorema del límitecentral, simulación, Excel, Probabilidad, Estadística Inferencial.

1. Introducción

Desde la experiencia obtenida al impartir cursos de probabilidad y estadística inferencial en elnivel de pregrado, en cursos para estudiantes de ingeniería y ciencias económicas, surge la necesidadde mostrar de manera más concreta el cómo funcionan diferentes teorías en estos cursos, comocomplemento de la demostración matemática formal de las mismas. El cálculo de probabilidades enpoblaciones con distribuciones normales o binomiales, el teorema del límite central, las distribucionesmuestrales entre otros, son conceptos que acuden en estos cursos a procesos matemáticos que enalgunos casos se quedan en lo algorítmico sin que generen una relación con procesos referidos a lacotidianidad del futuro profesional. Poder adentrarse, de alguna manera, a cómo se comportan estosprocesos aleatorios, soportados por el cálculo de probabilidades, a través de alguna metodología oforma de ilustrarlos, sería de gran aporte en el proceso de aprendizaje de los estudiantes.En tal sentido, las herramientas de cómputo ofrecen la posibilidad al estudiante de acceder

a contenidos matemáticos y a contextos que son para ellos muy difíciles de explorar. El uso de

* [email protected]@fuac.edu.co

1

L. Alejandro Masmela
For Comment
Page 2: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

la herramienta computacional y en particular el de la simulación que con ella se puede realizar,permite trabajar en contextos de problemas interesantes, dando la posiblidad al estudiante degenerar procesos de re�exión, razonamiento, planteamiento y solución de problemas y toma dedecisiones que le den sentido a los conceptos aprendidos.Se presentan a continuación algunos conceptos de probabilidad y estadística inferencial ilustrados

a través de simulaciones realizadas usando la hoja de cálculo Excel, para ello se utilizará la versiónde Excel 20071 , en particular la herramienta Análisis de datos del menú Datos.Los conceptos tratados e ilustrados a partir de las simulaciones en este escrito son: probabilidades

binomiales, probabilidades normales, teorema del límite central y un ejercicio que pretende ilustrarla utilización del teorema del límite central en la toma de decisiones.

2. Dos distribuciones importantes de probabilidad en cursosde pregrado: La Distribución Binomial y La DistribuciónNormal

2.1. Distribución Binomial

La distribución binomial se enmarca dentro del proceso denominado "Proceso de Bernoulli", esteproceso trata de un experimento que se puede realizar muchas veces, sus resultados pueden terminarde dos formas diferentes, denominados éxito y fracaso, la probabilidad de éxito se nota como p;esta probabilidad se mantiene constante de repetición en repetición, y los diferentes resultadosprovenientes de las repeticiones del experimento son independientes. Se de�ne la variable aleatoriabinomial X como aquella que mide el número de éxitos en n repeticiones de estos experimentos deBernoulli. De esta forma la variable aleatoria X tiene por función de densidad de probabilidad

b(x;n; p) =

�n

x

�px(1� p)n�x para x = 0; 1; :::; n (1)

a partir de esta se de�ne la función de distribución como,

B(r;n; p) =rX

k=0

�n

k

�pk(1� p)n�k (2)

esta función aparece tabulada en la parte posterior de los libros para valores de r enteros nonegativos2 : Cabe notar que de acuerdo con la de�nición de función de distribución de probabilidad,r puede ser cualquier número real.De igual forma, para la distribución binomial se tiene que su media y su varianza están dadas

por:

� = np (3)

�2 = np(1� p) (4)

A continuación se presenta un ejemplo, tomado de [3], que ilustra la aplicación de cálculo deprobabiliades binomiales y que será objeto de la simulación para esta distribución.

1Es posible trabajar estas simulaciones en la versión de Excel 97-2003.2Ver en [3] el apéndice de tablas.

2

L. Alejandro Masmela
For Comment
Page 3: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

Ejemplo 1 La probabilidad de que un paciente se recupere de una rara enfermedad sanguínea es0;4. Si se sabe que 15 personas contraen tal enfermedad, ¿cuál es la probabilidad de que

a. sobrevivan al menos 10,

b. sobrevivan de 3 a 8,

c. sobrevivan exactamente 5?

Solución

a. Para calcular esta probabilidad recurrimos a la función de distribución de probabilidad en (2),así, siendo X el número de pacientes que se recuperan de cierta enfermedad de 15 personasque la contraen entonces se tiene que X se distribuye binomial con parámetros n = 15 yp = 0;4 se tiene que la probabilidad a calcular es,

P (X � 10) = 1� P (X < 10)

= 1� P (X � 9)= 1�B(9; 15; 0;4)= 1� 0;9662= 0;0338

b. Aquí se requiere calcular la probabilidad

P (3 � X � 8) = P (X � 8)� P (X � 2)= B(8; 15; 0;4)�B(2; 15; 0;4)= 0;9050� 0;0271= 0;8778

c. Para esta probabilidad puntual, se procede de la siguiente forma,

P (X = 5) = P (X � 5)� P (X � 4)= B(5; 15; 0;4)�B(4; 15; 0;4)= 0;4032� 0;2173= 0;1859

2.2. Simulación: Distribución Binomial

Veri�que que esté activa la opción Análisis de Datos en el menú Datos, si no es así vea el Anexopara cargarla.En una hoja nueva de Excel se etiqueta la columna A con el nombre x, y allí se generarán valores

de la variable X que denota el número de pacientes que se recuperan de una rara enfermedad de15 personas que la contraen. La simulación repite esta situación 10 mil veces, esto es, seleccionar10 mil grupos de 15 personas que contraen la enfermedad y en cada grupo la variable X asumeel valor x de personas que se recuperan de esta enfermedad. Habiendo etiquetado la columna conx, se procede con la simulación de la siguiente forma: dando clic sobre el menú Análisis de Datos

3

L. Alejandro Masmela
For Comment
Page 4: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

se accede a una caja con funciones para análisis, de ellas se selecciona la función Generación denúmeros aleatorios, en la caja de diálogo que aparece, se despliega el menú de la opción Distribucióny se elige Binomial, se completa el cuadro como aparece a continuación:

Con ello se le da la orden al programa que genere una variable con 10 mil números aleatorios, quese distribuyen Binomial, con parámetros p = 0;4 y n = 15 y que los coloque en la columna A, másespecí�camente en el rango de celdas que va desde A2 hasta A10001.Con esto se obtienen 10 mil datos que en cada caso se interpreta como el número de pacientes

que se recuperan de cierta enfermedad.

Para la simulación que aquí se muestra, se puede observar las 15 primeras réplicas del exper-imento en donde se recuperan 9 pacientes en el primer caso, 8 en el segundo, 7 en el tercero yasí sucesivamente. No se preocupe si en su simulación los valores no coinciden, esto es debido alconcepto denominado aleatoriedad.A continuación se construirá una tabla de frecuencia en donde se puede observar el número de

veces que aparece cada valor. La columna C se etiqueta con X y se rellena con los valores enterosentre 0 y 15, que corresponde a los valores de la variable. En la columna D, etiquetada con f; se

4

L. Alejandro Masmela
For Comment
Page 5: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

quiere generar frente a cada valor de la variable aleatoria, el número de veces que aparece dichovalor en los 10 mil datos. Ubicándose en la celda D2, se da clic sobre el botón Insertar función,encerrada en el círculo en la esquina superior izquierda de la imagen, en la caja Insertar función queaparece, se selecciona en la cuadro O seleccionar una categoría la opción Todas y luego se busca,en el cuadro Seleccionar una función, la función CONTAR.SI y se rellena la caja que se despliegacomo aparece en la �gura.

Con esta orden se le está indicando al programa que cuente el número de valores cero (0) en el rangoen donde se generaron los números aleatorios, para el caso de la simulación que se muestra, son 4los valores cero que aparecen allí. Luego de esto se copia la función a las celdas correspondientes alos otros valores de la variable aleatoria para generar la siguiente tabla de frecuencia.

Al �nal de la columna D donde aparece el conteo, se realiza la suma para veri�car que efectiva-mente fueron 10 mil los datos que se contaron.

5

L. Alejandro Masmela
For Comment
Page 6: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

A partir de esta tabla se pueden estimar las probabilidades que se calcularon teóricamente en elejemplo 1. Por ejemplo, que se recuperen por lo menos 10 pacientes se da en 222+81+17+1 = 321de 10 mil casos, esto es 0;0321; una buena aproximación al valor teórico que fue de 0;0388. De igualforma, que sobrevivan de 3 a 8 pacientes se da en 8740 de las 10 mil casos, valor que correspondea 0;8740 y que aproxima al valor teórico 0;8778. Por último que sobrevivan exactamente 5 se daen una proporción de 1834 en 10 mil, esto es 0;1834; que aproxima la probabilidad 0;1859. Estosigni�ca que dividiendo los valores de la columna f por 10 mil, se puede aproximar la función dedensidad de probabilidad, esto se hace en la columna etiquetada con fr, y acumulando estos valoresen otra columna, por ejemplo Fr; se puede aproximar la función de distribución de probabilidad,tablas que aparecen en la parte posterior de los textos. (Ver [3] página 742 y comparar con la tablaa continuación)

2.3. Distribución Normal

La distribución normal es la distribución más importante dentro de un curso de estadísticaparamétrica y sus aplicaciones son diversas y en muchas áreas del conocimiento. La función dedistribución de probabilidad de esta variable aleatoria continua está dada por:

n(x;�; �) =1p2��

exp

"�12

�x� ��

�2#(5)

los valores � y � son efectivamente su media y su desviación, y la variable toma valores en todala recta real, �1 < x < 1: Los cálculos de probabilidades se dan a partir de la integración de lafunción en (5) y esta integral permite obtener la función de distribución acumulada. Al pretendersimpli�car esta integral, se acude a un proceso de sustitución que se denomina estandarización dela variable3 . Al realizar este proceso, la variable obtenida a partir de la transformación se dice quesigue una distribución normal estándar, y se nota con la letra Z:

3El proceso de estandarización sobre una variable normal con media � y desviación �; acude a la transformaciónZ = (X � �) =�; la nueva variable aleatoria Z, se distribuye normal, pero con valores � = 0 y � = 1:

6

L. Alejandro Masmela
For Comment
Page 7: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

Ejemplo 2 Una máquina expendedora de bebidas gaseosas se regula para que sirva un promediode 200 mililitros por vaso. Si la cantidad de bebidas se distribuye normalmente con una desviaciónestándar igual a 15 mililitros,

a. ¿qué fracción de los vasos contendrá más de 224 mililitros?

b. ¿cuál es la probabilidad de que un vaso contenga entre 191 y 209 mililitros?

Solución

a. Si se denomina la variable aleatoria X como el contenido de los vasos que sirve la máquina, setiene entonces que esta variable se distribuye normal con � = 200 y � = 15; se desea aquícalcular

P (X > 224) = P

�X � ��

>224� 200

15

�= P (Z > 1;6)

= 1� P (Z < 1;6)= 1� 0;9452 = 0;054 8 (6)

b. en este caso

P (191 < X < 209) = P

�191� 200

15< Z <

209� 20015

�= P (�0;6 < Z < 0;6)= P (Z < 0;6)� P (Z < �0;6)= 0;4514 (7)

2.4. Simulación: Distribución Normal

Para la simulación que ilustra el Ejemplo 2 y que se re�ere a la distribución normal, se procedede la siguiente forma. Se etiqueta con n la columna A, allí se genera una columna con los númerosdesde 1 hasta 10000, así, se digitan en las dos primeras celdas los valores 1 y 2, se sombrean ambasceldas y posicionando el cursor en la esquina inferior derecha del recuadro que indica las celdasseleccionadas, en este vértice aparece un pequeño punto negro, al colocar el cursor allí este cambiade forma, dando clic sostenido sobre él se desplaza el cursor hasta la posición A10001 para generarlos 10000 primeros números naturales, esta variable permitirá contar los valores aleatorios que segeneraran en la columna B. De la misma forma que en la simulación del caso binomial, en la columnaB se generarán los valores aleatorios que simulan el contexto del problema. Así, dando clic sobre labotón Análisis de datos del menú Datos y eligiendo la función Generación de números aleatorios,en el cuadro de dialogo que se abre, se selecciona en el menú Distribución la opción Normal y sellena el recuadro como a continuación aparece:

7

L. Alejandro Masmela
For Comment
Page 8: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

Al oprimir Aceptar se puede observar la generación de los números aleatorios. Una vez generadoséstos aparecen seleccionados (si no es así, se seleccionan sombreándolos) se procede inmediatamentea ordenarlos dando clic sobre el botón que aparece encerrado en el círculo en el menú Ordenar enla �gura.

En los datos aquí simulados, aparece como primer valor 139.85 que representa el contenido de unprimer vaso de gaseosa servido por la máquina y que de acuerdo al contexto del problema seríade 139.85 mililitros. La columna etiquetada con n permite, como se mencionaba con anterioridad,contar los datos, es así como si se desea contar cuántos datos hay menores a 152, al observar la�gura, esta columna permite concluir que hay 12 de ellos. No sobra recordar que los resultados desu simulación muy probablemente di�eran debido a que el trabajo se hace sobre la generación denúmeros aleatorios.

8

L. Alejandro Masmela
For Comment
Page 9: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

Una forma de observar cómo se comportan los datos es ilustrar esta variable mediante unhistograma, para ello se procede de la siguiente manera. En el menú Análisis de datos se seleccionala función Histograma,

y en la caja de diálogo que allí se despliega, se rellena de la siguiente forma,

el histograma que ilustra esta variable se presenta a continuación.

Se observa que aunque es un histograma, es decir un grá�co compuesto de barras cuya alturadenotan la frecuencia de los datos en este rango, éste presenta la forma acampanada característica

9

L. Alejandro Masmela
For Comment
Page 10: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

de la distribución normal. Se centra aproximadamente en 200 mililitros, la media. El cálculo deproporciones de datos en algún rango podría hacerse con este histograma, sabiendo la altura exactaa la que están cada una de las barras del mismo y el intervalo que su frecuencia representa. Pararealizar esta tarea de manera más simple, se volverá a la hoja del archivo Excel en donde se generaronlos datos iniciales.Para la aproximación a la primera probabilidad en el literal (a) del Ejemplo 2, se debe observar

cuántos valores de la columna etiquetada con x son mayores que 224, para la simulación que aquí serealiza se observa en la siguiente �gura que el primer valor menor a 224 aparece en la casilla 9452,

de esta forma hay, 10000� 9452 = 548 valores menores que 224, esto proporcionalmente equivale a

10000� 945210000

= 1� 9452

10000= 1� 0;9452= 0;0548

que aproxima de buena manera la probabilidad 0;054 8 obtenida en (6). De la misma forma, parala aproximación del cálculo en la probabilidad del literal (b) se observa en la siguiente �gura que

El primer valor menor a 209 está en la posición 7208 mientras que el primer valor menor a 191 estáen la casilla 2728, así, la proporción de valores entre 191 y 209 está dada por

7208� 272810000

=7208

10000� 2728

10000= 0;7208� 0;2728= 0;448

que aproxima de buena manera la probabilidad 0;4514 en (7).

10

L. Alejandro Masmela
For Comment
Page 11: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

3. El Teorema del Límite Central

El teorema del límite central o teorema central del límite indica que, en condiciones muy gen-erales, la distribución de la suma de variables aleatorias tiende a una distribución normal cuandola cantidad de variables es muy grande. Este teorema, perteneciente a la teoría de la probabilidad,encuentra aplicación en muchos campos relacionados, tales como la inferencia estadística o la teoríade renovación.El teorema en un curso de estadística inferencial para pregrado se puede enunciar de la siguiente

forma:

Teorema 3 Sea X1; X2; :::; Xn una muestra aleatoria de una población cuya distribución tiene pormedia � y por desviación estándar �: Entonces, si n es su�cientemente grande, la variable aleatoria

X =

Pni=1Xin

tiene una distribución aproximadamente normal con media �X = � y �X = �=pn: De esta forma

la variable

Z =X � ��=pn

se distribuye aproximadamente normal estándar, conforme n se hace grande.

Ejemplo 4 Una empresa eléctrica fabrica focos que tienen una duración que se distribuye aproxi-madamente en forma normal, con media de 800 horas y desviación estándar de 40 horas. Encuentrela probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775horas.

SoluciónDe acuerdo con el enunciado, se bautiza la variable Xi como la duración del i�ésimo foco en

la muestra tomada. Así, la variable aleatoria Xi provienen de una población con media � = 800horas y desviación � = 40 horas. De esta forma, por el teorema del límite central, si se tomanmuestras de esta población de tamaño n = 16 y se calculan sus promedios, la variable aleatoria Xse distribuye aproximadamente normal con media �X = 800 y desviación �X = 40=

p16 = 10: El

problema requiere el cálculo de la probabilidad

P�X < 775

�= P

�X � �X�X

<775� 800

10

�(8)

= P (Z < �2;5)= 0;0062

Ejemplo 5 En un proceso químico, la cantidad de cierto tipo de impurezas en el producto es di�cilde controlar y por ello es una variable aleaoria. Se especula que la cantidad media de la poblaciónde impurezas es de 0;20 gramos por gramo del producto. Se sabe que la desviación estándar es 0;1gramos por gramo del producto. Se realiza un experimento para aprender más con respecto a laespeculación de que � = 0;2: El proceso se lleva a cabo 50 veces en un laboratorio y el promedio dela muestra x resulta ser 0;23 gramos por gramo. Comente sobre la especulación de que la cantidadmedia de impurezas es 0;20 gramos por gramo. Utilice el teorema del límite central en su respuesta.

11

L. Alejandro Masmela
For Comment
Page 12: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

SoluciónSiendo X el promedio de impurezas en gramos por gramo de muestras de tamaño 50, por el

teorema del límite central y soportado en las especulaciones sobre la cantidad media de la poblaciónde impurezas, se puede a�rmar que la variable aleatoria X se distribuye normal con media �X = 0;2y �X = 0;1=

p50 � 0;01 414: Ya que la distribución de X se centra en �X = 0;2 y el valor que

arroja el promedio de los 50 experimentos realizados es de x = 0;23; valor que queda a la derechadel centro de la distribución, se calcula la probabilidad

P�X > 0;23

�= P

�X � �X�X

>0;23� 0;20;01 414

�= P (Z > 2: 121 6)

= 1� P (Z < 2: 121 6)= 0;0174

A partir de esta probabilidad se puede argumentar que, obtener muestras de tamaño 50 con prome-dios arriba de 0;23 gramos por gramo es bastante improbable, apenas un 0;0174; en otras palabras,el valor obtenido a partir del promedio de los 50 experimentos, es decir 0;23, estaría bastante lejanode la a�rmación de que �X = 0;2; es por esto que la evidencia muestral no apoyaría el hecho que�X = 0;2:

3.1. Simulación: Teorema del Límite Central

Para el teorema del límite central se presentaron dos problemas que ilustran tanto el cálculo deprobabilidades como la toma de decisiones basado en éste.El Ejemplo 4 se simulará de acuerdo a su contexto de la siguiente manera, en una hoja nueva

de Excel se etiquetán las columnas desde la A hasta la P en la primera �la con los nombres X1hasta X16; rellenando las dos primeras celdas de la columna A y B con X1 y X2 y seleccionandolas,nuevamente se posiciona el cursor en el vértice inferior derecho del recuadro que sombrea ambascolumnas, cuando el cursor cambie de forma se da clic sostenido y se arrastra hasta llevarlo ala columna P, desplazándose por la primera �la, de esta forma se generan automáticamente lasetiquetas. Luego de esto se generarán 10 mil muestras de tamaño 16 de una población que sedistribuye normal con media � = 800 horas, la media de duración de los bombillos, y desviaciónestándar � = 40 horas. Procediendo de manera similar con el proceso de generación de númerosaleatorios, se completa la caja de diálogo de la forma en que se presenta en la �gura.

12

L. Alejandro Masmela
For Comment
Page 13: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

Lo que se debe tener presente es que los datos generados presentan 10 mil muestras en las 10 mil�las, desde la �la 2 hasta la �la 10001, de tamaño 16 cada una, de la columna A hasta la P. Lacolumna Q se etiqueta con la palabra Media, ésta contendrá los valores de X de cada una de las10 mil muestras, esto se realiza ubicando el cursor en la celda Q2 y en el menú Fórmulas se da clicsobre Insertar función, en el recuadro Insertar función se busca la función Promedio.

En la línea Número de la caja de dialogo Promedio se escribe el rango de los datos a los cuales seles quiere calcular el promedio o media, en este caso se quiere calcular el promedio de la primeramuestra de 16 datos que aparece en la �la 2 y que va desde A2 hasta P2.

13

L. Alejandro Masmela
For Comment
Page 14: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

Se da clic en Aceptar y nuevamente se copia la formula en las celdas de la columna Q, de la celda Q2a la celda Q10001, esto se puede hacer, habiendo seleccionado la celda Q2, posicionando el cursoren el vértice inferior derecho, allí donde aparece un punto negro, y cuando éste cambie de forma,dando clic sostenido y arrastrando la formula hasta la celda Q10001 o dando doble clic sobre estepunto.Al igual que en la simulación de la normal, se etiqueta la columna R con n y se escribirán allí los

números de 1 a 10000, esta variable permitirá contar más fácilmente valores en rangos determinados.Como la idea es contar facilmente, se etiqueta la columna S con Media ord, esta columna contendrálas medias pero ordenadas, se procede de la siguiente manera. Se seleccionan los 10 mil promedios dela columna Media, se da clic derecho y se selecciona la opción copiar y en la posición de la celda S2,dando nuevamente clic derecho se selecciona la opción Pegado especial, del recuadro que se abre seselecciona la opción Valores y luego Aceptar, este proceso permite pegar los promedios en la nuevacolumna S pero no ligada a cada muestra a través de formula sino como simples valores. Luego depegados estos valores se procede a ordenarlos, seleccionandolos y en el menú Datos dando clic sobreel botón Ordenar de menor a mayor, cuando el programa despliegue la ventana Advertencia antesde ordenar se selecciona la opción Continuar con la selección actual y luego clic en Ordenar.Para ver el comportamiento de la variable Media, objeto de estudio en el contexto del Teorema

del Límite Central, se realizará un histograma de esta variable y se calcularán unas estadísticasdescriptivas básicas. El histograma se genera de la misma forma que se hizo en la sección de ladistribución normal, así la grá�ca que ilustra esta simulación se muestra a continuación.

14

L. Alejandro Masmela
For Comment
Page 15: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

El grá�co permite ver el comportamiento aproximadamente normal de la variable aleatoria X:Este se centra en aproximadamente 800, como reza el Teorema del Límite Central, para analizar lavarianza de la distribución debe acudirse a un análisis minucioso de los datos, esto se realizará apartir de unas estadísticas básicas. En el menú Análisis de datos se selecciona la función Estadísticadescriptiva,

Se completa la caja de diálogo que aquí se despliega como aparece a continuación,

15

L. Alejandro Masmela
For Comment
Page 16: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

las estadísticas básicas que se calculan aparecen en el siguiente cuadro, sombreadas aparecen lasque interesan en el contexto del teorema estudiado.

Los valores de la Media y la Desviación estándar en el cuadro de estadísticas básicas de la variableMedia aproximan muy bien los valores �X = 800 y �X = 40=

p16 = 10 en el Ejemplo 4, la Varianza

de la muestra aproxima, obviamente, el valor �2X=�40=p16�2= 100:

Para la aproximación a la probabilidad pedida en el Ejemplo 4 se utilizará la variable Media ord,que contiene las medias ordenadas junto con la variable n que facilita el conteo de las medias. Parala probabilidad pedida, esto es P

�X < 775

�; simplemente se cuenta el número de medias menores

a 775 y se encuentra su proporción dentro de las 10 mil.

Así, el número de medias en la simulación que aquí se realizó, muestra que hay 64 menores a 775,que en proporción equivalen a

64

10000= 0;0064

que aproxima la probabilidad teórica 0;062 en (8).Para la última simulación, que ilustra el Ejemplo 5, el procedimiento es similar a la simulación

anterior, y las herramientas utilizadas de Excel son similares a las anteriores, es por eso que, seconcentrará la atención en los resultados y en su interpretación.

16

L. Alejandro Masmela
For Comment
Page 17: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

El procedimiento para esta simulación, como se mencionó, es similar a la anterior, salvo que segenerarán 10 mil muestras de tamaño 50, como lo expresa el Ejemplo 5, es decir se utilizarán lascolumnas desde la A hasta la AX, en la columna AY vendrá la Media, en la AZ la variable n yen la BA la variable Media ord. Se procede de manera similar, esta vez, claro está, se habla de 50columnas, generadas a partir de una normal con media � = 0;20, bajo el supuesto del problema, ycon desviación estándar � = 0;1: Por ser la media tan próxima a cero, la simulación puede generaralgunos datos negativos que no deben producir desconcierto, simplemente no tendrían interpretaciónen el contexto de problema, es así que el histograma que produjo los datos que aquí surgieron sepuede observar en la �gura.

Lo que se puede observar es que el histograma con forma acampanada, acumula bajas probabilidadesen las colas, es así como valores ubicados en esas colas son muy improbables, estos valores en lacolumna etiquetada como Media ord en la hoja de cálculo se acumularán al principio de la columnao al �nal. Es así que si se observa en que parte de esta columna se ubicará, más o menos, el valor0; 23; que es el que arroja el experimento, según el Ejemplo 4, en la simulación que aquí se realizase observa en la �gura que cae en los últimos valores de la columna, posición 9843 de 10 mil.

La probabilidad calculada en el Ejemplo 4, P�X > 0;23

�, se puede aproximar en la simulación

17

L. Alejandro Masmela
For Comment
Page 18: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

encontrando la proporción de medias de muestras mayores a 0.23, esto es

10000� 984210000

= 1� 9842

10000= 1� 0;9842= 0;015 8

una buena aproximación al valor teórico 0;0174:Cabe anotar que los aleatorios que se presentan en las dos simulaciones del Teorema del Límite

Central se generan a partir de una distribución normal en la población muestreada. El Teorema delLímite Central no establece esto como hipótesis, la bondad del teorema es que da la libertad demuestrear de cualquier tipo de población. De esta forma, las muestras pueden provenir de cualquierdistribución que se quiera, no obstante, la distribución deX se aproximará a una normal conforme eltamaño de la muestra se haga muy grande. Como ejercicio para el lector queda realizar simulacionespara veri�car que al muestrear de poblaciones con cualquier distribución esto se cumple.

4. Conclusiones

Ayudas computacionales a la par del desarrollo teórico de la clase permiten al docente aproximaral estudiante de manera más intuitiva a conceptos complejos de la teoría de la probabilidad y laestadística inferencial. Mediante la adaptación de problemas interesantes a procesos de simulacióny convirtiendose el docente en un guía que ayude al estudiante a la interpretación de cada uno delos resultados generados computacionalmente, se facilitan al estudiante procesos de asimilación ycomprensión de conceptos desarrollados en clase. Además a través de este proceso se presenta unatécnica interesante como herramienta de investigación y análisis como lo es el proceso de simulacióncomputacional. Por otro lado el trabajo con el uso de la hoja de cálculo por parte del estudiante,mejora en él el uso de ésta como herramienta avanzada para el diseño, planteamiento y solución deproblemas de carácter estadístico.

Referencias

[1] Lopes, P. Probabilidad & Estadística. Pearson Educación de Colombia. Bogotá. 2000.

[2] Mendenhall, W. Beaver, R. Beaver, B. Introducción a la probabilidad y estadística. ThomsonLearning. 2002.

[3] Walpole, R. Myers, R. Myers, S. Ye, K. Probabilidad y estadística para ingeniería y ciencias.2007.

18

L. Alejandro Masmela
For Comment
Page 19: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

5. Anexo

Antes de inciar con la simulación, es importante que en el menú de Excel aparezca cargada laopción ¨Análisis de Datos¨ .

En caso de que no esté cargada, para activar este menú se da click sobre el ¨ Boton de O¢ ce¨ y enel menú que se despliega se da click sobre ¨Opciones de Excel ¨ ,

en la caja de dialogo que se abre se da click sobre el menú de ¨ Complementos¨ y allí estando activaen el recuadro ¨Administrar ¨ la opción ¨ Complementos de Excel ¨ se da oprime el boton ¨ Ir...¨ ,

19

L. Alejandro Masmela
For Comment
Page 20: Algunos conceptos de probabilidad y estadística inferencial ilustrados mediante simulaciones utilizando Excel

en la caja de dialogo complementos se veri�can las dos opciones ¨Herramientas para análisis -VBA¨ y ¨VBA del Ayudante para Internet ¨ y luego click sobre ¨Aceptar ¨ .

20

L. Alejandro Masmela
For Comment