generación de números random

24
Índice I. Generación de los números aleatorios 07 II. Agrupamiento de 5 en 5 de los números aleatorios 10 III. Agrupamiento de 10 en 10 de los números aleatorios 12 IV. Agrupamiento de 20 en 20 de los números aleatorios 14 V. Agrupamiento de 50 en 50 de los números aleatorios 16

Upload: hugo-rodrigo-deudor-benavente

Post on 06-Apr-2016

213 views

Category:

Documents


0 download

DESCRIPTION

Generación de 10 000 números random y compositación . Análisis estadístico.

TRANSCRIPT

Índice

I. Generación de los números aleatorios 07

II. Agrupamiento de 5 en 5 de los números aleatorios 10

III. Agrupamiento de 10 en 10 de los números aleatorios 12

IV. Agrupamiento de 20 en 20 de los números aleatorios 14

V. Agrupamiento de 50 en 50 de los números aleatorios 16

VI. Comparación de resultados 18

~ 2 ~

Resúmen

Este trabajo trata de generar 10 000 números aleatorio ; en el primer capítulo

analizaremos todos esos números para observar su comportamiento como una

variable de distribución uniforme , hallando su varianza , media , coeficiente de

variación y su histograma. En el segundo capítulo agruparemos de 5 en 5

consecutivamente y se hallará su promedio para que con esos datos elaborar su

histograma y hallar su varianza , media y coeficiente de variación. En los siguiente

capítulos se desarrollará análogamente agrupando de 10 en 10 , 20 en 20 y 50 en 50.

Después de eso se interpretará los resultados para llegar a una explicación

convincente de lo ocurrido. Cabe resaltar que este trabajo fue realizado en Matlab

2013 , en este programa se programó correctamente para poder realizar lo descrito y

tener los datos correctos , para las gráficas del histograma y poder juntarlos en una

sola se utilizó el programa MiniTab 17. Esos programas pudieron ser descargados

gratuitamente por Internet válido por un periodo de un mes (30 días).

Se llega a demostrar de forma práctica el Teorema del Límite Central que nos dice

que si tenemos un grupo numeroso de variables independientes y todas ellas siguen

el mismo modelo de distribución (cualquiera que éste sea), la suma de ellas se

distribuye según una distribución normal.

~ 3 ~

ABSTRACT

This work refers to generate 10,000 random numbers; in the first chapter will discuss

all these numbers to observe their behavior as a variable of uniform distribution,

finding its variance, mean, coefficient of variation and its histogram. The second

chapter will group of 5 in 5 consecutively and be averaged with that data to develop

its histogram and find its variance, mean and coefficient of variation. In the

following chapters will develop similarly gathering from 10 to 10, 20 to 20 and 50 to

50.

After that the results are interpreted to reach a convincing explanation of what

happened. It should be noted that this work was done in Matlab 2013, this program

was programmed correctly to perform described and have the correct data for

graphical histogram and to bring them together in one the MiniTab program 17 was

used Such programs could be free downloads for Internet valid for a period of one

month (30 days).

You reach the practical demonstration of the Central Limit Theorem tells us that if

we have a large number of independent variables and they all follow the same pattern

of distribution (whatever that is), the sum of which is distributed according to a

normal distribution.

~ 4 ~

INTRODUCCIÓN

En este trabajo que he realizado con mucho esmero se puede encontrar la aplicación

práctica del Teorema del Límite Central, para ellos se generó 10 000 números

aleatorios y fueron agrupados convenientemente para observar su comportamiento y

comprobar dicho teorema.

También se podrán encontrar las medidas estadísticas de dispersión (media, varianza,

coeficiente de variación) de cada grupo, así como sus respectivos histogramas y la

línea de ajuste para lograr un mejor entendimiento al lector.

Al final del trabajo estarán descritas las conclusiones llegadas luego de analizar,

investigar y discutir el teorema del límite central y nuestros resultados obtenidos.

Sin más preámbulos dejo mi trabajo a su disposición para ser revisado y sirva como

fuente de apoyo y/o discusión de trabajos posteriores.

~ 5 ~

I

GENERACIÓN DE LOS NÚMEROS ALEATORIOS

En este capítulo se explica la generación de los 10 000 números aleatorios pedidos en

clase, para esto se utilizó el programa Matlab 2013 donde se digitó el siguiente

código de programación:

A=rand(10000,1)

Que nos genera una matriz columna de 10 000 filas con números aleatorios que se

encuentran dentro del intervalo de 0 y 1.

Estos números se comportan como una distribución uniforme.

I.1 Distribución Uniforme:

En teoría de probabilidad y estadística, la distribución uniforme continua es una

familia de distribuciones de probabilidad para variables aleatorias continuas,

tales que cada miembro de la familia, todos los intervalos de igual longitud en la

distribución en su rango son igualmente probables. El dominio está definido por

dos parámetros, a y b, que son sus valores mínimo y máximo. La distribución es

a menudo escrita en forma abreviada como U(a,b).

~ 6 ~

Figura 1.1 Distribución Uniforme

I.2. Medidas de Estadística de Dispersión de los números aleatorios

obtenidos:

Con el programa Matlab podemos obtener sus medidas estadísticas de

dispersión fácilmente , con los siguientes códigos :

mean (A) = Media de todos los datos en la matriz A

var(A) = Varianza de todos los datos en la matriz A

std (A) = Desviación estándar de todos los datos en la matriz A.

Al realizarlo con nuestros datos se obtiene:

~ 7 ~

Tabla 1.1 Medidas Estadística de Matriz A

Los resultados obtenidos, concuerdan con las fórmulas estadísticas lo que nos

comprueba la veracidad de esas fórmulas

Su histograma es el siguiente:

Figura 1.2 Histograma de matriz A

AMedia 0.5004

Varianza 0.0838Desviación Estandar 0.2894

Coeficiente de Variación 0.57834

~ 8 ~

II

AGRUPAMIENTO DE 5 EN 5 DE LOS NÚMEROS ALEATORIOS

En este capítulo se agrupará de 5 en 5 los 10 000 números aleatorios generados

anteriormente , se formaran un total de 2 000 grupos , a esos grupos se le hallará su

promedio o media aritmética .

Con esos 2 000 promedios se procederá a hallar sus medidas estadísticas de

dispersión , tales como : media , varianza , desviación estándar y coeficiente de

variación ; y su histograma correspondiente.

Para ello se desarrollará en el programa Matlab el código de programación , el cual

es :

for i=1:2000B(i,1)=iend;

for j=1:2000l=0

for k=5*j-4:5*jl=A(k)+l

~ 9 ~

endB(j,1)= l/5

end

Donde la matriz B será nuestra matriz de las 2 000 medias halladas .

Sus medidas estadísticas halladas son las siguientes :

Tabla 2.1 Medidas Estadística de Matriz B

Su histograma es el siguiente:

0.840.720.600.480.360.240.12

140

120

100

80

60

40

20

0

Media 0.5005Desv.Est. 0.1303N 2000

B

Frec

uenc

ia

Histograma de BNormal

BMedia 0.5004

Varianza 0.0169Desviación Estandar 0.1303

Coeficiente de Variación 0.26039

~ 10 ~

Figura 2.1 Histograma de matriz B

III

AGRUPAMIENTO DE 10 EN 10 DE LOS NÚMEROS ALEATORIOS

En este capítulo se agrupará de 10 en 10 los 10 000 números aleatorios generados

anteriormente , se formaran un total de 1 000 grupos , a esos grupos se le hallará su

promedio o media aritmética .

Con esos 1 000 promedios se procederá a hallar sus medidas estadísticas de

dispersión , tales como : media , varianza , desviación estándar y coeficiente de

variación ; y su histograma correspondiente.

Para ello se desarrollará en el programa Matlab el código de programación , el cual

es :

Donde la matriz C será nuestra matriz de las 1 000 medias halladas .

for a=1:1000 C(a,1)=a

end;for b=1:1000

m=0 for c=10*b-9:10*b

~ 11 ~

m=A(c)+m end

C(b,1)= m/10 end

Sus medidas estadísticas halladas son las siguientes:

Tabla 3.1 Medidas Estadística de Matriz C

Su histograma es el siguiente:

0.800.720.640.560.480.400.320.24

90

80

70

60

50

40

30

20

10

0

Media 0.5005Desv.Est. 0.09083N 1000

C

Frec

uenc

ia

Histograma de CNormal

CMedia 0.5004

Varianza 0.0082Desviación Estandar 0.0908

Coeficiente de Variación 0.18145

~ 12 ~

Figura 3.1 Histograma de matriz C

IV

AGRUPAMIENTO DE 20 EN 20 DE LOS NÚMEROS ALEATORIOS

En este capítulo se agrupará de 20 en 20 los 10 000 números aleatorios generados

anteriormente, se formaran un total de 500 grupos , a esos grupos se le hallará su

promedio o media aritmética .

Con esos 500 promedios se procederá a hallar sus medidas estadísticas de

dispersión , tales como : media , varianza , desviación estándar y coeficiente de

variación ; y su histograma correspondiente.

Para ello se desarrollará en el programa Matlab el código de programación , el cual

es :

Donde la matriz D será nuestra matriz de las 500 medias halladas .

for d=1:500 D(d,1)=d

end;for e=1:500

~ 13 ~

n=0 for f=20*e-19:20*e

n=A(f)+n end

D(e,1)= n/20 end

Sus medidas estadísticas halladas son las siguientes:

Tabla 4.1 Medidas Estadística de Matriz D

Su histograma es el siguiente:

0.800.720.640.560.480.400.32

70

60

50

40

30

20

10

0

Media 0.5005Desv.Est. 0.06426N 500

D

Frec

uenc

ia

Histograma de DNormal

DMedia 0.5004

Varianza 0.0041Desviación Estándar 0.06426

Coeficiente de Variación 0.12842

~ 14 ~

Figura 4.1 Histograma de matriz D

V

AGRUPAMIENTO DE 50 EN 50 DE LOS NÚMEROS ALEATORIOS

En este capítulo se agrupará de 50 en 50 los 10 000 números aleatorios generados

anteriormente, se formaran un total de 200 grupos , a esos grupos se le hallará su

promedio o media aritmética .

Con esos 200 promedios se procederá a hallar sus medidas estadísticas de

dispersión , tales como : media , varianza , desviación estándar y coeficiente de

variación ; y su histograma correspondiente.

Para ello se desarrollará en el programa Matlab el código de programación, el cual

es:

for g=1:200 E(g,1)=g

end;

~ 15 ~

for h=1:200 o=0

for t=50*h-49:50*h o=A(t)+o

end E(h,1)= o/50

End

Donde la matriz E será nuestra matriz de las 200 medias halladas.

Sus medidas estadísticas halladas son las siguientes:

Tabla 5.1 Medidas Estadística de Matriz E

EMedia 0.5004

Varianza 0.0017Desviación Estandar 0.0411

Coeficiente de Variación 0.08213

Su histograma es el siguiente:

0.640.600.560.520.480.440.40

40

30

20

10

0

Media 0.5005Desv.Est. 0.04115N 200

E

Frec

uenc

ia

Histograma de ENormal

~ 16 ~

Figura 5.1 Histograma de matriz E

VI

COMPARACIÓN DE RESULTADOS

Figura 6.1 Histograma de las matrices A, B, C, D y E

10

2

4

6

8

01

81.0- 00.0 81.0 63.0 45.0 27.0 09.0 80.

0.5005 0.2895 100000.5005 0.1303 20000.5005 0.09083 10000.5005 0.06426 5000.5005 0.04115 200

Media Desv.Est. N

D

dadisneD

sota

AelbairaV

EDCB

H lamroN

E ,D ,C ,B ,A ed amargotsi

~ 17 ~

Figura 6.2 Histograma de las matrices A, B, C, D y E

El teorema de límite central lo observamos en la gráfica 6.2 donde se tiene en el eje

Y a la frecuencia, nos damos cuenta que a más números de muestra su línea de

ajuste toma la forma de la distribución normal.

10

05

001

051

002

052

003

81.0- 00.0 81.0 63.0 45.0 27.0 09.0 80.

0.5005 0.2895 100000.5005 0.1303 20000.5005 0.09083 10000.5005 0.06426 5000.5005 0.04115 200

Media Desv.Est. N

D

aicneucerF

sota

AelbairaV

EDCB

H lamroN

E ,D ,C ,B ,A ed amargotsi

~ 18 ~

CONCLUSIONES

A mayor cantidad de números aleatorios es más cerca el valor de las medidas

estadísticas de dispersión (media, varianza, desviación estándar) con las

fórmulas teóricas.

La media de los números aleatorios coincide con la media de todos los grupos

formados.

El coeficiente de variación disminuye a medida de que la cantidad de grupos

disminuye.

Mientras se tomen más grupos como muestra, la línea de ajuste tiende a la

forma de la distribución normal.

La varianza disminuye cuando se disminuye el número de grupos.

~ 19 ~