generación de números random
DESCRIPTION
Generación de 10 000 números random y compositación . Análisis estadístico.TRANSCRIPT
Índice
I. Generación de los números aleatorios 07
II. Agrupamiento de 5 en 5 de los números aleatorios 10
III. Agrupamiento de 10 en 10 de los números aleatorios 12
IV. Agrupamiento de 20 en 20 de los números aleatorios 14
V. Agrupamiento de 50 en 50 de los números aleatorios 16
VI. Comparación de resultados 18
~ 2 ~
Resúmen
Este trabajo trata de generar 10 000 números aleatorio ; en el primer capítulo
analizaremos todos esos números para observar su comportamiento como una
variable de distribución uniforme , hallando su varianza , media , coeficiente de
variación y su histograma. En el segundo capítulo agruparemos de 5 en 5
consecutivamente y se hallará su promedio para que con esos datos elaborar su
histograma y hallar su varianza , media y coeficiente de variación. En los siguiente
capítulos se desarrollará análogamente agrupando de 10 en 10 , 20 en 20 y 50 en 50.
Después de eso se interpretará los resultados para llegar a una explicación
convincente de lo ocurrido. Cabe resaltar que este trabajo fue realizado en Matlab
2013 , en este programa se programó correctamente para poder realizar lo descrito y
tener los datos correctos , para las gráficas del histograma y poder juntarlos en una
sola se utilizó el programa MiniTab 17. Esos programas pudieron ser descargados
gratuitamente por Internet válido por un periodo de un mes (30 días).
Se llega a demostrar de forma práctica el Teorema del Límite Central que nos dice
que si tenemos un grupo numeroso de variables independientes y todas ellas siguen
el mismo modelo de distribución (cualquiera que éste sea), la suma de ellas se
distribuye según una distribución normal.
~ 3 ~
ABSTRACT
This work refers to generate 10,000 random numbers; in the first chapter will discuss
all these numbers to observe their behavior as a variable of uniform distribution,
finding its variance, mean, coefficient of variation and its histogram. The second
chapter will group of 5 in 5 consecutively and be averaged with that data to develop
its histogram and find its variance, mean and coefficient of variation. In the
following chapters will develop similarly gathering from 10 to 10, 20 to 20 and 50 to
50.
After that the results are interpreted to reach a convincing explanation of what
happened. It should be noted that this work was done in Matlab 2013, this program
was programmed correctly to perform described and have the correct data for
graphical histogram and to bring them together in one the MiniTab program 17 was
used Such programs could be free downloads for Internet valid for a period of one
month (30 days).
You reach the practical demonstration of the Central Limit Theorem tells us that if
we have a large number of independent variables and they all follow the same pattern
of distribution (whatever that is), the sum of which is distributed according to a
normal distribution.
~ 4 ~
INTRODUCCIÓN
En este trabajo que he realizado con mucho esmero se puede encontrar la aplicación
práctica del Teorema del Límite Central, para ellos se generó 10 000 números
aleatorios y fueron agrupados convenientemente para observar su comportamiento y
comprobar dicho teorema.
También se podrán encontrar las medidas estadísticas de dispersión (media, varianza,
coeficiente de variación) de cada grupo, así como sus respectivos histogramas y la
línea de ajuste para lograr un mejor entendimiento al lector.
Al final del trabajo estarán descritas las conclusiones llegadas luego de analizar,
investigar y discutir el teorema del límite central y nuestros resultados obtenidos.
Sin más preámbulos dejo mi trabajo a su disposición para ser revisado y sirva como
fuente de apoyo y/o discusión de trabajos posteriores.
~ 5 ~
I
GENERACIÓN DE LOS NÚMEROS ALEATORIOS
En este capítulo se explica la generación de los 10 000 números aleatorios pedidos en
clase, para esto se utilizó el programa Matlab 2013 donde se digitó el siguiente
código de programación:
A=rand(10000,1)
Que nos genera una matriz columna de 10 000 filas con números aleatorios que se
encuentran dentro del intervalo de 0 y 1.
Estos números se comportan como una distribución uniforme.
I.1 Distribución Uniforme:
En teoría de probabilidad y estadística, la distribución uniforme continua es una
familia de distribuciones de probabilidad para variables aleatorias continuas,
tales que cada miembro de la familia, todos los intervalos de igual longitud en la
distribución en su rango son igualmente probables. El dominio está definido por
dos parámetros, a y b, que son sus valores mínimo y máximo. La distribución es
a menudo escrita en forma abreviada como U(a,b).
~ 6 ~
Figura 1.1 Distribución Uniforme
I.2. Medidas de Estadística de Dispersión de los números aleatorios
obtenidos:
Con el programa Matlab podemos obtener sus medidas estadísticas de
dispersión fácilmente , con los siguientes códigos :
mean (A) = Media de todos los datos en la matriz A
var(A) = Varianza de todos los datos en la matriz A
std (A) = Desviación estándar de todos los datos en la matriz A.
Al realizarlo con nuestros datos se obtiene:
~ 7 ~
Tabla 1.1 Medidas Estadística de Matriz A
Los resultados obtenidos, concuerdan con las fórmulas estadísticas lo que nos
comprueba la veracidad de esas fórmulas
Su histograma es el siguiente:
Figura 1.2 Histograma de matriz A
AMedia 0.5004
Varianza 0.0838Desviación Estandar 0.2894
Coeficiente de Variación 0.57834
~ 8 ~
II
AGRUPAMIENTO DE 5 EN 5 DE LOS NÚMEROS ALEATORIOS
En este capítulo se agrupará de 5 en 5 los 10 000 números aleatorios generados
anteriormente , se formaran un total de 2 000 grupos , a esos grupos se le hallará su
promedio o media aritmética .
Con esos 2 000 promedios se procederá a hallar sus medidas estadísticas de
dispersión , tales como : media , varianza , desviación estándar y coeficiente de
variación ; y su histograma correspondiente.
Para ello se desarrollará en el programa Matlab el código de programación , el cual
es :
for i=1:2000B(i,1)=iend;
for j=1:2000l=0
for k=5*j-4:5*jl=A(k)+l
~ 9 ~
endB(j,1)= l/5
end
Donde la matriz B será nuestra matriz de las 2 000 medias halladas .
Sus medidas estadísticas halladas son las siguientes :
Tabla 2.1 Medidas Estadística de Matriz B
Su histograma es el siguiente:
0.840.720.600.480.360.240.12
140
120
100
80
60
40
20
0
Media 0.5005Desv.Est. 0.1303N 2000
B
Frec
uenc
ia
Histograma de BNormal
BMedia 0.5004
Varianza 0.0169Desviación Estandar 0.1303
Coeficiente de Variación 0.26039
~ 10 ~
Figura 2.1 Histograma de matriz B
III
AGRUPAMIENTO DE 10 EN 10 DE LOS NÚMEROS ALEATORIOS
En este capítulo se agrupará de 10 en 10 los 10 000 números aleatorios generados
anteriormente , se formaran un total de 1 000 grupos , a esos grupos se le hallará su
promedio o media aritmética .
Con esos 1 000 promedios se procederá a hallar sus medidas estadísticas de
dispersión , tales como : media , varianza , desviación estándar y coeficiente de
variación ; y su histograma correspondiente.
Para ello se desarrollará en el programa Matlab el código de programación , el cual
es :
Donde la matriz C será nuestra matriz de las 1 000 medias halladas .
for a=1:1000 C(a,1)=a
end;for b=1:1000
m=0 for c=10*b-9:10*b
~ 11 ~
m=A(c)+m end
C(b,1)= m/10 end
Sus medidas estadísticas halladas son las siguientes:
Tabla 3.1 Medidas Estadística de Matriz C
Su histograma es el siguiente:
0.800.720.640.560.480.400.320.24
90
80
70
60
50
40
30
20
10
0
Media 0.5005Desv.Est. 0.09083N 1000
C
Frec
uenc
ia
Histograma de CNormal
CMedia 0.5004
Varianza 0.0082Desviación Estandar 0.0908
Coeficiente de Variación 0.18145
~ 12 ~
Figura 3.1 Histograma de matriz C
IV
AGRUPAMIENTO DE 20 EN 20 DE LOS NÚMEROS ALEATORIOS
En este capítulo se agrupará de 20 en 20 los 10 000 números aleatorios generados
anteriormente, se formaran un total de 500 grupos , a esos grupos se le hallará su
promedio o media aritmética .
Con esos 500 promedios se procederá a hallar sus medidas estadísticas de
dispersión , tales como : media , varianza , desviación estándar y coeficiente de
variación ; y su histograma correspondiente.
Para ello se desarrollará en el programa Matlab el código de programación , el cual
es :
Donde la matriz D será nuestra matriz de las 500 medias halladas .
for d=1:500 D(d,1)=d
end;for e=1:500
~ 13 ~
n=0 for f=20*e-19:20*e
n=A(f)+n end
D(e,1)= n/20 end
Sus medidas estadísticas halladas son las siguientes:
Tabla 4.1 Medidas Estadística de Matriz D
Su histograma es el siguiente:
0.800.720.640.560.480.400.32
70
60
50
40
30
20
10
0
Media 0.5005Desv.Est. 0.06426N 500
D
Frec
uenc
ia
Histograma de DNormal
DMedia 0.5004
Varianza 0.0041Desviación Estándar 0.06426
Coeficiente de Variación 0.12842
~ 14 ~
Figura 4.1 Histograma de matriz D
V
AGRUPAMIENTO DE 50 EN 50 DE LOS NÚMEROS ALEATORIOS
En este capítulo se agrupará de 50 en 50 los 10 000 números aleatorios generados
anteriormente, se formaran un total de 200 grupos , a esos grupos se le hallará su
promedio o media aritmética .
Con esos 200 promedios se procederá a hallar sus medidas estadísticas de
dispersión , tales como : media , varianza , desviación estándar y coeficiente de
variación ; y su histograma correspondiente.
Para ello se desarrollará en el programa Matlab el código de programación, el cual
es:
for g=1:200 E(g,1)=g
end;
~ 15 ~
for h=1:200 o=0
for t=50*h-49:50*h o=A(t)+o
end E(h,1)= o/50
End
Donde la matriz E será nuestra matriz de las 200 medias halladas.
Sus medidas estadísticas halladas son las siguientes:
Tabla 5.1 Medidas Estadística de Matriz E
EMedia 0.5004
Varianza 0.0017Desviación Estandar 0.0411
Coeficiente de Variación 0.08213
Su histograma es el siguiente:
0.640.600.560.520.480.440.40
40
30
20
10
0
Media 0.5005Desv.Est. 0.04115N 200
E
Frec
uenc
ia
Histograma de ENormal
~ 16 ~
Figura 5.1 Histograma de matriz E
VI
COMPARACIÓN DE RESULTADOS
Figura 6.1 Histograma de las matrices A, B, C, D y E
10
2
4
6
8
01
81.0- 00.0 81.0 63.0 45.0 27.0 09.0 80.
0.5005 0.2895 100000.5005 0.1303 20000.5005 0.09083 10000.5005 0.06426 5000.5005 0.04115 200
Media Desv.Est. N
D
dadisneD
sota
AelbairaV
EDCB
H lamroN
E ,D ,C ,B ,A ed amargotsi
~ 17 ~
Figura 6.2 Histograma de las matrices A, B, C, D y E
El teorema de límite central lo observamos en la gráfica 6.2 donde se tiene en el eje
Y a la frecuencia, nos damos cuenta que a más números de muestra su línea de
ajuste toma la forma de la distribución normal.
10
05
001
051
002
052
003
81.0- 00.0 81.0 63.0 45.0 27.0 09.0 80.
0.5005 0.2895 100000.5005 0.1303 20000.5005 0.09083 10000.5005 0.06426 5000.5005 0.04115 200
Media Desv.Est. N
D
aicneucerF
sota
AelbairaV
EDCB
H lamroN
E ,D ,C ,B ,A ed amargotsi
~ 18 ~
CONCLUSIONES
A mayor cantidad de números aleatorios es más cerca el valor de las medidas
estadísticas de dispersión (media, varianza, desviación estándar) con las
fórmulas teóricas.
La media de los números aleatorios coincide con la media de todos los grupos
formados.
El coeficiente de variación disminuye a medida de que la cantidad de grupos
disminuye.
Mientras se tomen más grupos como muestra, la línea de ajuste tiende a la
forma de la distribución normal.
La varianza disminuye cuando se disminuye el número de grupos.