ESTADISTICA BASICAESTADISTICA BASICAExp. Renán Quispe LLanosExp. Renán Quispe LLanos
UNIVERSIDAD NACIONAL FEDERICO VILLARREALESCUELA UNIVERSITARIA DE POST-GRADO
MARCO MARCO CONCEPTUALCONCEPTUAL
Mg. Renán Quispe LLanos
MARCO CONCEPTUAL
¿Qué entiende por estadísticas y Estadística?
A un dato numérico o valor aislado se le
denomina dato estadístico. A un conjunto de
datos numéricos se le denomina estadísticas.
El estudio general de las estadísticas se define
como la ciencia estadística o Estadística.
Mg. Renán Quispe LLanos
DIVISIONES DE LA ESTADISTICA
ESTADISTICA DESCRIPTIVA
PROBABILIDAD
INFERENCIA ESTADISTICA
MODELOS DE REGRESIONModelo Causal
Mg. Renán Quispe LLanos Mg. Renán Quispe LLanos
MÉTODO ESTADÍSTICOMÉTODO ESTADÍSTICO• Recopilación.• Clasificación• Procesamiento• Tablas de
frecuencia• Inferencia• Presentación• Interpretación
Mg. Renán Quispe LLanos
TABLAS DE FRECUENCIATABLAS DE FRECUENCIA• En función del
Objetivo.• Primera forma de
resumen .• Organización de datos• Clasificación• Facilita la lectura• Permite la graficación• Previo a la
presentación. 0
5
10
15
20
25
30
35
40
2000 2001Hospitalización. Consultas
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
DISTRIBUCION DE DISTRIBUCION DE FRECUENCIASFRECUENCIAS
PERU: POBLACION OCUPADA URBANA POR TAMAÑO DE EMPRESAS (%)
TOTAL
MENOS DE 5 PERSONAS
DE 5 A 10 PERSONAS
MAS DE 10 PERSONAS
TAMAÑO DE LA EMPRESA 1997 1999
FUENTE: Convenio INEI - MTPS - Encuesta Nacional de Hogares, 1997-99- III Trim.
100,0
61,1
10,4
28,5
100,0
66,7
5,9
27,5
Mg. Renán Quispe LLanos
Elaboración de una distribución de frecuencias
Es un método estadístico muy útil para organizar un conjunto de observaciones en forma significativa. Además indica el número de veces que ocurre cada valor o dato en cada clase.
Los pasos para elaborar una distribución de frecuencia son los siguientes:
.Determinación del rango.
.Selección de los intervalos de clase.
.Determinar los límites de las clases.
.Efectuar la tabulación.
DISTRIBUCION DE FRECUENCIAS
Mg. Renán Quispe LLanos
DISTRIBUCION DE FRECUENCIAS DE VARIABLES CONTINUAS - EJEMPLO
Mg. Renán Quispe LLanos
1.- Valor máximo: 1094Valor mínimo : 320
2.- Valor máximo - valor mínimo =1094 - 320 =774
3.- Determinar el número de intervalos de clase:
Elaboración de una Tabla de Frecuencias para Variables Continuas
Mg. Renán Quispe LLanos
4.- Obtención de la amplitud de cada intervalo
R A= __ donde: R = Rango o recorrido NI NI =Número de
intervalos
Ejemplo:
Del ejemplo aplicativo
774A = ___ = 96
8
En este caso, por comodidad de trabajo, se ha redondeado la amplitud a 100.
Mg. Renán Quispe LLanos
5. Nuevo rango o recorrido.
R1=NI x AR1=8 x 100 = 800
6. Obtención de la diferencia
d = R´- Rd = 800 - 774 = 26
7. Prorrateo gráfico de la diferencia se coloca
una 300 320 1024 1100 unidad en cada extremo
Generalmente se reparte equitativamente
en los extremos las unidades de diferencia.
Mg. Renán Quispe LLanos
Luego:
1. Establecer un conjunto de agrupaciones, llamado también clases. Ingresos
mensuales 300-400 400-500 500-600 600-700 700-800 800-900
900-1000 1000-1100
Mg. Renán Quispe LLanos
2. Llevar la cuenta de los valores en las clases. La práctica común es utilizar una marca de cuenta (/) para señalar un valor.
Ingreso Mensual Tarjas300 -400 ///400 -500 //// //500 -600 //// //// /600 -700 //// //// //// //// //700 -800 //// //// //// //// //// //// //// ////800 -900 //// //// //// //// ////900 -1000 //// ////1000-1100 ////
Mg. Renán Quispe LLanos
3. Contar el número de marcas en cada clase. Para el ejemplo de los ingresos mensuales:
IngresosMensuales
Frecuencia
300-400 3400-500 7500-600 11600-700 21700-800 41800-900 24
900-1000 91000-1100 4
Total 120
Mg. Renán Quispe LLanos
El histograma describe una distribución de frecuencias utilizando una gráfica de barras en la que la altura de cada barra es proporcional a la frecuencia de la clase que representa.
Histograma sobre los ingresos mensuales
0
10
20
30
40
50
300 400 500 600 700 800 900 1000 1100
HISTOGRAMA
Mg. Renán Quispe LLanos
El polígono de frecuencia consiste en una línea poligonal que unen los puntos determinados por la intersección de del punto medio de clase.Ingresos
mensualesMarca de
ClaseFrecuencias
300-400 350 3400-500 450 7500-600 550 11600-700 650 21700-800 750 41800-900 850 24
900-1000 950 91000-1100 1050 4
POLIGONO DE FRECUENCIAS
Mg. Renán Quispe LLanos
Poligono de frecuencia (ingresos mensuales)
0
5
10
15
20
25
30
35
40
45
250 350 450 550 650 750 850 950 1050 1150
Polígono de Frecuencia (Ingresos Mensuales)
Polígono de frecuencias
Mg. Renán Quispe LLanos
Se utiliza cuando se desea determinar cuántas observaciones se encuentran por encima o por de abajo de ciertos valores.
POLIGONO DE FRECUENCIAS ACUMULADAS
Ingresosmensuales
Marca deClase
Frecuencias
300-400 350 3400-500 450 10500-600 550 21600-700 650 42700-800 750 83800-900 850 107
900-1000 950 1161000-1100 1050 120
Mg. Renán Quispe LLanos
POLIGONO DE FRECUENCIAS ACUMULADAS “menos de”
0
20
40
60
80
100
120
140
300 400 500 600 700 800 900 1000 1100
Mg. Renán Quispe LLanos
REPRESENTACIONES DE TALLOS Y HOJAS
El diagrama de hojas y tallos de TUKEY es un procedimiento semi – gráfico (tabular y gráfico)Objetivo:
El objetivo de una representación tallo y hoja es organizar datos no agrupados en forma significativa.
Mg. Renán Quispe LLanos
EJEMPLO
Los siguientes datos representan la longitud en mm. de 16 camarones de un criadero:
114; 125; 114; 124;143; 152; 133; 113; 178; 127; 135; 161;126; 134; 147; 132.
Mg. Renán Quispe LLanos
EJEMPLO
Los datos se adecuan al caso b, por lo tanto el diagrama será el siguiente:
Tallos Hojas Frecuencia11121314151617
443 5476 3542
37218
3442111
Mg. Renán Quispe LLanos
MEDIDAS DEMEDIDAS DE
TENDENCIATENDENCIA
CENTRAL CENTRAL
¿QUE ES UN PROMEDIO? ¿QUE ES UN PROMEDIO?
Es el valor que representa
a un conjunto de datos y
señala un centro de sus
valores.
Mg. Renán Quispe LLanos
MEDIA DE UNA POBLACION MEDIA DE UNA POBLACION
La media de una población se calcula con la siguiente fórmula:
Donde:
: indica la media poblacional.
N : número total de observaciones en la población.
: suma de los elementos de la población.
N
XN
1ii
N
1iiX
Mg. Renán Quispe LLanos
MEDIANAMEDIANA
Es el valor de la posición central de los valores después de ordenarlos de menor a mayor o de mayor a menor.
Ejemplo: Sean los valores siguientes, los precios de venta de departamentos:
S/. 60 000 65 000 70 000 80 000 275 000
Mg. Renán Quispe LLanos
MEDIANAMEDIANA
Realizando la ordenación de los valores, obtenemos:
Precios ordenados demenor a mayor
Precios ordenados demayor a menor
S/. 60 000 S/. 270 000 65 000 80 000
70 000 Mediana 70 000 80 000 65 000 270 000 60 000
Mg. Renán Quispe LLanos
MODAMODA
La moda es el valor de la observación que aparece con más frecuencia.
Ejemplo:De los datos presentados a continuación, encontrar la moda:
2, 3, 4, 5, 2, 4, 4, 6, 7.
La moda es el número 4, ya que es el valor que aparece con mayor frecuencia.
Mg. Renán Quispe LLanos
MEDIDAS DEMEDIDAS DE
DISPERSIONDISPERSION
ASIMETRIA YASIMETRIA Y
CURTOSISCURTOSIS
MEDIDAS DE DISPERSIONMEDIDAS DE DISPERSION
Para caracterizar completamente una distribución, es necesario conocer cómo están distribuidos los valores de la variable alrededor de un promedio.
Mg. Renán Quispe LLanos
¿Por qué estudiar la dispersión?
•Permite apreciar cuán dispersas están dos o más distribuciones.
Ejemplo: Observemos los siguientes tres conjuntos de datos:
1 2 3 4 5, 5 10 15 20 25, 10 20 30 40 50
Mg. Renán Quispe LLanos
LA VARIANZALA VARIANZA
Indica la variación de
las observaciones en
torno a su media.
Mg. Renán Quispe LLanos
LA VARIANZALA VARIANZA
1n
if2xix2S
Cálculo para datos agrupados:
Para una muestra:
xi : marca de clase del intervalo i,
donde i varía de 1 a m.
: media muestral.
fi : frecuencia intervalo i.
n : tamaño muestra.
X
Mg. Renán Quispe LLanos
LA DESVIACION ESTANDARLA DESVIACION ESTANDAR
La Desviación Estándar es la raíz
cuadrada positiva de la varianza.
Mg. Renán Quispe LLanos
MEDIDAS RELATIVAS DE DISPERSIONMEDIDAS RELATIVAS DE DISPERSION
““COEFICIENTE DE VARIACION”COEFICIENTE DE VARIACION”
Es un número abstracto que, denotado
por CV, se obtiene como cociente entre la
desviación estándar y su media
aritmética.Características:El coeficiente de variación es muy útil
especialmente cuando se aplica a
muestras homogéneas. Mg. Renán Quispe LLanos
Cálculo para Datos no agrupados y agrupados
población una para 100CV
muestra una para 100x
SCV
donde: : desviación estándar poblacional. S : desviación estándar muestral. 1. : media aritmética poblacional. x : media aritmética muestral.
COEFICIENTE DE VARIACIONCOEFICIENTE DE VARIACION
σ
μ S : desviación estándar muestral
: media aritmética muestralX
Mg. Renán Quispe LLanos