Estadística…
Melo- Fernández
Definición de Estadística
"Ciencia que se ocupa del estudio de fenómenos de tipo genérico,
normalmente complejos y enmarcados en un universo variable, mediante el
empleo de modelos de reducción de la información y de análisis de validación
de los resultados en términos de representatividad".
EXISTEN DOS TIPOS DE ESTADÍSTICAEstadística Descriptiva: procedimientos empleados para organizar y resumir conjuntos de observaciones en forma cuantitativa. Los conjuntos de datos que contienen observaciones de más de una variable permiten estudiar la relación o asociación que existe entre ellas.
ESTADISTICA INFERENCIAL
Métodos empleados para inferir algo acerca de una población basándose en los datos obtenidos a partir de
una muestra. Los datos estadísticos son cálculos aritméticos realizados sobre los valores obtenidos en una
porción de la población, seleccionada según criterios rigurosos.
FIABILIDAD
Por fiabilidad se entiende obtener una información válida, sin errores, y
representativa. Para esto se utiliza, el análisis de la validez de los resultados y también, establecer estos resultados en
términos de representatividad.
VALIDEZ Y REPRESENTATIVIDAD
El análisis de la validez es el estudio de todos los posibles errores que pueden
aparecer en las fases del proceso estadístico, desde la recogida de datos
hasta la interpretación de los resultados, pasando por los supuestos en los que se basa el razonamiento. Unir el análisis de validez con su interpretación en términos
de representatividad, es lo que va a configurar la fiabilidad final de los
resultados de una investigación estadística.
POBLACIÓN
"Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones".
Levin & Rubin (1996).
"Una población es un conjunto de elementos que presentan una
característica común". Cadenas (1974).
Ejemplo:
“Los miembros del Colegio de Ingenieros de
Latinoamérica”
•El tamaño que tiene una población es un factor de suma importancia en el
proceso de investigación estadística, y este tamaño viene dado por el número de elementos que constituyen la población,
según el número de elementos la población puede ser finita o infinita *
MUESTRA
"Se llama muestra a una parte de la población a estudiar que sirve para representarla". Murria R. Spiegel
(1991).
"Una muestra es una colección de algunos elementos de la población, pero no de todos". Levin & Rubin
(1996).
Ejemplo;
El estudio realizado a 50 miembros del Colegio de Ingenieros de Latinoamérica
El estudio de muestras es más sencillo que el estudio de la población completa; cuesta menos y lleva menos tiempo. Por último se ha probado que el examen de una población entera todavía permite la aceptación de elementos defectuosos, por tanto, en algunos casos, el muestreo puede
elevar el nivel de calidad.
MUESTREOProcedimiento empleado para obtener una o más
muestras de una población; el muestreo es una técnica que sirve para obtener una o más muestras de
población.
TIPOS DE MUESTREO
Existen dos métodos para seleccionar muestras de poblaciones:
MUESTREO NO ALEATORIO O DE JUICIO: Se basa en la experiencia de alguien con la población.
MUESTREO ALEATORIO O DE PROBABILIDAD:
Todos los elementos de la población tienen la oportunidad de ser escogidos en la muestra.
VARIABLES
“Una variable es un símbolo, tal como X, Y, Hx, que puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio de la variable. Si la variable puede tomar solamente un valor, se llama constante."Según, Murray R. Spiegel, (1992)
TIPOS DE VARIABLES
Variables cualitativas (o categóricas): aquellas que no aparecen en forma numérica, sino como categorías o atributos (sexo, profesión, color de ojos)
Variables cuantitativas: las que pueden expresarse numéricamente (temperatura, salario, número de goles en un partido). Se pueden cuantificar los resultados experimentales por medio de instrumentos adoptando unidades de medida para valorar los diferentes resultados.
Variables discretas: son el resultado de contar y sólo toman valores enteros (número de hijos)
Variables continuas: son el resultado de medir, y pueden contener decimales (temperatura, peso, altura). Pueden tomar, entonces, cualquier valor de un determinado intervalo.
LAS VARIABLES PUEDEN CORRESPONDER
A CUATRO NIVELES DE MEDICIÓN:
1) Nominal: datos que sólo pueden clasificarse en categorías; existen sólo conteos; no existe orden particular para los grupos. Ejemplo: color de ojos.
2) Ordinal: corresponde a aquellos datos que se pueden agrupar en categorías y “ordenarlas” según algún tipo de gradación. Ejemplo; nivel de dolor
3) de Intervalo: incluye todas las características de la escala ordinal, pero la distancia entre valores es constante pues los valores que toma, corresponden al orden de los números naturales. Ejemplo: nº de hijos
4) de Razón: tiene características de la escala de intervalo, pero se agrega un punto cero absoluto que significa ausencia del atributo y la razón de dos números es significativo pudiéndose aplicarles todo tipo de instrumental matemático. Ejemplo: ingreso familiar.
MEDIDAS DE CENTRALIZACIÓ
N
LA MODA
LA MEDIANA
LA MEDIA
MEDIA ARITMÉTICALa media aritmética de una variable se define como la suma ponderada de los valores de la variable por sus
frecuencias relativas y se calcula mediante la expresión:
Lo denotaremos
por:
* Xi representa el valor de la variable o en su caso la marca de clase *
PROPIEDADES:
* Si multiplicamos o dividimos todas las observaciones por un mismo número, la media queda multiplicada o dividida por dicho numero.
* Si le sumamos a todas las observaciones un mismo número, la media aumentará en dicha cantidad.
* Además de la media aritmética existen otros conceptos de media, como son la media geométrica y la media armónica.
MEDIA GEOMÉTRICA:La media geométrica de N observaciones es la raíz de índice N del producto de todas las observaciones. La representaremos por G
Solo se puede calcular si no hay observaciones negativas. Es una medida estadística poco o nada usual.
MEDIA ARMÓNICA
La media armónica de N observaciones es la inversa de la media de las inversas de las observaciones y la denotaremos por H
Al igual que en el caso de
la media geométrica su utilización es
bastante poco
frecuente
LA MEDIANA
Valor de la variable que deja el mismo número de datos antes y después que él. De acuerdo con esta definición el conjunto de datos menores o iguales
que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán
el otro 50% del total de datos de la muestra.
Si n es impar --> Me será la observación central de los valores, una vez que estos han sido ordenados en orden creciente o
decreciente.
Si n es par --> Me será el promedio aritmético de las dos observaciones centrales.
La moda-> Es el valor que cuenta con una mayor frecuencia
en una distribución de datos .
Distribución bimodal de los datos: cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima.
Distribución trimodal de los datos: es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda.
Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo
modal. El intervalo modal es el de mayor frecuencia absoluta.
MODA DE DATOS AGRUPADOS:L1 = Límite inferior de la
clase modal.D1 = Exceso de la
frecuencia modal sobre la clase contigua inferior.
D2 = Exceso de la frecuencia modal sobre la clase contigua superior.C = Tamaño del intervalo
de la clase modal.
TIPOS DE FRECUENCIAS
Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir,
recoger la información de la muestra resumida en una tabla en la que a cada valor de la variable se le asocian determinados
números que representan el número de veces que ha aparecido, su proporción con respecto a otros valores de la
variable, etc. Estos números se denominan frecuencias.
FRECUENCIA ABSOLUTA
La frecuencia absoluta de una variable estadística es el número de veces que aparece
en la muestra dicho valor de la variable, la representaremos por ni
FRECUENCIA RELATIVALa frecuencia absoluta, es una medida que está
influida por el tamaño de la muestra, al aumentar el tamaño de la muestra aumentará también el
tamaño de la frecuencia absoluta. Esto hace que no sea una medida útil para poder comparar. Para esto
es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia
absoluta y el tamaño de la muestra. La denotaremos por fi
Donde N = Tamaño de la
muestra
PORCENTAJE:La frecuencia relativa es un tanto por uno, sin
embargo, hoy día es bastante frecuente hablar siempre en términos de tantos por ciento o
porcentajes, por lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La
denotaremos por pi.
FRECUENCIA ABSOLUTA
ACUMULADALa frecuencia absoluta acumulada de un valor de la variable, es el número de
veces que ha aparecido en la muestra un valor menor o igual que el de la variable
y lo representaremos por Ni.
FRECUENCIA RELATIVA ACUMULADA
Al igual que en el caso anterior la frecuencia relativa acumulada es la
frecuencia absoluta acumulada dividido por el tamaño de la muestra, y
la denotaremos por Fi
PORCENTAJE ACUMULADO
Análogamente se define el Porcentaje Acumulado y lo vamos a denotar por Pi como la
frecuencia relativa acumulada por 100.