cuadro 1

7
Medidas de tendencia central Al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas de posición. En este caso se incluyen también los cuantiles entre estas medidas. Media aritmética La media aritmética es el valor obtenido por la suma de todos sus valores dividida entre el número de sumadores. La media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos. Se le llama también promedio o, simplemente, media . Dado un conjunto numérico de datos, x 1 , x 2 ,... x n , se define su media aritmética como Esta definición varía, aunque no sustancialmente, cuando se trata de variables continuas, esto es, también puede calcularse para variables agrupadas en intervalos. Propiedades: Las principales propiedades de la media aritmética son: Su cálculo es muy sencillo y en él intervienen todos los datos. Su valor es único para una serie de datos dada. Se usa con frecuencia para comparar poblaciones, aunque es más apropiado acompañarla de una medida de dispersión. Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor:

Upload: luis-alcocer

Post on 11-Jul-2016

219 views

Category:

Documents


1 download

DESCRIPTION

:3

TRANSCRIPT

Page 1: cuadro 1

Medidas de tendencia central

Al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas de posición. En este caso se incluyen también los cuantiles entre estas medidas.

Media aritméticaLa media aritmética es el valor obtenido por la suma de todos sus valores dividida entre el número de sumadores. La media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos. Se le llama también promedio o, simplemente, media.

Dado un conjunto numérico de datos, x1, x2,... xn, se define su media aritmética como

Esta definición varía, aunque no sustancialmente, cuando se trata de variables continuas, esto es, también puede calcularse para variables agrupadas en intervalos.

Propiedades:

Las principales propiedades de la media aritmética son:

Su cálculo es muy sencillo y en él intervienen todos los datos. Su valor es único para una serie de datos dada. Se usa con frecuencia para comparar poblaciones, aunque es más apropiado

acompañarla de una medida de dispersión. Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos,

ya que tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor:

Minimiza las desviaciones cuadráticas de los datos respecto de cualquier valor

prefijado, esto es, el valor de   es mínimo cuando   . Este resultado se conoce como Teorema de König. Esta propiedad permite interpretar uno de los parámetros de dispersión más importantes: la varianza.

Page 2: cuadro 1

Se ve afectada por transformaciones afines (cambios de origen y escala), esto es, si

 Entonces   , donde   es la media aritmética de los  , para i = 1, ..., n y a y b números reales.

Es poco sensible a fluctuaciones muéstrales, por lo que es un parámetro muy útil en inferencia estadística.

Media geométrica.

En matemáticas y estadística, la media geométrica de una cantidad arbitraria de números (por decir n números) es la raíz n-ésima del producto de todos los números, es recomendada para datos de progresión geométrica, para promediar razones, interés compuesto y números índices.

Por ejemplo, la media geométrica de 2 y 18 es

Otro ejemplo, la media de 1, 3 y 9 sería

Propiedades:

El logaritmo de la media geométrica es igual a la media aritmética de los logaritmos de los valores de la variable.

La media geométrica de un conjunto de números positivos es siempre menor o igual que la media aritmética:

La igualdad sólo se alcanza sí  .

Page 3: cuadro 1

Media armónica

La media armónica (designada usualmente mediante H) de una cantidad finita de números es igual al recíproco, o inverso, de la media aritmética de los recíprocos de dichos valores y es recomendada para promediar velocidades.

Así, dados n números x1, x2,..., xn la media armónica será igual a:

La media armónica resulta poco influida por la existencia de determinados valores mucho más grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho más pequeños que el conjunto.

La media armónica no está definida en el caso de que exista algún valor nulo.

Propiedades:

1. La inversa de la media armónica es la media aritmética de los inversos de los valores de la variable.

2. Siempre se puede pasar de una media armónica a una media aritmética transformando adecuadamente los datos.

3. La media armónica siempre es menor o igual que la media aritmética, ya que para cualquier número real positivo  :

Page 4: cuadro 1

MedianaEn el ámbito de la estadística, la mediana (del latín mediānus 'del medio'1 ) representa el valor de la variable de posición central en un conjunto de datos ordenados.

Existen dos métodos para el cálculo de la mediana:

1. Considerando los datos en forma individual, sin agruparlos.

2. Utilizando los datos agrupados en intervalos de clase.

A continuación veamos cada una de ellas:

Datos sin agrupar:

Sean   los datos de una muestra ordenada en orden creciente y designando la mediana como  , distinguimos dos casos:

a) Si n es impar, la mediana es el valor que ocupa la posición   una vez que los datos han sido ordenados (en orden creciente o decreciente), porque éste es el valor central. Es decir:  .

Por ejemplo, si tenemos 5 datos, que ordenados son:  ,  ,  , ,   => El valor central es el tercero:  . Este valor, que es la mediana de ese conjunto de datos, deja dos datos por debajo ( ,  ) y otros dos por encima de él ( ,  ).

b) Si n es par, la mediana es la media aritmética de los dos valores centrales. Cuando   es

par, los dos datos que están en el centro de la muestra ocupan las posiciones   y

. Es decir:  .

Por ejemplo, si tenemos 6 datos, que ordenados son:  ,  ,  , 

,  ,  . Aquí dos valores que están por debajo del   y otros dos

que quedan por encima del siguiente dato  . Por tanto, la mediana de este grupo de datos es la media aritmética de estos dos

datos:  .

Page 5: cuadro 1

Datos agrupados:

Al tratar con datos agrupados, si   coincide con el valor de una frecuencia acumulada, el valor de la mediana coincidirá con la abscisa correspondiente. Si no coincide con el valor de ninguna abcisa, se calcula a través de semejanza de triángulos en el histograma o polígono de frecuencias acumuladas, utilizando la siguiente equivalencia:

Donde   y   son las frecuencias absolutas acumuladas tales que,   y   son los extremos, interior y exterior, del intervalo donde se alcanza la mediana y   es la abscisa a calcular, la mediana. Se observa que   es la amplitud de los intervalos seleccionados para el diagrama

Moda

En estadística, la moda es el valor con una mayor frecuencia en una distribución de datos.

Se hablará de una distribución bimodal de los datos adquiridos en una columna cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda.

El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal.

La moda, cuando los datos están agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al intervalo modal.

Page 6: cuadro 1

Cuantiles

Los cuantiles son puntos tomados a intervalos regulares de la función de distribución de una variable aleatoria.

El término cuantil fue usado por primera vez por Kendall en 1940. El cuantil de orden p de una distribución (con 0 < p < 1) es el valor de la variable   que marca un corte de modo que una proporción p de valores de la población es menor o igual que  . Por ejemplo, el cuantil de orden 0,36 dejaría un 36% de valores por debajo y el cuantil de orden 0,50 se corresponde con la mediana de la distribución.

Los cuantiles suelen usarse por grupos que dividen la distribución en partes iguales; entendidas estas como intervalos que comprenden la misma proporción de valores. Los más usados son:

Los cuartiles, que dividen a la distribución en cuatro partes (corresponden a los cuantiles 0,25; 0,50 y 0,75);

Los quintiles, que dividen a la distribución en cinco partes (corresponden a los cuantiles 0,20; 0,40; 0,60 y 0,80);

Los deciles, que dividen a la distribución en diez partes;

Los percentiles, que dividen a la distribución en cien partes.

En el cálculo de cuantiles con distribuciones de variable continua (por ejemplo, con datos agrupados) puede conseguirse fácilmente que las partes en que se divide la distribución sean exactamente iguales. Sin embargo, en las distribuciones de variable discreta (como el caso de datos aislados) debemos conformarnos con que estas partes sean aproximadamente iguales. Por desgracia, no hay consenso sobre cómo realizar esta aproximación, existiendo en la literatura científica nueve métodos diferentes, que conducen a resultados diferentes. Por ello, al calcular cualquier cuantil de datos no agrupados por medio de calculadora, software o manualmente, es básico el saber e indicar el método utilizado.

La función que a cada p le asigna el punto de corte  , es decir, el valor del cuantil de orden p, se denomina función cuantil.