tercer resumen de estadistica

19
1.3 Representación de Graficas La representación grafica es una ayuda para el estudio de una función. Una función con una variable dependiente y otra independiente se puede representar gráficamente en un eje de ordenadas y abscisas correspondiendo el valor de cada variable a la posición en los ejes. Las graficas tienen por objeto representar las características esenciales de los resultados obtenidos en la tabulación y dentro de ellos tenemos: grafica de barras, histogramas, polígonos de frecuencia, ojiva o circulo grama o grafica de pastel. Las gráficas describen relaciones entre dos variables. La variable que se representa en el eje horizontal se llama variable independiente o variable x. La que se representa en el eje vertical se llama variable dependiente o variable y. La variable y está en función de la variable x. Grafica de barras: Se emplea para representar las frecuencias relativas y absolutas de acontecimientos. Ejemplo: En un salón de belleza que está en acuco asisten a la semana personas de diferentes edades como se presenta en el

Upload: carlo-herrera

Post on 03-Aug-2015

83 views

Category:

Documents


1 download

TRANSCRIPT

1.3 Representación de Graficas

La representación grafica es una ayuda para el estudio de una función. Una

función con una variable dependiente y otra independiente se puede representar

gráficamente en un eje de ordenadas y abscisas correspondiendo el valor de cada

variable a la posición en los ejes.

Las graficas tienen por objeto representar las características esenciales de los

resultados obtenidos en la tabulación y dentro de ellos tenemos: grafica de barras,

histogramas, polígonos de frecuencia, ojiva o circulo grama o grafica de pastel.

Las gráficas describen relaciones entre dos variables.

La variable que se representa en el eje horizontal se llama variable

independiente o variable x.

La que se representa en el eje vertical se llama variable dependiente o

variable y.

La variable y está en función de la variable x.

Grafica de barras: Se emplea para representar las frecuencias relativas y

absolutas de acontecimientos.

Ejemplo:

En un salón de belleza que está en acuco asisten a la semana personas de

diferentes edades como se presenta en el siguiente cuadro:

Histogramas: Es una representación grafica de una variable en forma de barras,

donde la superficie de cada barra es proporcional a la frecuencia de los valores

representados.

Circulo grama: Las graficas circulares denominadas también graficas de pastel o

graficas del 100%, se utilizan para mostrar porcentajes y proporciones.

Ejemplo:

Al realizar un estudio sobre el color de la gelatina que vende Don Chuy se

obtuvieron los siguientes datos:

Al graficar estos datos obtenemos la siguiente grafica

1.3.1 Diagrama de Dispersión

Los diagramas de dispersión o grafica de correlación permiten estudiar la “relación

entre 2 variables: “X” e “Y”.

El diagrama de dispersión es de gran utilidad para la solución de problemas de la

calidad de un proceso y producto, ya que nos sirve para comprobar que causas

(factores) están influyendo o perturbando la dispersión de una característica de

calidad o variable del proceso a controlar.

Existen una correlación entre ambas si cada vez que aumenta el valor de “X”

aumenta proporcionalmente el valor de “Y” (correlación positiva), o si cada vez que

aumenta el valor “X” disminuye en igual proporción el valor de “Y” (correlación

negativa).

Correlación Fuerte: Los puntos se agrupan claramente alrededor de una línea

imaginaria que pasa por el centro de la masa de los mismos. Estos casos sugieren

que el control de una de las variables lleva al control de la otra. Los datos parecen

confirmar la teoría estudiada, pero hay que analizar la existencia de otras posibles

explicaciones admisibles y relevantes para dicha relación.

Correlación Fuerte, Positiva:

El valor de la variable “Y” (eje vertical) aumenta claramente con el valor de la

variable “X” (eje horizontal).

Correlación Fuerte, Negativa:

El valor de “Y” disminuye claramente cuando “X” aumenta.

Correlación Débil: Los puntos no están suficientemente agrupados, como para

asegurar que existe la relación. El control de una de las variables no

necesariamente nos llevará al control de la otra.

Si lo que se busca es determinar las causas de un problema, se deben buscar

otras variables con una relación mayor o más relevante sobre el efecto.

Correlación Débil, Positiva:

El valor de la variable “Y” (eje vertical) tiende a aumentar cuando aumenta el valor

de la variable “X” (eje horizontal)

Correlación Débil, Negativa:

El valor de “Y” tiende a disminuir cuando aumenta el valor de “X”.

Correlación compleja:

El valor de la variable “Y” parece estar relacionado con el de la variable “X”, pero

esta relación no es simple o lineal. En este caso se estudia la relación más

profundamente.

Sin correlación:

Para cualquier valor de la variable “X” , “Y” puede tener cualquier valor. No

aparece ninguna relación especial entre ambas variables. En este caso, nuestra

teoría no es correcta y se deben buscar otros tipos de relaciones.

1.3.2 Diagrama de tallo y hojas

El diagrama "tallo y hojas" permite obtener simultáneamente una distribución de

frecuencias de la variable y su representación gráfica. Para construirlo basta

separar en cada dato el último dígito de la derecha (que constituye la hoja) del

bloque de cifras restantes (que formará el tallo).

Esta representación de los datos es semejante a la de un histograma pero además

de ser fáciles de elaborar, presentan más información que estos.

Los valores del "tallo" se escriben hacia abajo y los valores "hoja" van a la derecha

(o izquierda) del los valores tallo.

El "tallo" es usado para agrupar los puntajes y cada "hoja" indica los puntajes

individuales dentro de cada grupo.

Ejemplo:

Edad de 20 personas

Supongamos la siguiente distribución de frecuencias

36 25 37 24 39 20 36 45 31 31

39 24 29 23 41 40 33 24 34 40

que representan la edad de un colectivo de N = 20 personas y que vamos a

representar mediante un diagrama de Tallos y Hojas. 

Comenzamos seleccionando los tallos que en nuestro caso son las cifras de

decenas, es decir 3, 2, 4, que reordenadas son 2, 3 y 4. 

A continuación efectuamos un recuento y vamos «añadiendo» cada hoja a su tallo

Por último reordenamos las hojas y hemos terminado el diagrama

1.3.3 Histogramas

Un histograma es una representación gráfica de una variable en forma de barras,

donde la superficie de cada barra es proporcional a la frecuencia de los valores

representados. En el eje vertical se representan las frecuencias, y en el eje

horizontal los valores de las variables, normalmente señalando las marcas de

clase, es decir, la mitad del intervalo en el que están agrupados los datos.

Se utilizan para variables continuas o para variables discretas, con un gran

número de datos, y que se han agrupado en clases.

Se utiliza cuando se estudia una variable continua, como franjas de edades o

altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir,

valores continuos.

Ejemplo:

 

La figura anterior, muestra el histograma correspondiente a la siguiente tabla: 

Intervalo Frecuencia 

  [1,2[       6

  [2,3[      10 

  [3,4[       4 

  [4,5[       2 

  [5,6[       1

1.3.4 Ojivas

La ojiva es el polígono de frecuencias acumuladas, es decir, que en ella se

permite ver cuántas observaciones se encuentran por encima o debajo de ciertos

valores, en lugar de solo exhibir los números asignados a cada intervalo.

La ojiva apropiada para información que presente frecuencias mayores que el dato

que se está comparando tendrá una pendiente negativa (hacia abajo y a la

derecha) y en cambio la que se asigna a valores menores, tendrá una pendiente

positiva. Una gráfica similar al polígono de frecuencias es la ojiva, pero ésta se

obtiene de aplicar parcialmente la misma técnica a una distribución acumulativa y

de igual manera que éstas, existen las ojivas mayor que y las ojivas menor que.

Existen dos diferencias fundamentales entre las ojivas y los polígonos de

frecuencias (y por esto la aplicación de la técnica es parcial):

Un extremo de la ojiva no se toca al eje horizontal, para la ojiva "mayor que"

sucede con el extremo izquierdo; para la ojiva "menor que", con el derecho.

En el eje horizontal en lugar de colocar las marcas de clase se colocan las

fronteras de clase. Para el caso de la ojiva mayor que es la frontera menor; para la

ojiva menor que, la mayor.

1.3.5 Polígonos de frecuencia

Un polígono de frecuencias se forma uniendo los extremos de

las barras de un diagrama de barras mediante segmentos. También

se puede realizar trazando los puntos que representan

las frecuencias y uniéndolos mediante segmentos.

Ejemplo: Las temperaturas en un día de otoño de una ciudad han

sufrido las siguientes variaciones.

Polígonos de frecuencia para datos agrupados:

Para construir el  polígono de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectángulo de un histograma.

Ejemplo: El peso de 65 personas adultas viene dado por la siguiente tabla:

  c i f i F i

[50, 60) 55 8 8

[60, 70) 65 10 18

[70, 80) 75 16 34

[80, 90) 85 14 48

[90, 100) 95 10 58

[100, 110) 110 5 63

Hora Temperatura

6 7º

9 12°

12 14°

15 11°

18 12°

21 10°

24 8°

[110, 120) 115 2 65

    65  

 

Polígono de frecuencias acumuladas:

Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el histograma de frecuencias acumuladas o su correspondiente polígono.

1.3.6 Diagrama de caja y ejes

Los diagramas de Caja-Bigotes son una presentación visual que describe varias

características importantes, al mismo tiempo, tales como la dispersión y simetría.

Para su realización se representan los tres cuartiles y los

valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o

verticalmente.

Construcción:

Una gráfica de este tipo consiste en una caja rectangular, donde los lados más

largos muestran el recorrido intercuartílico. Este rectángulo está dividido por un

segmento vertical que indica donde se posiciona la mediana y por lo tanto su

relación con los cuartiles primero y tercero (recordemos que el segundo cuartil

coincide con la mediana). Esta caja se ubica a escala sobre un segmento que

tiene como extremos los valores mínimo y máximo de la variable. Las líneas que

sobresalen de la caja se llaman bigotes. Estos bigotes tienen un límite de

prolongación, de modo que cualquier dato o caso que no se encuentre dentro de

este rango es marcado e identificado individualmente.

EJEMPLO DISTRIBUCIÓN DE EDADES

Utilizamos la ya usada distribución de frecuencias (en tallos y hojas), que

representan la edad de un colectivo de 20 personas.

36 25 37 24 39 20 36 45 31 31

39 24 29 23 41 40 33 24 34 40

ORDENAR LOS DATOS

Para calcular los parámetros estadístico, lo primero es ordenar la distribución

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

CALCULO DE CUARTILES

Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la

distribución. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media

aritmética de dicho valor y el siguiente:

Q1=(24 + 25) / 2 = 24,5

Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor

de la variable que ocupa el lugar central en un conjunto de datos ordenados.

Como N/2 =10 ; la mediana es la media aritmética de dicho valor y el siguiente:

me= Q2 = (33 + 34)/ 2 =33,5

Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la

distribución. En nuestro caso, como 3N / 4 = 15, resulta

Q2=(39 + 39) / 2 = 39

DIBUJAR LA CAJA Y LOS BIGOTES

El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)

La primera parte de la caja a (Q1, Q2),

La segunda parte de la caja a (Q2, Q3) 

El bigote de la derecha viene dado por (Q3, Xmáx)

INFORMACIÓN DEL DIAGRAMA

Podemos obtener abundante información de una distribución a partir de estas

representaciones. Veamos alguna: 

La parte izquierda de la caja es mayor que la de la derecha; ello quiere

decir que las edades comprendidas entre el 25% y el 50% de la población

está más dispersa que entre el 50% y el 75%.

El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por

ello el 25% de los más jóvenes están más concentrados que el 25% de los

mayores.

El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población

está comprendido en 14,5 años.

1.3.7 Diagrama de sectores

Un diagrama de sectores  se puede utilizar para todo tipo

de variables, pero se usa frecuentemente para las  variables

cualitativas.

Los datos se representan en un  círculo, de modo que el  ángulo de

cada sector esproporcional a la frecuencia absoluta  correspondiente.

El diagrama circular se construye con la ayuda de un transportador

de ángulos.

Ejemplo:

En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la

natación, 9 juegan al fútbol y el resto no practica ningún deporte.

  AlumnosÁngul

o

Baloncesto

12 144°

Natación

3 36°

Fútbol 9 108°

Sin deporte

6 72°

Total 30 360°