compendio de estadística bueno 2015

Upload: nacho

Post on 07-Jul-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/18/2019 Compendio de Estadística Bueno 2015

    1/66

    EJÉRCITO MEXICANO

    HEROICO COLEGIO MILITAR. SECCIÓN ACADÉMICA.

    COMPENDIO DE ESTADÍSTICA

    DESCRIPTIVA.

    SEGUNDO AÑO.

    (1/er. SEMESTRE).

  • 8/18/2019 Compendio de Estadística Bueno 2015

    2/66

    1

    MATERIA

    ESTADÍSTICA DESCRIPTIVA

    ÍNDICE.

    I. INTRODUCCIÓN A LA ESTADÍSTICA.PGS

    1.1. DEFINICIÓN DE ESTADÍSTICA…….…………………………………...  41.2 CONCEPTO DE ESTADÍSTICA DESCRIPTIVA….….………………..  41.3. CONCEPTO DE ESTADÍSTICA INFERENCIAL…………..…………... 51.4  APLICACIONES DE LA ESTADÍSTICA EN OTRAS ÁREAS………..  61.5 ELEMENTOS DE APLICACIÓN DE LA ESTADÍSTICA………….….. 6

    II. CONCEPTOS Y TÉRMINOS BÁSICOS.2.1. DEFINICIÓN DE POBLACIÓN Y MUESTRA……………………………  92.2 CONCEPTO GENERAL DE VARIABLE, VARIABLE CONTINUA

    DISCRETA……………………………………………….…………………. 10

    2.3 DEFINICIÓN DE EXPERIMENTO, EXPERIMENTO ALEATORIODETERMINÍSTICO.………………………………………….  

    11

    III. DISTRIBUCIÓN DE FRECUENCIAS.

    3.1 VALOR MÁXIMO Y VALOR MÍNIMO……………………………………..  133.2. FÓRMULA Y CÁLCULO DEL RANGO……………………………………  143.3 FÓRMULA Y VALOR DE LA AMPLITUD. ………………………………  153.4 LÍMITES DE UN INTERVALO……………………………………………… ... 153.5 CÁLCULO DE LOS LÍMITES……………………………………..………… .. 153.6 REGISTRO DE LOS INTERVALOS……………….………………………  163.7 FÓRMULA Y REGISTRO DE LAS MARCAS DE CLASE…….............  163.8. REGISTRO DE LAS FRECUENCIAS ABSOLUTAS……………………..  173.9. CÁLCULO Y REGISTRO DE LA FRECUENCIA ABSOLUT

     ACUMULADA…………….…………………………………….…………….  

    18

    3.10 FRECUENCIA RELATIVA……………….……….…………………………   183.11 FRECUENCIA RELATIVA ACUMULADA……………….………………..  19

  • 8/18/2019 Compendio de Estadística Bueno 2015

    3/66

    2

    IV. REPRESENTACIÓN GRÁFICA DE DATOS.

    4.1 ONCEPTO DE HISTOGRAMA. ……..……………………………………   204.2 EFINICIÓN DE POLÍGONO DE FRECUENCIAS. ………………………  214.3 EFINICIÓN DE OJIVA…………………………………………………………   214.4 RAZADO DEL HISTOGRAMA Y POLÍGONO DE FRECUENCIAS....... 22

    4.5 SCALAS DE LA OJIVA……………………………………………………..   234.6 RAZADO DE LA OJIVA ………………………………….………………….   23

    V. MEDIDAS DE POSICIÓN RELATIVA.

    5.1 DEFINICIÓN. ………………………………………………………………….  245.2 DEFINICIÓN DE PERCENTIL………………………………………………...  245.3 FÓRMULA DE LA POSICIÓN DEL PERCENTIL. ………………………..  245.4 CALCULO DE LA POSICIÓN DE UN PERCENTIL.………………………  255.5 FÓRMULA DEL VALOR DE UN PERCENTIL.……………………………  25

    5.6 CÁLCULO DEL VALOR DE UN PERCENTIL……………………………..  26

    VI. MEDIDAS DE TENDENCIA CENTRAL.

    6.1 DEFINICIÓN. …………………………………………………………………  276.2 CONCEPTO DE MEDIA ARITMÉTICA…………………….……………….  276.3 FÓRMULA DE LA MEDIA ARITMÉTICA…………………………………...  276.4 CÁLCULO DE LA MEDIA ARITMÉTICA…………………………………….  296.5 CONCEPTO DE MODA. ……………………………………..…………….   306.6 FÓRMULA Y CÁLCULO DE LA MODA…………………..……………….  306.7 CONCEPTO DE MEDIANA………………………………..……………….  346.8 FÓRMULA Y CÁLCULO DE LA MEDIANA……………………………….  34

    VII. MEDIDAS DE DISPERSIÓN.

    7.1 DEFINICIÓN. ……………….……………………………………………….   377.2 CONCEPTO Y FÓRMULA DEL DESVÍO……………….……………...  387.3 REGISTRO DEL DESVÍO……………….………………………………....   387.4 DESVIACIÓN MEDIA……………….……………………………………...   39

    7.5 ECUACIÓN Y CÁLCULO DE LA DESVIACIÓN MEDIA………………..  397.6 VARIANZA……………….…………………………………………………   417.7 CÁLCULO DE REGISTRO DEL DESVÍO AL CUADRADO……………….  417.8 FÓRMULA Y CÁLCULO DE LA VARIANZA. ………………..…………….  427.9 CONCEPTO Y FÓRMULA DE LA DESVIACIÓN ESTÁNDAR.

    ……………….………………………………………………………….  43

    7.10 CÁLCULO DE LA DESVIACIÓN ESTÁNDAR…………………..…………  44

  • 8/18/2019 Compendio de Estadística Bueno 2015

    4/66

    3

    VIII. MEDIDAS DE CORRELACIÓN.

    8.1 DEFINICIÓN. ……………….……………………………………………   458.2 FÓRMULA DE LA MEDIA……………….……………………………..   478.3 CÁLCULO DE LA MEDIA DE LA VARIABLE “X”…… ………………  488.4 CÁLCULO DE LA MEDIA DE LA VARIABLE “Y”. ………………... 49

    8.5 FÓRMULA DEL DESVÍO. ……………….…………………………...   508.6 CÁLCULO DEL DESVÍO DE LA VARIABLE “X”. ……………….... 508.7 CÁLCULO DEL DESVÍO DE LA VARIABLE “Y”. ……………….... 518.8 FÓRMULA DE LA DESVIACIÓN ESTÁNDAR DE LA VARIABLE “X”.  528.9 CÁLCULO DE LA DESVIACIÓN ESTÁNDAR DE LA VARIABLE “X”..  52

    8.10 FÓRMULA DE LA DESVIACIÓN ESTÁNDAR DE LA VARI ABLE “Y”.. 538.11 CÁLCULO DE L A DESVIACIÓN ESTÁNDAR DE LA VARIABLE “Y”…  538.12 FÓRMULA DE LA COVARIANZA. ……………….………………….  548.13 CÁLCULO DE LA COVARIANZA. ……………….…………………………..   548.14 FÓRMULA DEL COEFICIENTE DE PEARSON O DE

    CORRELACIÓN……………….……………………………………………  55

    8.15 CÁLCULO DEL COEFICIENTE DE PEARSON……………….………  578.16 DEFINICIÓN DE LA RECTA DE REGRESIÓN……………….………..  588.17 ECUACIÓN DE LA RECTA DE REGRESIÓN……………….…………  588.18 FÓRMULA DE LA ORDENADA……………….………………………….   588.19 CÁLCULO DE LA ORDENADA AL ORIGEN (b). ……………….……..  598.20 FÓRMULA DE LA PENDIENTE. ……………….……………….……  608.21 CÁLCULO DE LA PENDIENTE……………….……………….…………   608.22 DEFINICIÓN DE ERROR ESTÁNDAR DE ESTIMACIÓN (E.E.E.). 618.23 FÓRMULA DEL ERROR ESTÁNDAR DE ESTIMACIÓN……………..  628.24 CÁLCULO DEL ERROR ESTÁNDAR DE ESTIMACIÓN………………..  638.25 REPRESENTACIÓN GRÁFICA DEL ERROR ESTÁNDAR DE

    ESTIMACIÓN……………….……………………………………………….  

    64

  • 8/18/2019 Compendio de Estadística Bueno 2015

    5/66

  • 8/18/2019 Compendio de Estadística Bueno 2015

    6/66

    5

    •  Selección de caracteres dignos de ser estudiados.•  Recopila los datos que necesita; esto lo puede hacer por encuestas

    (investigación de mercado), o recabándolos directamente de archivos (así lohacen los economistas que requieren datos históricos).

      Una vez recopilada la información, debe organizarse y ordenarse y para ello esrecomendable elaborar cuadros estadísticos. Elaboración de tablas de

    frecuencias, mediante la adecuada clasificación de los individuos dentro decada carácter.

      Se procesan o calculan ciertos valores para obtener resultados, mismos quedeben ser interpretados posteriormente. La interpretación es muy importante,ya que de ella depende la toma de decisiones posterior.

      Representación gráfica de los resultados (elaboración de gráficas estadísticas).• Obtención de parámetros estadísticos, números que sintetizan los aspectosmás relevantes de una distribución estadística.

    1.3 CONCEPTO DE ESTADÍSTICA INFERENCIAL.

    La estadística descriptiva trabaja con todos los individuos de la población. Laestadística inferencial , sin embargo, trabaja con muestras, subconjuntos formados poralgunos individuos de la población. A partir del estudio de la muestra se pretende inferiraspectos relevantes de toda la población. Cómo se selecciona la muestra, cómo serealiza la inferencia, y qué grado de confianza se puede tener en ella son aspectosfundamentales de la estadística inferencial, para cuyo estudio se requiere un alto nivelde conocimientos de estadística, probabilidad y matemáticas.

    Una vez que se tienen los resultados, estos deben interpretarse y proyectarse al futuro;

    este es el objeto de estudio de la estadística inferencial, para estudiar esta rama serequieren conocimientos de probabilidad.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    7/66

    6

    1.4 APLICACIONES DE LA ESTADÍSTICA EN OTRAS ÁREAS.

    La Estadística es una ciencia joven en su aplicación, aunque lleva cerca de 200 añosde estudiarse teóricamente. Es una herramienta que se utiliza en la mayoría de lasáreas profesionales para tomar decisiones.

    En nuestros días, la estadística se ha convertido en un método efectivo para describircon exactitud los valores de datos económicos, políticos, sociales, psicológicos,biológicos o físicos, y sirve como herramienta para relacionar y analizar dichos datos.El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sinosobre todo en el proceso de “interpretación” de esa información. El desarrollo de lateoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística.Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizandodeterminadas distribuciones probabilísticas; los resultados de éstas se pueden utilizarpara analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad delas inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios enun determinado estudio estadístico.

    1.5 ELEMENTOS DE APLICACIÓN DE LA ESTADÍSTICA.

    Imaginemos por un momento que nos encontramos en la escuela de Ingeniería dondese imparte la materia de estadística. En dicho plantel es frecuente ver informaciones entablas o cuadros como el que aparece en el siguiente ejemplo:

  • 8/18/2019 Compendio de Estadística Bueno 2015

    8/66

    7

    CUADROS ESTADÍSTICOS.

    LAS GRAFICAS.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    9/66

    8

    LAS GRAFICAS:

    HISTOGRAMA.

    Los histogramas se utilizan para representar tablas de frecuencias con datosagrupados en intervalos. Si los intervalos son todos iguales, cada uno de ellos es la

    base de un rectángulo cuya altura es proporcional a la frecuencia correspondiente.

    POLÍGONO DE FRECUENCIAS.

    Si se unen los puntos medios de la base superior de los rectángulos se obtiene el polígonode frecuencias.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    10/66

    9

    OJIVA

    La ojiva es una gráfica asociada a la distribución de frecuencias, es decir, que en ellase permite ver cuántas observaciones se encuentran por encima o debajo de ciertosvalores, en lugar de solo exhibir los números asignados a cada intervalo.

    II.  CONCEPTOS Y TÉRMINOS BÁSICOS. 

    2.1 DEFINICIÓN DE POBLACIÓN Y MUESTRA. 

    Para poder recopilar los datos adecuadamente se debe conocer la población objeto deestudio, por medio de una muestra representativa.

    Población:

    Se llama población  (matemáticas), al total de sujetos observables o sea; el conjunto detodos los individuos cuyo conocimiento es objeto de interés desde un punto de vistaestadístico.

    Ejemp lo: si s e estudia un p arqu e zoológico , la pob lación estará form ada

    po r tod os los animales del parqu e y la mues tra podría ser 5 ardi l las.

    Muestra:

    En estadística, conjunto de individuos extraídos de una población. 

    Se dice que una muestra  es representativa cuando, por la forma en que ha sidoseleccionada, aporta garantías suficientes para realizar inferencias fiables a partir deella.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    11/66

    10

    El estudio estadístico de una población se puede realizar mediante un análisisexhaustivo de todos sus individuos (estadística descriptiva) o bien mediante unainferencia realizada a partir de una muestra extraída de la población (estadísticainferencial).

    Otro ejemplo es:

    Un grupo de alumnos ha realizado una encuesta en su colegio. Han preguntado a suscompañeros de 2º año, cuánto tiempo dedican durante la semana a ver la televisión.

    Todos los alumnos del Colegio forman la población; el estudio está basado en ellos.

    Si realizamos un estudio estadístico sobre el color de los coches que se han vendidoeste año en nuestro país, la población sería todos los coches.

    Pero al realizar un análisis estadístico puede resultar muy complicado tener acceso atoda la población. Por lo tanto, lo que hacemos es escoger solo una parte  de lapoblación para realizar el estudio, es decir, escogemos una muestra  que sea losuficientemente representativa. En el estudio sobre la televisión, los alumnos de 2º deE.S.O. sería la muestra que hemos elegido como representativa de toda la poblacióndel centro.

    2.2 CONCEPTO GENERAL DE VARIABLE, VARIABLE CONTINUA YDISCRETA. 

    El peso, color de la piel, el grosor del pelo etcétera, son las características o variablesde la muestra de una población.

    Variable:

    En un estudio estadístico, la variable es aquello que hemos elegido como objeto deestudio y que va a ser observado y analizado sobre la muestra de población

    seleccionada.Es una característica de los sujetos de la población que puede tomar cualquiera de losvalores de un conjunto y que se evalúa por medio de una muestra.las variables puedenser:

  • 8/18/2019 Compendio de Estadística Bueno 2015

    12/66

    11

    Variables continúas y variables discretas.

    Una variable continua puede ser como el peso de las ardillas, es decir que puedentomar cualquier valor de un conjunto (1.5 kg, 1.7 kg, 1.75 kg.). El valor puede ser enteroo fraccionario, como el número de kilómetros que puede recorrer un automóvil con el

    tanque de gasolina lleno. C,…). 

    Una variable discreta es como el color de la piel, es decir solo pueden tomar algúnvalor (gris, café, blanco).Solo puede tomar como valores unidades enteras. Porejemplo; una familia puede tener 0,1,2,3,4, etcétera, hijos pero jamás podrá tener 2.5 o¾ de hijos.

    Todo lo visto anteriormente pertenece a una de las ramas de la estadística llamada“teoría del muestreo”, que es muy importante, pues si se hace un muestreo correcto seobtendrán resultados representativos de la población; en caso contrario, podemos

    incurrir en errores y omisiones debido a estimaciones que están fuera de la realidad.

    VARIABLE CONTINUA Y DISCRETA.Para la encuesta sobre la televisión, la variable continua es el número de horasdedicadas a ver la televisión. Si la variable se puede expresar mediante un valornumérico, entonces decimos que el carácter es de tipo cuantitativo.En el caso del estudio del color de los coches, la variable es un color. Esta variable nopuede ser expresado mediante un valor numérico, por eso decimos que se trata de unavariable cualitativo.

    2.3 DEFINICIÓN DE EXPERIMENTO, EXPERIMENTO ALEATORIO YDETERMINÍSTICO.

    Experimento  es una actividad realizada según un plan definido cuyos resultadosproducen un conjunto de datos.  Consiste en analizar un fenómeno, en determinadascircunstancias.

    Los experimentos pueden ser aleator ios o determinist ico s:

    Se l laman experimentos aleator ios   los que dan lugar a experiencias de azar. Elnacimiento de un niño, porque no puede predecirse el sexo, es decir, que son aquellosen donde el resultado no siempre ocurre de la misma manera.

    Una experiencia es de azar si no se puede predecir el resultado. 

  • 8/18/2019 Compendio de Estadística Bueno 2015

    13/66

    12

    Se llaman experimentos  dete rm inísti c o, aquellos en los cuales el resultado enigualdad de circunstancias, ocurre de la misma manera. Por ejemplo al combinar dosmoléculas de hidrógeno con una de oxígeno, siempre obtendremos como resultadoagua.

    EJEMPLOS:

    Si tomamos una piedra y la dejamos caer estamos seguros de que caerá. Se trata de

    una experiencia determinista, sabemos de antemano lo que

    sucederá.

    Si lanzamos una moneda al aire, ¿sabemos con certeza que

    saldrá cara? No tenemos la seguridad, puede salir cruz. Se trata

    de una experiencia de azar.

    Si echamos un dado sobre una mesa, ignoramos qué cara quedará

    arriba. El resultado depende del azar. Es una experiencia aleatoria.

    III. DISTRIBUCIÓN DE FRECUENCIAS.

    Para manejar los resultados de una encuesta, de una votación o de cualquier estudioestadístico, lo primero que hemos de hacer es organizar los resultados obtenidos,ordenándolos y clasificándolos, es decir, haciendo lo que se llama un recuento de losdatos.

    Efectuamos el recuento de los datos, anotando el número de veces que ha aparecidocada uno de los resultados.

    Ejemplo:

    Vamos a hacer un recuento de datos: Hemos preguntado a los 22 alumnos y alumnas declase sobre cuál será el resultado del próximo torneo de fútbol entre dos clubes derivales, obteniendo estos resultados:

    1 – 2 – X – X – 1 -1 - 2 - X - 1 - 1 - X - 2 - 1 - 1 - 1 - X - X - 2 - 1 - 2 - 2  – X

  • 8/18/2019 Compendio de Estadística Bueno 2015

    14/66

  • 8/18/2019 Compendio de Estadística Bueno 2015

    15/66

    14

    3.2 FÓRMULA Y CÁLCULO DEL RANGO.

    Rango estadístico (R) es la diferencia entre el valor mínimo y el valor máximo en ungrupo de números aleatorios. Se le suele simbolizar con R.

    Requisitos del rango

      Ordenamos los números según su tamaño.  Restamos el valor mínimo del valor máximo.

    Ejemplo

    Para una muestra ( 45, 50, 55, 100), el dato menor es 45 y el dato mayor es 100 . Sus

    valores se encuentran en un rango de:

    Rango = (100-45) =55

  • 8/18/2019 Compendio de Estadística Bueno 2015

    16/66

    15

    3.3 FORMULA Y VALOR DE LA AMPLITUD.

    3.4 LIMITES DE UN INTERVALO.

    Los límites de los intervalos de clase son los extremos de cada uno de los tramos enque se han dividido los valores que puede tomar la variable; el límite inferior secorresponde con el valor mínimo y el límite superior se corresponde con el valormáximo que puede tomar la variable en cada intervalo. El límite verdadero de intervaloo clase se obtiene sumando al límite más alto de una clase, el más bajo de la clasesiguiente y dividiendo el resultado entre dos. El número de intervalos es arbitrario, el

    número de intervalos ideal es aproximadamente 9. Es conveniente un número impar deintervalos, para fijarnos en la simetría de la distribución 

    3.5 CALCULO DE LOS LÍMITES.

     A continuación sumamos al valor menor la amplitud del intervalo y encontramos unvalor que llamaremos límite.

    28 + 11 = 39

    El valor 39 será el límite superior del primer intervalo y el límite inferior de segundointervalo.

    Para calcular el límite superior del segundo intervalo sumamos nuevamente la amplituddel intervalo así:

    39+11=50

  • 8/18/2019 Compendio de Estadística Bueno 2015

    17/66

    16

    De forma similar, podemos encontrar los demás límites para obtener para obtener latabla siguiente:

    De este procedimiento observamos que el límite inferior del primer intervalocorresponde al valor menor y el límite superior del último intervalo corresponde al valormayor.

    Los dos límites antes señalados definen las llamadas clases, categorías o intervalos.

    En nuestro ejemplo el primer intervalo o clase es 28 - 39.

    3.6 REGISTRO DE LOS INTERVALOS.

    CALIFICACIONES DE LA PRUEBA DE LECTURA

    Número delintervalo o clase INTERVALOSLímite inferior. Límite superior1 28 392 39 503 50 614 61 725 72 836 83 94

    3.7 FORMULA Y REGISTRO DE LAS MARCAS DE CLASE.

    Una vez que tenemos definidas los límites de cada intervalo, calculamos el valor medio entre losdos límites, llamado maraca de clase o marca del intervalo (mc). La marca de clase se calcula asípara el primer intervalo:

  • 8/18/2019 Compendio de Estadística Bueno 2015

    18/66

    17

    De igual manera se calculan las demás y se anotan en la tabla o cuadro estadístico.

    CALIFICACIONES DE LA PRUEBA DE LECTURANúmero del intervalo

    o claseINTERVALOS MARCA DE CLASE

    m. c.1 28 - 39 33.5

    2 39 - 50 44.53 50 - 61 55.54 61 - 72 66.55 72 - 83 77.56 83 - 94 88.5

    3.8 REGISTRO DE LAS FRECUENCIA ABSOLUTAS.

    Para cada intervalo se tendrá una frecuencia determinada. Esta frecuencia será el número deveces que se repite cada variable Para ello elaboramos una tabla como esta:

    Variable(X) Frecuencia(f) Variable(X) Frecuencia (f)

    28 1 65 239 1 66 141 1 67 346 1 68 448 2 69 154 1 71 157 3 72 259 2 75 160 1 76 261 3 78 1

    62 1 80 163 1 86 164 3 94 1

    Una vez que se obtiene la frecuencia, se registra la frecuencia absoluta  que es el número deobservaciones que comprenden a cada intervalo representado por su marca de clase, en la columnacorrespondiente del cuadro estadístico, como se muestra en el siguiente:

    CALIFICACIONES DE LA PRUEBA DE LECTURANo.

    intervaloo clase

    INTERVALOS MARCA DE

    CLASEm. c.

    Frecuencia

    absoluta(f. a.)1 28 - 39 33.5 22 39 - 50 44.5 43 50 - 61 55.5 104 61 - 72 66.5 195 72 - 83 77.5 56 83 - 94 88.5 2

    ∑= 42 

  • 8/18/2019 Compendio de Estadística Bueno 2015

    19/66

    18

    3.9 CÁLCULO Y REGISTRO DE LA FRECUENCIA ABSOLUTA ACUMULADA.

    CALIFICACIONES DE LA PRUEBA DE LECTURANo.

    intervaloo clase

    INTERVALOS MARCA DE

    CLASEm. c.

    Frecuencia

    absoluta(f. a.)

    Frecuencia

     Absolutaacumuladaf. a. a.

    1 28 - 39 33.5 2 22 39 - 50 44.5 4 563 50 - 61 55.5 10 164 61 - 72 66.5 19 355 72 - 83 77.5 5 406 83 - 94 88.5 2 42

    ∑= 42 

    3.10 FRECUENCIA RELATIVA.

    Es el porcentaje de observaciones que corresponde a cada intervalo, es decir, es el porcentaje querepresenta la frecuencia absoluta de determinado intervalo, con respecto al total de datosproporcionados.

    Para obtener la frecuencia relativa de cada intervalo se utiliza la siguiente fórmula:

    100..   xn far  f    

     

    Donde: f.a. = frecuencia absoluta de cada intervalo

    n= número total de datos.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    20/66

    19

    Las frecuencias relativas en nuestro problema son:

    Una vez calculada la frecuencia relativa de cada intervalo es necesario registrar dichos valores en elcuadro estadístico, agregando la columna necesaria, como se muestra en el siguiente cuadro:

    CALIFICACIONES DE LA PRUEBA DE LECTURANo.intervaloo clase

    Intervalos Marca declase(m. c.)

    Frecuenciaabsoluta(f. a.)

    Frecuencia Absolutaacumulada(f. a. a.)

    Frecuenciarelativa(f. r.)

    1 28 - 39 33.5 2 2 4.76%2 39 - 50 44.5 4 56 9.52%3 50 - 61 55.5 10 16 23.81%4 61 - 72 66.5 19 35 45.24%5 72 - 83 77.5 5 40 11.91%6 83 - 94 88.5 2 42 4.76%

    ∑= 42 

    3.11 FRECUENCIA RELATIVA ACUMULADA.

    La frecuencia relativa acumulada para cada intervalo se obtiene sumando o acumulandotodas las frecuencias relativas de los intervalos anteriores a la frecuencia relativa delintervalo presente, por ejemplo, la frecuencia relativa acumulada del cuarto intervalo secalcula así:

    4.76 + 9.52 + 23.81 + 45.24 = 83.33%

  • 8/18/2019 Compendio de Estadística Bueno 2015

    21/66

    20

    CALIFICACIONES DE LA PRUEBA DE LECTURANo.intervaloo clase

    Intervalos Marca declase(m. c.)

    Frecuenciaabsoluta(f. a.)

    Frecuencia Absolutaacumulada(f. a. a.)

    Frecuenciarelativa(f. r.)

    Frecuenciarelativaacumulada(f. r. a.)

    1 28 - 39 33.5 2 2 4.76% 4.76%2 39 - 50 44.5 4 56 9.52% 14.28%3 50 - 61 55.5 10 16 23.81% 38.09%4 61 - 72 66.5 19 35 45.24% 83.33%5 72 - 83 77.5 5 40 11.91% 95.24%6 83 - 94 88.5 2 42 4.76% 100.00%

    ∑= 42 

    (CUADRO 1)

    IV. REPRESENTACIÓN GRAFICA DE DATOS

    4.1 CONCEPTO DE HISTOGRAMA.

    Es la representación gráfica de la distribución de frecuencias de una variable en forma de diagramade barras. Función cuyas abscisas son los valores de la variable y las ordenadas las frecuenciascorrespondientes.Consiste en un diagrama de barras verticales donde la altura de cada barra indica el número deobservaciones de cada valor de la variable, representado por el punto medio de la base de la barra.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    22/66

    21

    4.2 DEFINICIÓN DE POLÍGONO DE FRECUENCIAS.

    Es un gráfico de trazos de la frecuencia de clase con relación a la marca de clase, se obtieneuniendo los puntos medios de las partes superiores de los rectángulos del histograma.

    4.3 DEFINICIÓN DE OJIVA

    Es una gráfica que muestra las frecuencias relativas acumuladas menores que cualquier límite

    superior de clase trazado sobre los límites superiores de clase.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    23/66

    22

    4.4 TRAZADO DEL HISTOGRAMA Y POLÍGONO DE FRECUENCIAS

    Para dibujar un histograma, los límites de los intervalos con su respectiva marca de clase seregistran o grafican en el eje horizontal o de las abscisas (en el siguiente caso, la puntuación en laprueba de lectura). En el eje vertical o de las ordenadas, se representa el número de observacionescomprendidas en cada intervalo (la frecuencia absoluta, corresponde al número de niños).

    HISTOGRAMA DE LAS CALIFICACIONES DE LA PRUEBA DE LECTURA DE 7 NIÑOS (CUADRO 1)

    Para trazar un polígono, se hace una marca para cada frecuencia en el eje vertical sobre elpunto medio del intervalo del eje de las X (suponiendo que los intervalos de clase son deigual amplitud). Después se unen estos puntos por medio de líneas rectas y se extiendenhacia ambos extremos. Un convencionalismo gráfico permite cerrar el polígono, iniciándolo yterminándolo sobre el eje de las abscisas en dos puntos medios hipotéticos, considerandouna propiedad geométrica que dice que el área del polígono es igual a la suma del área delos rectángulos del histograma.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    24/66

    23

    0

    2

    4

    6

    8

    10

    12

    14

    16

    18

    20

    33.5 44.5 55.5 66.5 7.5 88.5

    POLÍGONO DE FRECUENCIAS DE LAS CALIFICACIONES DE LA PRUEBA DE LECTURA DE 7 NIÑOS(CUADRO 1)

    4.5 ESCALAS DE LA OJIVA.

    Para el trazado de la ojiva o curva “s”, se registran en el eje de las abscisas (X), los limitessuperiores de cada intervalo, en el eje de las ordenadas (Y) se registra la frecuenciarelativa acumulada, relacionando y ubicando mediante un punto el límite superior de cada

    intervalo con su respectiva frecuencia relativa acumulada, uniendo con una línea cadapunto y obtener la ojiva o curva “s”.  

    Puntuación de 7 niños en una prueba de lectura.

    4.6 TRAZADO DE LA OJIVA

    39 50 61 72 83 94 lim sup

  • 8/18/2019 Compendio de Estadística Bueno 2015

    25/66

    24

    V. MEDIDAS DE POSICIÓN RELATIVA.

    5.1 DEFINICIÓN.

    “Son aquellas medidas que sirven para descubrir la localización de un dato específico enrelación al resto de la muestra.” Cuando una muestra de datos está ordenado en forma ascendente, el valor central( o ala media de los valores centrales), es la mediana y divide a la muestra en dos partesiguales. Con esta misma idea, se puede pensar en los valores que dividen en la muestraen cuatro partes, en diez o en cien partes.

    5.2 DEFINICIÓN DE PERCENTIL.

    Los valores que dividen a la muestra en cuatro partes iguales se les da el nombre decuartiles, los valores que dividen a la muestra en diez partes iguales se les denominadeciles y a los q ue dividen en cien partes se les l lama percent i les, desde el 1º hastael 99º que dejan desde 1% hasta el 99% de observaciones con categorías menores. Elprimero, segundo, tercero,….nonagésimo noveno percentil, son los valores quecorresponden a los números de orden

    5.3 FÓRMULA DE LA POSICIÓN DEL PERCENTIL.

    En una distribución de frecuencias de datos originales agrupados se localizan lospercentiles de la forma siguiente:

    1. Se determina la posición que cada percentil debe ocupar en la distribución, esenúmero de orden se obtiene de la siguiente manera:

    100

     Nn P 

     N  

     

    Donde: P= símbolo del percentilN= número del percentil a calcularn= total de datos

  • 8/18/2019 Compendio de Estadística Bueno 2015

    26/66

    25

    5.4 CALCULO DE LA POSICIÓN DE UN PERCENTIL.

    Ejemplo: Los siguientes datos corresponden a las estaturas de los alumnos del grupo201 de Heroico Colegio Militar.

    ESTATURA DE LOS ALUMNOS DEL GRUPO 201

    Intervalos Marca declase (m. c.) Frecuenciaabsoluta (f.a.)

    Frecuencia Absoluta acumulada (f. a.a.)

    162 - 167.6 164.8 12 12167.6 -173.2

    170.4 14 26

    173.2 -178.8

    176 15 41

    178.8 -184.8

    181.6 18 59

    184.8 - 190 187.2 13 72

    ∑= 72 Considerando la distribución anterior, calcular la posición o número de orden delpercentil 30º.

    100

     Nn P 

     N  

     

    6.21100

    )72(3030

       P  

    El número de posición o de orden 21.6 indica el lugar que ocupa el valor del percentil30 en la distribución de frecuencias anterior.

    5.5 FÓRMULA DEL VALOR DE UN PERCENTIL.Una vez que se ha encontrado la posición o número de orden del percentil, se procedea buscar la frecuencia acumulada que los contenga; ya localizada esa frecuencia, seaplica la siguiente fórmula para calcular el valor exacto:

    a

     f  

     f   P  Lim P    N 

     K  

     

     

     

       

    2

    1inf 

     

    Donde: K= Valor del percentil a calcular.Lim inf = Limite inferior del intervalo que contiene el percentil.n=No. de datos.PN= Posición o número de órden del percentil calculado..F1= Frecuencia absoluta acumulada anterior del intervalo que contienen el percentil.F2= Frecuencia absoluta del intervalo que contienen el percentil.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    27/66

    26

    5.6 CALCULO DEL VALOR DE UN PERCENTIL.

    Tomando en cuenta el cuadro de distribución de las estaturas de los alumnos del 201del Heroico Colegio Militar y considerando que la posición o número de orden delpercentil 30 es el 21.6, se considera que está contenido en la segunda frecuenciaabsoluta acumulada, correspondiente al segundo intervalo.

    ESTATURA DE LOS ALUMNOS DEL GRUPO 201

    Intervalos Marca declase(m. c.)

    Frecuenciaabsoluta(f. a.)

    Frecuencia Absolutaacumulada(f. a. a.)

    162 - 167.6 164.8 12 12167.6 - 173.2 170.4 14 26173.2 - 178.8 176 15 41

    178.8 - 184.8 181.6 18 59184.8 - 190 187.2 13 72

    ∑= 72 

    Una vez localizada la posición se procede a continuación a ´calcular el valor delpercentil aplicando la siguiente fórmula:

    a f  

     f   P  Lim P    N 

     K  

     

     

     

       

    2

    1inf 

     

    Sustitución:

    6.514

    126.216.167

    30    

      

         P 

     

    43.17130

      P  

    Por lo tanto el valor del percentil que representa el 30% del total de los datos es igual a171.43, lo que quiere decir, que el 30% por ciento de alumnos miden 171.43 cms.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    28/66

    27

    IV. MEDIDAS DE TENDENCIA CENTRAL.

    6.1 DEFINICIÓN.

    Como se vio en temas anteriores, en un histograma hay una zona donde las barra son

    más altas, es decir, hay valores de las variables que son más frecuentes, en cambioexisten zonas extremas donde los valores de la variable son menos frecuentes.

    Las medidas de tendencia central son valores de la variable que nos indican alrededorde que valor se agrupan el mayor número de casos estudiados.

    Las medidas de tendencia central son representativas de toda la población y lasprincipales son:

    6.2 CONCEPTO DE MEDIA ARITMÉTICA.

    Es la medida de posición que se obtiene sumando todos los valores de la variable ydividiendo la suma entre el numero de sumandos.

    Es el valor típico o representativo de un conjunto de datos y se denota con el siguientesímbolo:

    6.3 FÓRMULA DE LA MEDIA ARITMÉTICA.

    Cuando tenemos pocas observaciones, se pueden hacer los cálculos con datosaislados, por ejemplo: Si en la ciudad de Guanajuato se registraron al medio día lassiguientes temperaturas: lunes 21ºC, martes 25ºC, miércoles 24ºC, jueves 22ºC,viernes 23ºC, sábado 21ºC y domingo 20ºC.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    29/66

    28

    La media se calcula así:Fórmula de la media para datos aislados:

    n

     X  X  X  X  X 

      ni     ....32 

    Sustitución:

    C  X 

     X 

     X 

    286.22

    7

    156

    7

    20212322242521

     

    En el ejemplo anterior, donde las observaciones son pocas y tienen frecuencia unitaria, el

    cálculo se hace mediante la aplicación de la fórmula para datos aislados, pero en estecurso se trabajará con datos agrupados donde cada observación o variable tienefrecuencia distinta.Un criador de cerdos registró, en 334 partos, el número de lechones por camada y obtuvoel resultado siguiente:

    Número delechonespor camada 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

    Frecuenciacon que sepresentaron 1 1 4 6 17 20 30 35 51 52 39 45 21 7 5

    Si se quiere saber cuál es la media, haremos la suma total de observaciones, como sigue:

    Nota: al trabajar con datos agrupados multiplicamos cada valor de la variable por lafrecuencia correspondiente.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    30/66

    29

    Si se tiene en cuenta que cada valor distinto X i de la variable se repite tantas veces comoindica su frecuencia f i , la suma de todas las observaciones iguales será igual al productoXif i, por tanto, la media aritmética es:

    =

    Como al definir la media hemos hablado de una suma de los valores observados,introduciremos el símbolo ∑ (sigma mayúscula) para denotar la suma o sumatoria de unavariable. Al aplicar el operador suma la fórmula anterior queda:

    i

    ii

      f  

     X   f   

    Donde: = Media de la variable.

    .

    6.4 CALCULO DE LA MEDIA ARITMÉTICA.

    Ejemplo:

    Calcular el valor de la media aritmética de los siguientes datos.

    No. De abdominales realizadas por 120 cadetes del HCM en 10 minutos.Intervalos Marca

    declase(m. c.)Xi

    Frecuenciaabsoluta(f. a.)

    Fi

    Frecuencia Absolutaacumulada

    (f. a. a.)

    FrecuenciaRelativa

    f. r.

    FrecuenciaRelativaacumulada

    Fi Xi30 - 40 35 15 15 12.5% 12.5% 52540 - 50 45 30 45 25% 37.5% 1350

    50 - 60 55 60 105 50% 87.5% 330060 - 70 65 10 115 8.33% 95.83% 65070 - 80 75 5 120 4.17% 100% 375

    ∑= 120  ∑= 6200 

  • 8/18/2019 Compendio de Estadística Bueno 2015

    31/66

    30

    Fórmula: Sustitución: Resultado:

    i

    ii

     f  

     X  f   X 

     

    120

    6200 X   

    66.51 X  

    El valor de la media es representativo del total de la población y éste nos indica que los120 cadetes realizan en promedio 51.66 abdominales en 10 minutos.

    Si dibujamos el histograma correspondiente y ubicamos la media obtendremos elsiguiente diagrama.

    Como se puede observar, la media es un valor centrado entre los límites del rango y seinterpreta de ésta manera: en promedio, el número de abdominales realizadas por loscadetes en diez minutos es de 51.66.

    6.5 CONCEPTO DE MODA

    Es el valor de la variable que se presenta con mayor frecuencia. Se considera como el

    valor más frecuente, es decir, el punto donde se concentra el mayor número deobservaciones.La moda sirve en los negocios, por ejemplo, para determinar que tamaño o talla delproducto es el de mayor demanda. El fabricante de zapatos estará interesado en sabercuál es la medida que más se vende. Similarmente, para programar la producción deun medicamento, el fabricante estará interesado en saber cuál es la dosis que confrecuencia recetan los medicamentos.

    30 40 50 60 70 80

  • 8/18/2019 Compendio de Estadística Bueno 2015

    32/66

    31

    En una serie de datos originales no agrupados la moda se determina localizando aquelvalor que más veces se repite, ejemplo: si se tienen los siguientes valores: 5, 6, 6, 7, 7,7,8, 8, y 9, la moda será 7, pues es el valor que más se repite.

    La moda para datos agrupados se puede apreciar directamente en el histogramasiguiente:

    En el histograma anterior el valor modal se encuentra en el tercer intervalo entre el 50 -

    60.Existen fenómenos variacionales que al representarse en un histograma no sólo muestranuna moda (unimodales) sino dos (bimodal), o varias modas (multimodales). Lo anterior seilustra en los siguientes histogramas:

    0

    50

    100

     

    0

    50

    100

     UNIMODAL BIMODAL

    Mayor

    frecuencia

  • 8/18/2019 Compendio de Estadística Bueno 2015

    33/66

    32

    0

    10

    20

    30

    40

    50

    60

    70

     MULTIMODAL

    6.6 FORMULA Y CALCULO DE LA MODA.En una serie simple y en una serie de frecuencias la determinación del valor de la modano ofrece problemas, pues como ya se dijo, es el valor de máxima frecuencia o seaaquel que más se repite en el conjunto de observaciones.

    En una serie de intervalos y frecuencias se complica su cálculo por su misma estructura(el número de casos de cada intervalo) pero se pude determinar su valor utilizando lasiguiente fórmula:

    Donde:

  • 8/18/2019 Compendio de Estadística Bueno 2015

    34/66

    33

    Tomando el ejemplo de la distribución del número de abdominales que realizan 120cadetes del HCM en 10 minutos, utilizaremos la fórmula anterior para determinar elvalor de la moda.

    No. De abdominales realizadas por 120 cadetes del HCM en 10 minutos.Intervalos Marca

    declase(m. c.)Xi

    Frecuenciaabsoluta(f. a.)

    Fi

    Frecuencia Absolutaacumulada

    (f. a. a.)

    FrecuenciaRelativa

    f. r.

    FrecuenciaRelativaacumulada

    Fi Xi30 - 40 35 15 15 12.5% 12.5% 52540 - 50 45 30 45 25% 37.5% 135050 - 60 55 60 105 50% 87.5% 330060 - 70 65 10 115 8.33% 95.83% 65070 - 80 75 5 120 4.17% 100% 375

    ∑= 120  ∑= 6200 

    FORMULA SUSTITUCIÓN RESULTADO

    53.75

    El valor de la moda de la distribución anterior puede apreciarse y localizarse de maneraexacta en el siguiente histograma.

    53.75

  • 8/18/2019 Compendio de Estadística Bueno 2015

    35/66

    34

    6.7 CONCEPTO DE MEDIANA.

    Otra medida de tendencia central es la mediana , .la mediana de un conjunto de

    observaciones generalmente, se define de la siguiente forma:

    “es el valor que queda en la parte central de un grupo de observacio nes arreglados enorden de magnitud” 

    “Es aquel valor de la variable que muestra tanto a la izquierda como a la derecha lamitad de las frecuencias” 

    6.8 FORMULA Y CALCULO DE LA MEDIANA.Serie de datos no agrupados.

    Si el número de observaciones es impar, la mediana coincidirá con el valor central. Si elnúmero de observaciones es par, la mediana estará representada por la mediaaritmética de los dos valores centrales.

    Ejemplo:

    Hallar la mediana de los valores 62, 58, 64, 56 y 60. Como el número de observaciones

    es impar, después de ordenar los distintos valores 56, 58, 60, 62 y 64, la medianavendrá dada por el valor 60, que es el que ocupa el centro de la serie.

    Si solo hubiera cuatro observaciones (número par), por ejemplo 56, 58, 60 y 62, lamediana sería:

    Serie de datos agrupados.

    En una distribución de frecuencias o datos agrupados, la mediana puede obtenerse pordos métodos: por interpolación o por medio de una gráfica (ojiva).Para determinar el valor de la mediana por interpolación se aplica la siguiente fórmula:

  • 8/18/2019 Compendio de Estadística Bueno 2015

    36/66

    35

    a f  

     f   N 

     Lim X med 

     

     

     

     

      1

    inf 

    2~

     

    Donde:

    .int

    .

    .1

    .

    .intinf  liminf  

    ervaloslosdeamplitud a

    medianaclaseladeabsoluta  frecuenciamed   f  

    medianaclaselaaanterior acumulada  frecuencia  f  

    datosdetotal número N 

    datoslosdemitad lacontienequeervalodel erior ite Lim

     

    Tomando el ejemplo de la distribución del número de abdominales que realizan 120 cadetesdel HCM en 10 minutos, utilizaremos la fórmula anterior para determinar el valor de lamediana.

    No. De abdominales realizadas por 120 cadetes del HCM en 10 minutos.Intervalos Marca

    declase(m. c.)Xi

    Frecuenciaabsoluta(f. a.)

    Fi

    Frecuencia Absolutaacumulada

    (f. a. a.)

    FrecuenciaRelativa

    f. r.

    FrecuenciaRelativaacumulada

    Fi Xi30 - 40 35 15 15 12.5% 12.5% 52540 - 50 45 30 45 25% 37.5% 135050 - 60 55 60 105 50% 87.5% 330060 - 70 65 10 115 8.33% 95.83% 65070 - 80 75 5 120 4.17% 100% 375

    ∑= 120  ∑= 6200 

    FORMULA SUSTITUCIÓN RESULTADO

    a f  

     f   N 

     Lim X med 

     

     

     

     

      1

    inf 

    2~

     

    1060

    452

    120

    50~

     

     

     

     

     X 

     

    5.52~  X 

     

    El resultado de la mediana nos dice que el 50% de los cadetes realizan menos de 52.5abdominales en diez minutos y el otro 50% realiza más de 52.5 abdominales en el tiempocitado.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    37/66

    36

    Solución gráfica.

    Este método se basa en la construcción de la ojiva sobre la base “menor que” y “o más”.Cuando la distribución ha sido adecuadamente representada en la ojiva el valor de lamediana puede obtenerse de la manera siguiente: primero localizamos el 50% en la escalade las Y; luego, se traza una línea horizontal desde ese punto hasta cortar la ojiva, y se trazauna línea vertical desde el punto en que la línea horizontal corta a la ojiva hasta el eje de lasX. El punto en que la línea vertical corta al eje de las X es el valor de la mediana.

    En el histograma de los datos anteriores, al igual que el valor de la media y la moda ,

    también se puede identificar y señalar el valor de la mediana , como se puede observaren la grafica siguiente:

    100

    90

    80

    70

    60

    50

    4030

    20

    10

    40 50 60 70 80 lim sup

    f. r.a

    %

    (Número dabdominales de 12cadetes) 

  • 8/18/2019 Compendio de Estadística Bueno 2015

    38/66

    37

    VI MEDIDAS DE DISPERSIÓN.

    7.1 DEFINICIÓN.

    Las medidas de tendencia central, pueden no ser suficientes para caracterizar lainformación obtenida en forma adecuada. La utilidad de un promedio depende de supoder representativo del conjunto de observaciones. Si los valores observados de lavariable están muy concentrados alrededor del promedio, éste es muy representativo;pero si aquellos valores están muy dispersos con relación al promedio, éste es pocorepresentativo.

    El significado de las medidas de tendencia central gana mucho si lo respalda unamedida de la dispersión de las observaciones en torno a él.

    El concepto de dispersión resulta importante para los estudios económicos, ya que

    puede darse el caso de poblaciones con igual valor central, pero una puede estar másdispersa que la otra.

    “Las medidas de dispersión o también llamadas de variación, indican que tan alejadoso dispersos se encuentran los datos, con respecto a la media del conjunto de datos”.  

    Cuando se requiere conocer la dispersión de una variable, lo que se intenta es obteneruna medida, que indique el mayor o menor grado en que están dispersos los datos.Las medidas más utilizadas se denominan:

     Rango (R)

     Desvío (d)

     Desviación media (dm)

     Varianza (S2)

     Desviación estándar (S)

    En los siguientes temas definiremos y calcularemos cada una de estas medidas.

    Rango.

    Es la diferencia entre el mayor y el menor valor de los datos observados. En la serie 2,10, 12, 16, el rango es 16-2= 14. Sin embargo, el rango no nos da ninguna informaciónsobre lo que ocurre entre estos valores.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    39/66

    38

    7.2 CONCEPTO Y FÓRMULA DEL DESVÍO.

    Es la diferencia entre cada valor de la variable u observación y la media.Fórmula:

    7.3 REGISTRO DEL DESVÍO.

    Para ilustrar el valor del desvío veamos el siguiente problema.Con los datos que se proporcionan en la tabla del capital social de las empresa en unaregión calcular el desvío.

    VariableMillones de

    pesos

    frecuencia 

    (f i)

    5 - 20 820 - 35 935 - 50 1050 - 65 765 - 80 4

    Elaboremos el siguiente cuadro de cálculo:

    INTERVALOS M. C.Xi F.A.Fi FiXi DESVÍO  X  X i    

    5 - 20 12.5 8 100.0 12.5-38.55=-26.05

    20 - 35 27.5 9 247.5 27.5-38.55=-11.05

    35 - 50 42.5 10 425.0 42.5-

    38.55=3.9550 - 65 57.5 7 402.5 57.5-38.55=18.95

    65 - 80 72.5 4 290.0 72.5-38.55=33.95

    ∑=38  ∑=1465

  • 8/18/2019 Compendio de Estadística Bueno 2015

    40/66

    39

    55.3838

    1465

    i f  

    i X i f   X  Media

     

    Como se puede observar en el cuadro anterior, se calcula la marca de clase (columna2). Una vez hecho esto, se multiplica la marca de clase por la frecuencia absoluta paraencontrar el valor de media (columna 4). Posteriormente se calculan los desvíos decada marca de clase (columna 5), en la práctica no es necesario anotar la operación,solo los resultados, se realizó para fines explicativos.

    7.4 DESVIACIÓN MEDIA.Como la suma de todos los desvíos en cualquier grupo de datos es nula, tendremosque pensar en calcular el valor absoluto del desvío, al promedio de los valoresabsolutos del desvío se le denomina desviación media, indica en promedio el número

    de unidades en que cada dato se encuentra alejado de la media.

    7.5 ECUACIÓN Y CÁLCULO DE LA DESVIACIÓN MEDIA.

    La desviación media se denota así:

    n

     X i X i f  dm

     

     Donde:

  • 8/18/2019 Compendio de Estadística Bueno 2015

    41/66

    40

     Al colocar entre barras indicamos que las desviaciones son en valor absoluto.

    Continuando con el ejemplo anterior calcularemos la desviación media de la siguientemanera:

    CAPITAL SOCIAL DE LAS EMPRESAS EN UNA REGIÓN.

    INTERVALOS M. C.Xi 

    F.A.Fi

    FiXiDESVÍO  X  X i    

    Valorabsoluto

    5 - 20 12.5 8 100.0 -26.05 26.05 208.4

    20 - 35 27.5 9 247.5 -11.05 11.05 99.45

    35 - 50 42.5 10 425.0 3.95 3.95 39.5

    50 - 65 57.5 7 402.5 18.95 18.95 132.65

    65 - 80 72.5 4 290.0 33.95 33.95 135.8∑=38  ∑=1465  ∑=615.8 

    55.3838

    1465

    i f  

    i X i f   X  Media

     

    n X i X i f  dmmedia Desviación  

     

    20.1638

    8.615dm

     

    Como podemos observar en el cuadro anterior se agregó una columna con el valor absolutodel desvió (columna 6), una vez hecho esto, se multiplica el valor absoluto del desvío por lafrecuencia absoluta para encontrar el valor de la desviación media (columna 7).

  • 8/18/2019 Compendio de Estadística Bueno 2015

    42/66

    41

    7.6 DEFINICIÓN DE VARIANZA.

    Se define como el promedio de los cuadrados de las desviaciones de los datos conrespecto a la media. Su valor indica la forma en que están distribuidos los datos conrespecto a la media.

    No obstante que la desviación media es una medida fácil de obtener, tiene elinconveniente de que no sigue en su proceso un rigor algebraico, por lo tanto,generalmente se prefiere emplear la varianza o la desviación estándar, que hacer usode los cuadrados de las desviaciones , para evitar que la suma de las

    desviaciones sea igual a cero. La suma de los cuadrados de las desviaciones se divideentre el número de términos y se obtiene la varianza.

    7.7 CÁLCULO DE REGISTRO DEL DESVÍO AL CUADRADO.

    Para calcular el valor de la varianza precisa elevar al cuadrado el valor de los desvíos,por lo tanto al cuadro estadístico se le agrega una columna (columna 8) para registrardicho valor, quedando de la siguiente manera:

    CAPITAL SOCIAL DE LAS EMPRESAS EN UNA REGIÓN.

    INTERVALOS M. C.Xi 

    F.A.Fi

    FiXiDESVÍO

     X  X i    

    Valorabsoluto

    5 - 20 12.5 8 100.0 -26.05 26.05 208.4 678.6020 - 35 27.5 9 247.5 -11.05 11.05 99.45 122.10

    35 - 50 42.5 10 425.0 3.95 3.95 39.5 15.60

    50 - 65 57.5 7 402.5 18.95 18.95 132.65 359.10

    65 - 80 72.5 4 290.0 33.95 33.95 135.8 1152.60∑=38  ∑=1465  ∑=615.8 

    55.3838

    1465

    i

    ii

     f  

     X  f   X  Media

     

  • 8/18/2019 Compendio de Estadística Bueno 2015

    43/66

    42

    n

     X i X i f  dmmedia Desviación

     

     

    20.1638

    8.615 dm 

    7.8 FÓRMULA Y CÁLCULO DE LA VARIANZA.

    Para calcular el valor de la varianza se utiliza la siguiente fórmula:

     

    i

    ii

     f  

     X  X  f  S 

    2

    2

     

    Procedimiento que indica que cada desviación respecto a la media, elevada alcuadrado, debe multiplicarse por su respectiva frecuencia, después hay que sumar losdatos obtenidos y dividir esa suma entre la suma de las frecuencias absolutas.

     Aplicando esta fórmula al ejemplo relativo al capital social de las empresas de unaregión queda:

    CAPITAL SOCIAL DE LAS EMPRESAS EN UNA REGIÓN.

    INTERVALOS M. C.Xi 

    F.A.Fi

    FiXi DESVÍO  X  X i    Valorabsoluto

    5 - 20 12.5 8 100.0 -26.05 26.05 208.4 678.60 5428.8

    20 - 35 27.5 9 247.5 -11.05 11.05 99.45 122.10 1098.9

    35 - 50 42.5 10 425.0 3.95 3.95 39.5 15.60 156.0

    50 - 65 57.5 7 402.5 18.95 18.95 132.65 359.10 2513.7

    65 - 80 72.5 4 290.0 33.95 33.95 135.8 1152.60 4610.4

    ∑=38  ∑=1465  ∑=615.8  ∑=13807.8 

    55.3838

    1465

    i f  

    i X i f   X  Media

     

  • 8/18/2019 Compendio de Estadística Bueno 2015

    44/66

    43

    n

     X i X i f  dmmedia Desviación

     

     

    20.1638

    8.615dm

     

     

    i f  

     X i X i f  S Varianza2

    2

     

    36.36338

    8.138072 S  

    Si al valor de la varianza le extraemos raíz cuadrada, obtenemos la desviaciónestándar (S).

    7.9 CONCEPTO Y FÓRMULA DE LA DESVIACIÓN ESTÁNDAR.

    La desviación estándar es un valor que representa todas las diferencias individuales detodos los valores observados respecto a un punto de referencia común, que es lamedia aritmética. Es la raíz cuadrada de la varianza.

    Si los valores de la variable están muy concentrados en torno de la media, entonces lasdesviaciones serían pequeñas, y si están muy dispersas, las desviaciones

    serían grandes, por tanto, la desviación estándar que es un promedio de lasdesviaciones indica el grado de concentración o de dispersión de los valoresobservados. Si hay concentración alrededor de la media, el valor de S será un númeropequeño y si hay dispersión, S será un número grande.

    Cuando los datos vienen dados por una distribución de frecuencias, cuya amplitud seaigual en todos los intervalos, se calcula el valor de la desviación estándar utilizando lasiguiente fórmula:

     

    i

     I i

     f   X  X  f  S 

    2

     

    La fórmula nos indica que al valor de la varianza hay que extraerle la raíz cuadrada.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    45/66

    44

    7.10 CÁLCULO DE LA DESVIACIÓN ESTÁNDAR.

     Aplicando la fórmula de la desviación estándar al ejemplo en cuestión queda:

    CAPITAL SOCIAL DE LAS EMPRESAS EN UNA REGIÓN.INTERVALOS M. C.

    Xi F.A.Fi

    FiXiDESVÍO

     X  X i    Valorabsoluto

    5 - 20 12.5 8 100.0 -26.05 26.05 208.4 678.60 5428.8

    20 - 35 27.5 9 247.5 -11.05 11.05 99.45 122.10 1098.9

    35 - 50 42.5 10 425.0 3.95 3.95 39.5 15.60 156.0

    50 - 65 57.5 7 402.5 18.95 18.95 132.65 359.10 2513.7

    65 - 80 72.5 4 290.0 33.95 33.95 135.8 1152.60 4610.4

    ∑=38  ∑=1465  ∑=615.8 ∑=13807.8 

    55.3838

    1465

    i f  

    i X i f   X  Media

     

    n

     X i X i f  

    dmmedia Desviación

     

     

    20.1638

    8.615dm

     

     

    i f  

     X i X i f  

    S Varianza

    22

     

    36.36338

    8.138072 S  

  • 8/18/2019 Compendio de Estadística Bueno 2015

    46/66

    45

     

    i f  

     X i X i f  S estándar  Desviación2

     

    06.1936.36338

    8.13807S 

     

    V. MEDIDAS DE CORRELACIÓN.

    8.1 DEFINICIÓN.En la vida diaria, es común encontrar dos variables que guardan dependencia entre sí,es decir, el valor de una de ellas está sujeta al valor de la otra o viceversa.   Estainterdependencia se conoce como “correlación de dos var i ables” .

    Por ejemplo:Los técnicos de la Secretaría de Agricultura al analizar la producción de maíz en una delas zonas agrícolas del país, encontrar que la mayor producción se concentraba enaquellas regiones donde se habían utilizado mayor cantidad de un producto químico

    para abonar la tierra.

    Después de discutir si la concentración de la producción se debía al producto químicoutilizado o a algún otro factor, decidieron hacer un análisis de correlación entre laproducción de maíz y el nivel de precipitación pluvial, y otro entre la producción de maízy la cantidad de abono. Por lo anterior, se concluyó que el abono fue el factor quepermitió obtener una buena cosecha.

    Este tipo de análisis es necesario cuando dos variables en estudio estáncorrelacionadas.

    La correlación entre dos variables se debe estudiar muy bien, pues a veces es posibleencontrar una buena relación entre variables independientes, aunque no hayacausalidad. Para ilustrar lo anterior, citaremos lo que dice Rivett* al respecto.

    El autor cita el caso de Noruega, donde existe una buena relación entre el índice denatalidad de la población y el número de cigüeñas inmigrantes.  Lo anterior nos hacepensar en el mito de que los niños vienen de París; sin embargo, se hace una análisis

  • 8/18/2019 Compendio de Estadística Bueno 2015

    47/66

    46

    minucioso del problema, concluiremos que como en las comarcas noruegas existe unabuena producción agrícola, hay bienestar económico y esto estimula el aumento en latasa de natalidad. Por otro lado, la abundancia de grano favorece el desarrollo de la vidaanimal y por consiguiente la inmigración de cigüeñas.

    El caso anterior ejemplifica de manera clara, porque no es correcto relacionar lasvariables para calcular un coeficiente de correlación, pues sucede que aunque sonvariables dependientes, solo en ciertas ocasiones existe la causalidad.

    Tomemos un ejemplo que nos permita ver mejor el fenómeno de la correlación de dosvariables.*Patrick Rivett. La investigación operativa. Nueva colección Labor 1971.

    En la tabla siguiente se muestra el rendimiento de un cierto cultivo y en función de lacantidad de agua x. Es decir, suponemos que el rendimiento depende de la cantidad deagua.

    Cantidad deagua (x).

    12 18 24 30 36 42 44

    Rendimientodel cultivo (y)

    5.27 5.68 6.25 7.2 8.02 8.71 8.42

    Nuestra pregunta es: ¿será o no cierta esa dependencia?.

     Al graficar en el plano cartesiano los datos anteriores, se tiene lo siguiente:

    Se puede aventurar que las variables están correlacionadas y se agrupan de maneraque guarden una correlación lineal, esto es, su gráfica se puede representar por unarecta y expresar algebraicamente en una función lineal del tipo : y=ax+b.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    48/66

    47

    Es importante hacer notar que puede haber correlaciones no lineales, es decir, que susgráficas, y por tanto sus funciones, no sean lineales, como se observa a continuación:

    8.2 FÓRMULA DE LA MEDIA.La objetiva correlación lineal tiene por objeto encontrar la función que relacionalinealmente a las dos variables, pero antes es conveniente analizar, por medio delcoeficiente de correlación, si la dependencia mencionada es aceptable. Con éste fin, esnecesario, como primer paso calcular el valor de las media de cada variable mediantelas siguientes fórmulas:

    Donde: .

  • 8/18/2019 Compendio de Estadística Bueno 2015

    49/66

    48

    8.3 CALCULO DE LA MEDIA DE LA VARIABLE X.

    Para hacer el cálculo de la media de cada variable hasta obtener el grado de correlaciónde dos variables, utilizaremos los datos de la siguiente tabla en donde se muestra elrendimiento de un cierto cultivo (Y), en función de la cantidad d agua (X).

    Númerode

    sucesos(N)

    Cantidadde agua

    (( ))

    Rendimientodel cultivo

    ( )

    1 12 5.27

    2 18 5.683 24 6.254 30 7.25 36 8.026 42 8.717 44 8.42

    ∑=206  ∑=49.55 

    El valor de la media de la variable X se obtiene dividiendo la suma de la cantidad deagua aplicada en el terreno de cultivo entre el número de sucesos, en este caso entre 7.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    50/66

    49

    8 CALCULO DE LA MEDIA DE LA VARIABLE “Y” 

    Tomando en cuenta los datos del cuadro anterior calcularemos el valor de la media de“Y”. 

    Númerodesucesos

    (N)

    Cantidadde agua( )

    Rendimientodel cultivo( )

    1 12 5.272 18 5.683 24 6.254 30 7.2

    5 36 8.026 42 8.717 44 8.42

    ∑=206  ∑=49.55 

    Del mismo modo que se obtuvo el valor de la media de “X”, se obtiene el valor de la

    media de la variable “Y”, estos valores nos servirán para calcular y analizar la dispersiónde los datos con respecto a la media, es decir para calcular el valor del desvío.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    51/66

    50

    8.5 FÓRMULA DEL DESVÍO.Como sabemos el desvío es una medida de dispersión, que nos indica que tan alejadoso dispersos se encuentran los datos con respecto a la media.

    8.6 CALCULO DEL DESVÍO DE LA VARIABLE “X”.

    Númerodesucesos(N)

    Cantidadde agua( )

    Rendimientodel cultivo( )

    1 12 5.27 12-29.42=-17.42

    2 18 5.68 18-29.42=--11.42

    3 24 6.25 24-29.42=-5.42

    4 30 7.2 30-29.42=0.58

    5 36 8.02 36-29.42=6.58

    6 42 8.71 42-29.42=12.58

    7 44 8.42 44-29.42=14.58

    ∑=206  ∑=49.55 

  • 8/18/2019 Compendio de Estadística Bueno 2015

    52/66

    51

    8.7 CALCULO DEL DESVÍO DE LA VARIABLE “Y”. 

    Númerode

    sucesos(N)

    Cantidadde agua

    ( )

    Rendimientodel cultivo

    ( )

    1 12 5.27 -17.42 5.27-7.07=-1.81

    2 18 5.68 --11.42 5.68-7.07=-1.39

    3 24 6.25 -5.42 6.25-7.07=-0.82

    4 30 7.2 0.58 7.2-7.07=0.135 36 8.02 6.58 8.02-

    7.07=0.956 42 8.71 12.58 8.71-

    7.07=1.647 44 8.42 14.58 8.42-

    7.07=1.35∑=206  ∑=49.55 

  • 8/18/2019 Compendio de Estadística Bueno 2015

    53/66

    52

    8.8 FÓRMULA DE LA DESVIACIÓN ESTÁNDAR DE LA VARIABLE “X”.

    Para poder llegar a determinar el grado de relación entre dos variables, además de lamedia de las variables y los desvíos de cada una, es necesario definir la desviaciónestándar de la variable X. Mediante la siguiente fórmula:

    8 CALCULO DE LA DESVIACIÓN ESTÁNDAR DE LA VARIABLE “X”. 

    Retomando el ejercicio del terreno de cultivo, para obtener el valor de la desviaciónestándar de la variable “X”  (cantidad de agua), es necesario agregar una columna alcuadro estadístico, donde se obtenga el valor del desvío de la variable “X” elevado alcuadrado, como se observa en el siguiente cuadro, para después sustituir los valoresque nos pide la fórmula de la desviación estándar:

    Númerode

    sucesos(N)

    Cantidadde agua

    ( )

    Rendimientodel cultivo

    ( )

    1 12 5.27 -17.42 -1.81 303.452 18 5.68 --

    11.42

    -1.39 130.41

    3 24 6.25 -5.42 -0.82 29.374 30 7.2 0.58 0.13 0.335 36 8.02 6.58 0.95 43.296 42 8.71 12.58 1.64 158.257 44 8.42 14.58 1.35 212.57

    ∑=206  ∑=49.55  ∑=877.67 

  • 8/18/2019 Compendio de Estadística Bueno 2015

    54/66

    53

    8.10 FORMULA DE LA DESVIACIÓN ESTÁNDAR DE LA VARIABLE “Y”. 

    En cambio, para la variable “Y” se utiliza la siguiente fórmula:  

    8.11 CALCULO DE LA DESVIACIÓN ESTÁNDAR DE LA VARIABLE “Y”. 

    Para calcular el valor de la desviación estándar de la variable “Y” (rendimiento decultivo), es necesario agregar otra columna a nuestro cuadro estadístico, en donde seregistren los desvíos de la variable “Y” (rendimiento de cultivo) elevados al cuadrado yobtener la sumatoria, así:

    Númerode

    sucesos

    (N)

    Cantidadde agua

    ( )

    Rendimientodel cultivo

    ( )

    1 12 5.27 -17.42 -1.81 303.45 3.272 18 5.68 --11.42 -1.39 130.41 1.933 24 6.25 -5.42 -0.82 29.37 0.674 30 7.2 0.58 0.13 0.33 0.015 36 8.02 6.58 0.95 43.29 0.906 42 8.71 12.58 1.64 158.25 2.687 44 8.42 14.58 1.35 212.57 1.82

    ∑=206  ∑=49.55  ∑=877.67  ∑= 11.28 

  • 8/18/2019 Compendio de Estadística Bueno 2015

    55/66

    54

    8.12 FÓRMULA DE LA COVARIANZA

     Además de la desviación estándar, para cada variable es necesario tener una medida dedispersión de la correlación que existe entre “X” y “Y”. Esta medida la denominaremoscovarianza y la calcularemos mediante la siguiente fórmula:

    .

    8.13 CALCULO DE LA COVARIANZA.

    El valor de la covarianza del ejercicio trabajado se calcula agregando una columna másal cuadro estadístico, donde se registren los productos de los desvíos y obtener lasumatoria de los datos, de la siguiente manera:

  • 8/18/2019 Compendio de Estadística Bueno 2015

    56/66

    55

    8.14 FÓRMULA DEL COEFICIENTE DE PEARSON O CORRELACIÓN.

    La medida que nos permite saber si hay relación entre dos variables es el coeficiente dePearson.

    COEFICIENTE DE PEARSON.

    Esta medida refleja el grado de relación o efecto que tiene el cambio de una variable sobre

    la otra y lo podemos definir mediante la siguiente fórmula:

    Es decir, que el coeficiente de correlación es el cociente de la división entre la covarianzade las variables y el producto de las desviaciones estándares de cada variable.

    Sustituyendo los valores, queda:

    Númerodesucesos(N)

    Cantidadde agua( )

    Rendimientodel cultivo( )

    1 12 5.27 -17.42 -1.81 303.45 3.27 31.53

    2 18 5.68 --11.42 -1.39 130.41 1.93 15.873 24 6.25 -5.42 -0.82 29.37 0.67 4.444 30 7.2 0.58 0.13 0.33 0.01 0.075 36 8.02 6.58 0.95 43.29 0.90 6.256 42 8.71 12.58 1.64 158.25 2.68 20.637 44 8.42 14.58 1.35 212.57 1.82 19.68

    ∑=206  ∑=49.55  ∑=877.67  ∑=11.28

    ∑=98.47 

  • 8/18/2019 Compendio de Estadística Bueno 2015

    57/66

    56

    El coeficiente de correlación puede ser positivo o negativo dependiendo de la covarianza;así tendremos correlación positiva (Y aumenta cuando X aumenta) o correlación negativa (Ydisminuye cuando X aumenta), como se muestra:

    Por otro lado, r  tiene como máximo valor absoluto a la unidad , por lo que se puede escribir:

    -1 ≤ r ≤ 1 

    Cuando r=0 la correlación es nula, es decir, no hay ninguna dependencia entre las variables.Cuando la correlación es perfecta, es decir, todos los puntos de las observaciones

    están perfectamente alineados.

    Cuando 0 se tienen correlaciones normales, y se ha observado en general que una

    correlación es buena si se cumple que:

    En nuestro problema la correlación es  positiva y muy cercana al valor uno, por lo cual hay

    una dependencia aceptable entre la cantidad de agua y el rendimiento del cultivo.

    TIPOS DE RELACIÓN SEGÚN LOS VALORES DE R.

    r=0 relación nula.

  • 8/18/2019 Compendio de Estadística Bueno 2015

    58/66

    57

    8.15 CALCULO DEL COEFICIENTE DE PEARSON.

    Dados los datos relacionados al rendimiento del cultivo de un terreno y la cantidad deagua, analizaremos si la correlación lineal entre esas dos variables es aceptable o no.

    Númerodesucesos

    (N)

    Cantidadde agua

    ( )

    Rendimientodel cultivo

    ( )

    1 12 5.27 -17.42 -1.81 303.45 3.27 31.532 18 5.68 --11.42 -1.39 130.41 1.93 15.873 24 6.25 -5.42 -0.82 29.37 0.67 4.444 30 7.2 0.58 0.13 0.33 0.01 0.075 36 8.02 6.58 0.95 43.29 0.90 6.256 42 8.71 12.58 1.64 158.25 2.68 20.637 44 8.42 14.58 1.35 212.57 1.82 19.68

    ∑=206  ∑=49.55  ∑=877.67  ∑=11.28 ∑=98.47 

  • 8/18/2019 Compendio de Estadística Bueno 2015

    59/66

    58

    El coeficiente de correlación es igual a 0.99, por lo que la dependencia es aceptable, esdecir, inluyó en gran medida la cantidad de agua, en el rendimiento de cultivo delterreno.

    8.16 DEFINICIÓN DE RECTA DE REGRESIÓN

    Una vez que, a través del coeficiente de correlación, sabemos que hay una buenadependencia de las variables, nos interesa conocer la función de relación, es decir, larecta de regresión o la recta de ajuste. Esta función debe cumplir la condición de que lasuma de los cuadrados de las distancias verticales de los distintos puntos a la recta deregresión sea mínima. La forma para lograrlo es a través del método de mínimoscuadrados.

    “Es la recta que más se ajusta a las observaciones apareadas”. 

    8.17 ECUACIÓN DE LA RECTA DE REGRESIÓN.

    La recta de regresión se refiere al procedimiento de obtener una ecuación con fines deestimación o predicción. Y se representa algebraicamente por la expresión:

    La cual tiene dos parámetros, m y b, que nos interesa conocer.

    8.18 FÓRMULA DE LA ORDENADA

    La ordenada al origen (b), es la distancia que existe del origen, es decir del cero, hastadonde cruce la recta con el eje “Y”. 

    Se calcula por medio de la siguiente fórmula:

  • 8/18/2019 Compendio de Estadística Bueno 2015

    60/66

    59

    Es decir:

    8.19 CALCULO DE LA ORDENADA AL ORIGENPara calcular la ordenada al origen, es necesario calcular el producto de las variables yelevar al cuadrado los valores de la variable X, para eso es necesario agregar al cuadroestadístico, dos columnas donde se registre cada uno de estos cálculos.Para calcular la función lineal de los datos con los que hemos estado trabajando,(cantidad de agua en relación al rendimiento de cultivo), necesitamos anexar al cuadroestadístico las columnas que se muestran en la siguiente tabla estadística:

    SUCESOS1 12 5.27 63.24 1442 18 5.68 102.24 3243 24 6.25 150.0 5764 30 7.2 216 9005 36 8.02 288.72 12966 42 8.71 365.82 17647 44 8.42 370.48 1936

    ∑=206  ∑=49.55  ∑=1556.5  ∑=6940 

    b

  • 8/18/2019 Compendio de Estadística Bueno 2015

    61/66

    60

    8.20 FORMULA DE LA PENDIENTE.

    La pendiente (m), es la inclinación o pendiente de la recta (grado de inclinación).

    Se calcula mediante la siguiente fórmula:

    Es decir:

    8 CÁLCULO DE LA PENDIENTE.

    Continuando con los datos del ejercicio anterior, el cálculo de la pendiente sería de lasiguiente manera:

    SUCESOS1 12 5.27 63.24 1442 18 5.68 102.24 3243 24 6.25 150.0 5764 30 7.2 216 9005 36 8.02 288.72 12966 42 8.71 365.82 17647 44 8.42 370.48 1936

    ∑=206  ∑=49.55  ∑=1556.5  ∑=6940 

    b

    m

  • 8/18/2019 Compendio de Estadística Bueno 2015

    62/66

    61

    Por lo tanto, la recta de regresión se representa por la función lineal  siguiente:

    8.22 DEFINICIÓN DE ERROR ESTÁNDAR DE ESTIMACIÓN (E.E.E.).

    Si en la función de la recta de regresión:

    Sustituimos los valores originales de  x, los valores de y calculados o estimados noserán iguales a los valores de y originales. Lo anterior se puede verificar.

    m= 0.11

    b= 3.78

    Cantidad de agua

  • 8/18/2019 Compendio de Estadística Bueno 2015

    63/66

    62

    Resulta fácil comprender que cuanto mayor sea el coeficiente de correlación, menoresserán las diferencias entre los valores originales y los calculados en la variable “y”

    El error estándar de estimación es la medida que se toma verticalmente, arriba y

    debajo de la recta de regresión, y que permite definir dos rectas paralelas, dentro de las

    cuales se encuentr an el 68% de los puntos de las observaciones. “Es como la

    desviación que tienen los valores estimados tomando la recta de regresión como valor

    medio.”  

    Se puede decir que en una gráfica el punto es el centro de gravedad.

    8.23 FÓRMULA DEL ERROR ESTÁNDAR DE ESTIMACIÓN. 

    Si queremos conocer el grado de dispersión que tienen dichas diferencias, podemoshacerlo a través de la medida denominada error estándar de estimación que se calculade la manera siguiente:

    .

  • 8/18/2019 Compendio de Estadística Bueno 2015

    64/66

    63

    8.24 CALCULO DEL ERROR ESTÁNDAR DE ESTIMACIÓN.

    Para calcular el error estándar de estimación en el problema que nos ocupa,

    requerimos la tabla siguiente:

    12 5.27 y=.11(12)+3.78=5.10 0.17 0.0218 5.68 y=.11(18)+3.78=5.76 -0.08 0.0024 6.25 y=.11(24)+3.78=6.42 -0.17 0.0230 7.2 y=.11(30)+3.78=7.08 0.12 0.01

    36 8.02 y=.11(36)+3.78=7.74 0.28 0.0742 8.71 y=.11(42)+3.78=8.40 0.31 0.0944 8.42 y=.11(44)+3.78=8.62 -0.20 0.04

    ∑=0.25 

  • 8/18/2019 Compendio de Estadística Bueno 2015

    65/66

    64

    8.25 REPRESENTACIÓN GRÁFICA DEL ERROR ESTÁNDAR DE ESTIMACIÓN.

    La interpretación del error estándar de estimación se ve claramente en la gráficasiguiente.

    El error estándar de estimación es la medida que se toma verticalmente, arriba y

    debajo de la recta de regresión, y que permite definir dos rectas paralelas, dentro de las

    cuales se encuentran el 68% de los puntos de las observaciones. 

    En resumen, diremos que al estar relacionadas dos variables podemos calcular elgrado de dependencia entre ellas a través del coeficiente de correlación. Si elcoeficiente nos da un resultado aceptable, se pueden calcular los parámetros de larecta de regresión.  Al utilizar la recta de regresión, los valores estimados no soniguales a los valores originales, por lo cual calculamos el error estándar deestimación. Este valor es como la desviación que tienen los valores estimadostomando la recta de regresión como valor medio.

    e. e. e

  • 8/18/2019 Compendio de Estadística Bueno 2015

    66/66

    65

    BIBLIOGRAFÍA:

    MURRIA R. SPIEGEL. ESTADÍSTICA., ED. Mc GRAW-HILL., MÉXICO 2000.

    NAPOLEÓN LABASTIDA LÓPEZ. ESTADÍSTICA I. INSTITUTO POLITÉCNICO NACIONAL. MÉXICO1991.