lecturas unid estimación, tamaño y regresion 2016

Upload: jorge-alejandro-hdz-hdz

Post on 07-Jul-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    1/23

     Estimación puntual

    Estimación puntual. El valor, calculado a partir de la información de muestreo, que

    se emplea para estimar el parámetro de población.

    La media muestral, , es una estimación puntual de la media poblacional, ,.  P es una estimación puntual de  p  y así mismo la desviación estándar de la

    muestra S es una estimación puntual de la desviación estándar de la población σ.

    Supóngase que una empresa desea calcular la edad promedio de compradores de

    equipos estéreo. Se selecciona una muestra aleatoria de ! adquirientes recientes,

    se determina la edad de cada uno y se calcula la edad media de los seleccionados.

    El valor medio de esta muestra es una estimación puntual de la media poblacional. 

    Sin embargo, un valor estimado puntual representa sólo una parte de la historia. Al tiempoque se espera que la estimación puntual se acerque al parámetro de la población,quisiémos medir que tan cerca se encuentra. Un intervalo de confianza cumple con éstepropósito."ntervalo de confian#a para una proporción de la población.Una estimación puntual para una proporción poblacional se obtiene dividiendo el nmerode é!itos en la muestra, entre el nmero total de muestreado.

    E$emplo%

    Supóngase que &!! de las '!! personas muestreadas afirman que prefieren un

    nuevo refresco que probaron, en comparación con el que consumen regularmente.

    La me$or estimación de la proporción de la población que está a favor de la nueva

    bebida es !.(, o sea () que se obtiene dividiendo &!!*'!!. +bservase que una

    proporción se basa en un conteo del nmero de é-itos con relación del nmero

    total muestreado.

    /ómo se estima el intervalo de confian#a para una proporción de población0

    1onde σ p  es el error estándar de la proporción.

     

    Intervalo de confianza utilizando p ± zσ pUna proporción de la población

    Error estándar de la σ p = p ( 1-p )  proporción muestral n

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    2/23

    Por tanto, el intervalo de confian#a se establece mediante%

     1onde%

      P 2 es la proporción muestral.

    3 2 es el valor de # del grado de confian#a seleccionado.

    n 2 es el tama4o de la muestra.

    E$emplo

    Suponga que &5!! de (!!! traba$adores sindicali#ados que se muestrean di$eron

    que planean poner a votación una propuesta para unirse a una federación. Si se

    utili#a un nivel de confian#a de !.6 /uál es la estimación de intervalo para la

    proporción poblacional 7 que conclusión se llegaría con base en el intervalo de

    confian#a0

    Solución%

    8tili#ando la formula anterior , el intervalo se calcula como sigue%

    p9# p :&;p< 2 !.=!9&.65 !.=!:&;!.=!<

    n ( !!!

      2 !.=!9&.65>!.!!!!=

      2 !.?=( y !.=&=

      !.?=( @ P@!.=&=

    Los límites de confian#a ?=.( y =&.=)A supóngase que por lo menos ?) de los

    miembros del sindicato deben aprobar la fusión. /on base en los resultados de la

    muestra, cuando votan todos los traba$adores sindicali#ados, la propuesta

    probablemente será aceptada debido a que !.? está por deba$o del intervalo !.?=(

    y !.=&=

     

    Intervalo de confianza para

    una proporción muestral  p ± z p - (1 - p)  n

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    3/23

     

    Bema" Estimación por intervalos.

    Estimación por intervalo de confianza 8na gama de valores obtenidos a partir de

    datos de muestreo, de modo que el parámetro ocurre dentro de esa variedad a una

    probabilidad específica. La probabilidad específica en cuestión se denomina nivel

    de confian#a.

    E$emplo

    El gerente de puede decidir que la media poblacional está en algn sitio entre v CD

    y CD=. Bal intervalo con frecuencia va acompa4ado de una afirmación sobre el nivel

    de confian#a que se da en su e-actitud. Por tanto se llama intervalo de confian#a

    :"./

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    4/23

    de 6.) de todas las medias muestrales. Por tanto, al comen#ar con cualquier 

    media muestral, si se pasa de dos errores estándar por encima de dica media y

    dos por deba$o de ella, se puede tener un 6.) de confian#a en que el intervalo

    resultante contenga la media poblacional desconocida.

     

    La información desarrollada acerca de la forma de una distribución de muestreo de

    medias muestrales, lo cual significa una distribución de muestreo de , permite

    locali#ar un intervalo que contenga una probabilidad específica de incluir a la media

    de la población, G. Para muestras ra#onablemente mayores, se puede utili#ar el

    teorema del límite central y afirmar lo siguiente.

    &. 8n 6) de las medias muestrales seleccionadas de una población estará

    dentro de &.65 desviaciones estándares respecto de la media poblacional,G.

    La desviación estándar mencionada aquí es la desviación estándar de la

    distribución de muestreo de medias muéstrales. Los intervalos calculados de ésta

    manera se denominan el intervalo de confianza de 95%/ómo se obtiene el valor 

    de &.650 El 6) se refiere al porcenta$e de tiempo del intervalo construido

    similarmente que incluye el parámetro que se estima. Por e$emplo, el 6) se refiere

    al 6) central de las observaciones. Por tanto, el ) restante se divide por igual

    entre los dos e-tremos. Héase el diagrama siguiente%

      9!"

     (#)!

      $s  -# )! * + - )!

     %I&1  $1  %'&1

    1! !

    1!* !*

    1!# !#

      -1!9+ 1!9+ Escala de z

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    5/23

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    6/23

    embargo, el tama4o de la muestra también afecta al error estándar. 7l aumentar el

    tama4o de la muestra, el error estándar disminuye, indicando esto que ay menor 

    variabilidad en distribución de las medias muestrales. Esta conclusión es lógica, ya

    que una estimación reali#ada de una muestra grande debe ser más precisa que un

    cálculo eco a partir de una muestra peque4a./uando el tama4o de la muestra, n, es al menos igual a D!, generalmente se acepta

    que el teorema de límite central asegurará una distribución normal de las medias

    muestrales. Esta es una consideración importante. Si las medias muestrales se

    distribuyen en forma normal, en los cálculos se puede utili#ar la distribución

    estándar normal, esto es, #.

    Los intervalos de confian#a de 6) y de 66) se calculan como sigue, cuando n D!

     

    +tros niveles de confian#a pueden ser empleados. Para estos casos el valor #

    cambia correspondientemente. En general, un intervalo de confian#a para la media

    se calcula por%

    1onde # es el nivel de confian#a.

    E$emplo%

    En un e-perimento se trata de seleccionar una muestra aleatoria de (5 gerentes de

    nivel medio. 8n elemento de interés es el ingreso anual. La media muestral vale C'

    '(! :dólares< y la desviación estándar en la muestra, es C( !!./uál es el intervalo de confian#a de 6) para la media de la población

    :redondeando a los C&! más cercano

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    7/23

     M 9&.65 s 2 C' '(!9&.65 C( !!

    > n > (5

      2 C' '(!9(&.&(

      2 C' &5=.=? y C' 5?&.&(

    Estos puntos e-tremos se redondean frecuentemente y, en este caso, seregistrarían como C' &?! y C' 5?!.

      '&?! @ N @' 5?!

     Bema" 1eterminación del tama4o de la muestra.

    8na de las preocupaciones más comunes cuando se dise4a un estudio estadístico

    es% O/uántos elementos deben incluirse en la muestra0 Si ésta es demasiado

    grande, se derroca intilmente dinero en la recolección de datos. 1e forma

    seme$ante, si la muestra es demasiado peque4a, las conclusiones resultantespodrían ser incorrectas. El tama4o correcto de la muestra depende de tres factores%

    &. El nivel de confian#a deseado.

    (. El má-imo error permisible por el investigador.

    D. La variación en la población que se estudia.

    8sted como investigador, selecciona el nivel de confian#a. /omo se observó en la

    sección anterior, los niveles de 6) y de 66) son los que se eligen con mayor 

    frecuencia. 8n nivel de confian#a de 6) corresponde a un valor # de 9&.65, y uno

    de 66) corresponde a un valor # de 9 (.=. Cuanto más alto sea el nivel de

    confianza, tanto mayor será el tamaño de la muestra.

    El error má-imo permisible, denotado como E, es la cantidad que se suma y resta

    de la media muestral para determinar los puntos e-tremos del intervalo de

    confian#a. Es la cantidad de error que el investigador está dispuesto a tolerar.

    7simismo, corresponde a la mitad de la ancura del intervalo de confian#a

    correspondiente. Un pequeño error admisile requerirá una muestra !rande, y un

    error !rande de esa clase aceptará el uso de una muestra menor.

    El tercer factor al determinar el tama4o de una muestra es la desviación estándar dela polación. Si "sta #ltima está dispersa ampliamente, se requiere una muestra

    !rande. $or otra parte, si la polación está concentrada es &omo!"nea', el tamaño

    requerido de la muestra será menor. Sin embargo, es posible que sea necesario

    encontrar una estimación para la desviación estándar poblacional. 7 continuación

    se e-presan tres indicaciones%

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    8/23

    8tilice el enfoque del estudio de comparailidad   cuando ay un estimado de la

    dispersión disponible segn otro estudio. Supóngase que se desea estimar el

    nmero de oras de traba$o a la semana por traba$ares determinados. ui#ás la

    información procedente de ciertas agencias estatales o federales, que regularmente

    toman muestras de la fuer#a laboral, podría ser til para acer un cálculo de ladesviación estándar. Si se considera que una desviación estándar observada en un

    análisis anterior es confiable. Se puede usar en el estudio actual como ayuda para

    obtener un tama4o apro-imado de la muestra.

    Si no está disponible alguna estimación de un estudio anterior, puede ser apropiado

    emplear una apro(imación  asada en un intervalo de variación. Para aplicar este

    enfoque se necesita conocer o tener una estimación de los valores mas grandes y

    los mas peque4os en la población. Iecuérdese que se describió la regla empíricaA

    que se podría esperar que casi todas las observaciones estuvieran entre 9Ddesviaciones estándares respecto de la media, dado que la distribución fuese

    apro-imadamente acampanada, es decir, normal. Por tanto, la distancia entre el

    valor más grande y el valor más peque4o, es 5K. Se podría estimar la desviación

    estándar como un se-to de la amplitud de variación. Por e$emplo, supóngase que la

    directora de operaciones de un banco desea una estimación del nmero de retiros

    que estudiantes de universidad acen al mes. ue la distribución se apro-ima a la

    normal, que el nmero mínimo de documentos presentados es ( por mes, y que el

    má-imo es !.El intervalo de variación de la cantidad de retiros mensuales es '=,obtenido por !;(. Entonces, la estimación de la desviación estándar sería = retiros

    por mes, de '=*5.

    El tercer enfoque para evaluar la desviación estándar es reali#ar un estudio piloto.

    Este es el método mas comnmente utili#ado. Supóngase que se desea obtener una

    estimación del nmero de oras de traba$o a la semana de estudiantes inscritos en

    la Escuela de 7dministración de la 8niversidad de Be-as. Para probar la valide# del

    cuestionario, se aplica en una peque4a muestra de alumnos. 7 partir de ésta, se

    calcula la desviación estándar del nmero de oras de labor, y se utili#a éste paradeterminar el tama4o adecuado de la muestra.

    Puede e-presarse la interacción entre esto tres factores y el tama4o de la muestra

    con la fórmula que sigue%

     

    E z s  . n

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    9/23

     

    1espe$ando n en esta ecuación, se tiene el tama4o requerido de la muestra.

    1onde%

    n es el tama4o de muestra.

    # es el valor normal estándar correspondiente al nivel de confian#a deseado.

    s es un estimado de la desviación estándar de la población.

    E es el má-imo error permisible.El resultado de éste calculo no siempre es un nmero entero, por lo que la práctica

    usual es redondear cualquier nmero fraccionario. Por e$emplo, (!&.(( se redondea

    a (!(.

    E$emplo

    8n estudiante de administración pblica desea determinar el ingreso medio de los

    miembros de conce$os urbanos. El error al estimar la media es menor que

    C&!!:dólares

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    10/23

    El procedimiento que se acaba de describir se adapta para determinar el tama4o de

    la nuestra para una proporción. Fuevamente, se necesita especificar tres

    conceptos%

    &. El nivel de confian#a deseado, generalmente 6), o bien 66) .

    (. El margen de error que se requiere en la proporción de la población.D. 8n estimado de la proporción poblacional.

    La formula para determinar el tama4o de la nuestra de una proporción es%

    Es posible utili#ar un cálculo de si se encuentra disponible a partir de un estudio

    piloto o alguna otra fuente. 1e otra manera, se utili#a !.!, porque el término  p:&; p<nunca puede ser mayor que cuando p 2 !.!. Por e$emplo, si p 2 !.D!, entonces p:&;

     p< 2 !.D!:& ; !.D!< 2 !.(&, pero cuando p 2 !.!,  p:&; p< 2 !.!:& ; !.!< 2 !.(.

    E$emplo

    El estudio en el e$emplo anterior también estima la proporción de ciudades que

    cuentan con cobradores privados. El estudiante quiere que el cálculo se alle

    dentro de !.&! de la proporción de la población, el nivel deseado de confian#a es de

    6!), y no ay alguna estimación disponible para la proporción de la población.

    /uál es el tama4o requerido de la muestra0Solución

    El valor estimado de la proporción poblacional se encuentra dentro de !.&!, por lo

    tanto E 2 !.&!. El nivel deseado de confian#a es !.6!, lo cual corresponde a un valor 

    # de &.5. Ra que no e-iste ningn cálculo de la proporción de población, se utili#ará

    !.!. El tama4o requerido de la muestra es%

      n 2 :!.!

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    11/23

     Bema" 0#nimos cuadrados. 1esarrollo"

    %a regresión 2 la correlación son dos técnicas estrechamente relacionadas quecomprenden una forma de estimación. %a diferencia entre estas técnicas 2 el tipo deestimación estudiado anteriormente radica en que las técnicas anteriores se utilizaronpara evaluar un parámetro de población nica En forma más especifica, él análisis decorrelación 2 regresión comprende el análisis de los datos muéstrales para saber si 2como se relacionan entre s# dos o más variable de una población.%os datos necesarios para el análisis de regresión 2 correlación provienen deobservaciones de variables relacionadas. En el caso de un problema de dos variables,esto significa que cada observación proporciona dos valores, uno para cada variable. 3or

    e4emplo, un estudio que comprenda caracter#sticas f#sicas puede interesarse por la edad 2la estatura de cada individuo del mismo. %as dos variables de interés, 5 la edad 2 laestatura de cada persona 6 ser#an las relacionadas. En el caso de un problema de tresvariables, cada observación proporciona tres valores. 3or e4emplo, además de la edad 2la estatura de cada persona tal vez desear#amos incluir en el análisis, el peso de lamisma.

    EL MÉTODO DE MÍNIMOS CUADRADOS:7eneralmente, más de una curva de un tipo dado parece a4ustar un con4unto de datos.3ara evitar el 4uicio individual en la construcción de rectas, parábolas, u otras curvas de

    apro!imación, es necesario obtener una definición de la 8 me4or recta de a4uste 8, 8me4orparábola de a4uste9.3ara motivar una posible definición considérese la figura.:.; en la cuál los puntos dedatos son $!;, 2;'...,$!n, 2n'. 3ara un valor dado de !, por e4emplo !;, habrá una diferenciaentre el valor de 2;, 2 el valor correspondiente de la curva &. 1enotamos ésta diferenciapor d;, que algunas veces se le conoce como desviación, error o residuo 2 puede serpositivo, negativo o cero. Análogamente, correspondiendo a los valores !,...,!n obtenemoslas desviaciones d, ....,dn.

     

    5

      dn 6  6  6(,1751)  6 6 6  d1 6b(,#75#)  d# 

    ,

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    12/23

      Fig. 4.1

    Una medida de la 8bondad del a4uste 8 de la curva & que al con4unto de datos lasuministra la cantidad d; - d-.....-dn. Si la suma es peque

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    13/23

      a = ∑y – b ∑x

      n

    Es posible utilizar el método de m#nimos cuadrados para obtener una recta, en el caso del=ilometra4e 2 el precio de venta. A partir de las ecuaciones anteriores, es evidente que,

    para determinar la ecuación lineal primero se deberán calcular los valores de ∑!, ∑2,∑! 2 ∑!2, los cuales se determinan a partir de los datos de la muestra. Una cantidadadicional, ∑2, también deberá calcularse para usos posteriores. &abe observar que n +;: partes de observaciones. %os valores respectivos se muestran en la tabla :.;

    IV.1.1 Tabla 4.1. Cálculos para los datos

    bs!r"aci#n $!corrido %r!cio "!nta

    I x y xy x2   y2

    1 4& ' 1&&&.&& 4&&&& 1&& 1&&&&&&

    2 *& 1+&&.&& 4+&&& ,&& 22+&&&&* *& 12&&.&& *&&& ,&& 144&&&&

    4 2+ 1-&&.&& 4+&&& 2+ *24&&&&

    + +& -&&.&& 4&&&& 2+&& 4&&&&

    & 1&&&.&& &&&& *&& 1&&&&&&

    + +&&.&& *2+&& 422+ 2+&&&&

    - 1& *&&&.&& *&&&& 1&& ,&&&&&&

    , 1+ 2+&&.&& *+&& 22+ 2+&&&&

    1& 2& 2&&&.&& 4&&&& 4&& 4&&&&&&

    11 ++ -&&.&& 44&&& *&2+ 4&&&&

    12 4& 1+&&.&& &&&& 1&& 22+&&&&1* *+ 2&&&.&& &&&& 122+ 4&&&&&&

    14 *& 2&&&.&& &&&& ,&& 4&&&&&&

    ∑x = +&+ ∑y = 21&& ∑xy= 4&&&& ∑x2= 21-2+ ∑y2 = *,,&&&&

    1e dicha tabla se obtienen"

    b + ;:$>:????' 6 $@?@' $;>??' + B>???? 6 ;?B????  ;:$;@' 6$@?@' C?@@@? 5 @@?@

      + 5;B:??? + 5C.@>  @?@@

    a + ∑2 6b$∑!' + ;>?? 6 $5C.@>' $@?@' + :?BDB.: + BC:  n ;: ;:la ecuación resultante de regresión, " # a$%&' es entonces"

      yc = 2,*4 – *-.+x

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    14/23

    Bema% Estimación mediante la línea de regresión simple.1esarrollo" ESTIMACI(N MEDIANTE LA LÍNEA DE RE)RESI(N SIM*LE 

    %a regresión lineal simple comprende el intento de desarrollar una l#nea recta o ecuaciónmatemáticas lineal que describa la relación entre dos variables.%as ecuaciones de regresión pueden ser utilizadas de diversas formas. Se emplean ensituaciones en las que dos variables miden apro!imadamente lo mismo, pero en las queuna variable es relativamente costosa o, por el contrario, es poco interesante traba4ar conella, mientras que con la otra variable no ocurre lo mismo. 3or e4emplo, la resistencia 2

    dureza de un metal pueden estar relacionadas, de tal manera que si se conoce la durezadel metal, se puede estimar fácilmente su resistencia. Si al probar la resistencia sedestru2e el metal, 2 no sucede lo mismo en la prueba para la dureza, una personainteresada en estimar la resistencia, obviamente podr#a preferir basarse en la prueba de ladureza para estimar la resistencia. %a finalidad de una ecuación de regresión ser#aestimar los valores de una variable con base en los valores conocidos de la otra.tra forma de emplear las ecuaciones de regresión es para e!plicar los valores de unavariable en términos de la otra. Es decir, se puede intuir una relación de causa 2 efectoentre dos variables. 3or e4emplo, una economista puede intentar e!plicarse los cambios

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    15/23

    en la demanda de automóviles usados, en términos del nivel de desempleo. Un agricultorpuede creer que la cantidad de fertilizantes que utilizó influ2ó en la cosecha lograda. %avelocidad de un automóvil podr#a ser, un factor para determinar la distancia de frenado.Sin embargo, se deberá observar que, la lógica de una relación causal, debe provenir deteor#as e!ternas al campo de la estad#stica. El análisis de regresión nicamente indicaque relación matemática podr#a haber, de e!istir una. En otras palabras, ni con la

    regresión ni con la correlación se puede establecer si una variable tiende a 8causar9ciertos valores de otra variable.Un tercer uso de la ecuación de regresión es para predecir los valores futuros de unavariable. 3or e4emplo, a menudo se llevan a cabo pruebas de selección para posiblesempleados o estudiantes para predecir la potencialidad de tener é!ito, en tanto en laescuela como un empleo. Supuestamente e!iste una relación matemática entre lacalificación obtenida en la prueba 2 el potencial futuro.

     Aunque estas podr#an asumir una gran variedad de formas, muestra e!plicación selimitará a ecuaciones lineales. Esta ltima, o sea aquellas cu2as gráficas es una l#nearecta, son importantes porque se apro!iman estrechamente a muchas relaciones delmundo real 2 además porque es relativamente fácil traba4ar con ellas e interpretarlas.tras formas de análisis de regresión, tales como la regresión mltiple $más de dos

    variables' 2 la regresión curvil#nea$para relaciones de forma no lineal' comprendene!tensiones de los mismos conceptos que se utilizan en el regresión lineal simple.1os caracter#sticas importantes de una ecuación lineal son" ;' la pendiente de la recta 2' la localización de la recta en algn punto. Una ecuación lineal tiene la forma"

    2 + a - b!

    En la que a 2 b son valores que se determinan a partir de los datos de la muestraF a indicala altura de la recta en ! + ?, 2 b se

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    16/23

    cambio de una unidad en !, habrá en 2 un cambio correspondiente de tres unidades.&omo se muestra en la tabla que sigue, la ecuación se puede utilizar a fin de determinarvalores de 2 para diversos valores de !. Este ltimo método $es decir, sustituir valores de! en la ecuación 2 despe4ar 2' generalmente es preferible a leer valores en la gráfica, 2aque permite un grado de precisión ma2or que el que es posible obtener al utilizar unagráfica ordinaria.

    2

    +

    2

    &

    1

    +

    1

    &

    +

    & 1 2 * 4 + - , 1&

    Sin embargo, estas representaciones son importantes, debido a que crean una imagenmental de la relación. As# mismo, en la etapa inicial del análisis de datos puede ser til

    para decidir si una relación lineal es apropiada.2 + @-C!Valor d! x Valor d! calculado d! y

    2 +/*(2) = 11

    *.1 +/*(*.1) = 14.*

    .2 +/*(.2) = 2.

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    17/23

    1ecisión acerca de un tipo de relación.

    Es importante darse cuenta de que no en todos los casos se puede obtener unaapro!imación mediante una ecuación lineal. 1ebido a ello, suele ser necesario realizar untraba4o preliminar a fin de determinar si un modelo lineal será el adecuado. Elprocedimiento más simple es graficar los datos 2 determinar por e!amen si parece e!istiruna relación lineal. E!amine las gráficas de la Jig. :.: 2 observe que los puntos en $b' 2en $c' parece seguir un alineamiento.&uando los datos no se pueden apro!imar con un modelo, las alternativas son buscar unmodelo no lineal adecuado o bien, cambiar los datos a la forma lineal. 3or e4emplo, si seconvierten una o ambas escalas en logar#tmicas pueden ligarse a un modelo lineal. Estoprobablemente producir#a una recta en el eso de la Jig. :.: $a'

    0

      0 0 0

      0 0 0 0

    0

     0

      000 0

      00

      0 0

      0

      0

      0

    0

    0 0

      0 0

      0 0

      0

    1EKEL0HMA&HNM 1E %A E&UA&HNM 0AKE0OKH&A.&oncentremos nuestra atención en la forma de obtener la ecuación de la recta que me4ordescriba un con4unto de observaciones. Supóngase como un e4emplo que se quieredeterminar si e!iste relación entre el =ilometra4e de un automóvil usado 2 su precio deventa.

    1+

     

    1&

    0 0 0

    0

    0 0

    0 0

    0

    0 0

    0

    0 0

    0

    0 0 0

    & 0

    & 1&& 2&& *&& 4&& +&&

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    18/23

    12

    1&

    -

    0

    0

    0 0 0

    4 0 0 0 0 0

    2 0

    & 1 2 * 4

    Es decir, se indaga si el precio depende del =ilometra4e del automóvil. En termino deregresión el =ilometra4e se designar#a como la variable independiente o e!plicativa, 2 elprecio de venta como la Pariable dependiente o 8e!plicada9. Es tradicional utilizar els#mbolo ! para representar los valores de la variable independiente, el s#mbolo 2 paravalores de la variable dependiente.

      n la r!gr!si#n los "alor!s d! y son pr!dic3os a partir d! "alor!s d! x dados o conocidos. la

    "ariabl! y r!cib! !l nobr! d! "ariabl! d!p!ndi!nt! y la "ariabl! x !l d! "ariabl! ind!p!ndi!nt!.

    .

     Bema" Análisis de correlación. 1esarrollo"

     Análisis de correlación .&on4unto de técnicas estad#sticas empleado para medir laintensidad de la asociación entre dos variables.El principal ob4etivo del análisis de correlación consiste en determinar que tan intensa esla relación entre dos variables. Mormalmente, el primer paso es mostrar los datos en undiagrama de dispersión.

    1iagrama de dispersión 7ráfica que representa la relación entre dos variables.

    U ejem+lo mostrar, c-mo se a+l!ca el c!tado d!a.rama/

    %a empresa &opier Sales of América, Hnc., vende copiadoras a negociacionesgrandes, medianas 2 peque

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    19/23

    pró!ima 4unta de ventas asistirán los representantes de todo el pa#s. A ella legustar#a hacerles notar la importancia de hacer llamadas e!tra cada d#a. 1ecidereunir alguna información acerca de la relación entre el nmero de llamadas 2 elnmero de productos vendidos. Seleccionó al azar una muestra de ;?representantes 2 determino el nmero de llamadas que hicieron el ltimo mes, 2 el

    de copiadoras que vendieron. %a información muestral se tiene en tabla:..Kransfiera éstos datos a un diagrama de dispersión R ué observacionespueden hacer usted acerca de la relación entre el nmero de llamadas 2 lacantidad de copiadoras vendida

    Tabla 4.2. 5laadas y copiadoras "!ndidas por 1& r!pr!s!ntant!s.

    $!pr!s!ntant!s d! "!ntas 6o. d! llaadas 6o. 7! copiadoras "!ndidas

    To 8!ll!r 2& *&

    9!:: ;all 4& &

    !lc3 1& *&

    Carlos $a?r!@ 1& 4&

    $ic3 6il!s 2& 4&

    5uis 8i!l 2& +&

    AarB $!ynolds 2& *&

    oni 9on!s *& &

    Soluc!-/ En base en los datos presentados en la tabla :5, la se

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    20/23

    unidades

    llamadas 

    1iagrama @5 1iagrama de dispersión que muestra las llamadas de ventas 2las copias vendidas.

    El diagrama de dispersión indica que los representantes de ventas que hacen másllamadas telefónicas, tienden a vender más copiadoras. Es razonable que la se

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    21/23

      r 2 ;&.!! Iecta con pendiente positiva  - -

      1iagrama @5C 1iagrama de dispersión que ilustra una correlación  negativa perfecta 2 una correlación positiva perfecta.

    El siguiente cuadro resume la intensidad 2 la dirección del coeficiente decorrelación.

    &oeficiente de correlación 0edida de la intensidad de la relación lineal entre dosvariables.3ara determinar el valor numérico del coeficiente de correlación, se utiliza la siguientee!presión la fórmula para r es "

    n: T-y< U : T- < :Ty </oeficiente de correlación r 2

    / X n $ Y! ' 6 $Y! ' Z X n $Y2 ' 5 $Y2 ' Z

    1onde"

      n nmero de pares de observaciones.  YV suma de los valores de la variable V.  YG suma de los valores de la variable G.

    Corr!laci#nCorr!laci#n

     e:ativa in:una ositivaerfecta &orrelación erfecta!

    &orrelación &orrelación &orrelación &orrelación &orrelacion &orrelacion e:ativa e:ativa ne:ativa ositiva ositiva ositiva

      Intensa! ;oderada d

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    22/23

      $∑!' suma de los valores de V elevados al cuadrado.  $∑!'  cuadrado de la suma de los valores de V. 

    $ ∑2' suma de los valores de G elevados al cuadrado.  $ ∑2'  cuadrado de la suma de los valores de G.  YVG suma de los productos de V 2 G.

    Ejemplo$!:iras! al !D!plo ant!rior dond! s! d!sarroll# un diagraa d! disp!rsi#n Eu! ilustra la

    r!laci#n !ntr! !l n!ro d! t!l!:on!as a cli!nt!s y la cantidad d! copiadoras "!ndidas.

    7!t!rin! !l co!:ici!nt! d! corr!laci#n.

     

    Tabla 4.2. 5laadas y copiadoras "!ndidas por 1& r!pr!s!ntant!s.

    $!pr!s!ntant!s d!

    "!ntas

    5laadas

    (x)

      copiadoras

    "!ndidas (y)

      x2   y2   xy

    To 8!ll!r 2& *& 4 && , && &&

    9!:: ;all 4& & 1 && * && 2 4&&

    !lc3 1& *& 1 && , && * &&

    Carlos $a?r!@ 1& 4& 1 && 1 && 4 &&

    $ic3 6il!s 2& 4& 4 && 1 && - &&

    5uis 8i!l 2& +& 4 && 2 +&& 1 &&&

    AarB $!ynolds 2& *& 4 && , && &&

    oni 9on!s *& & , && 4 ,&& 2 1&&

    Total 22& 4+& + && 22 1&& 1& -&&

    El coeficiente de correlación es !.?6, que se evala por medio de la fórmula%

    r 2 n V MR U V - V R 

    / Wn $[!< U $V!'(X Wn $2' 6 $[2'X

      &! :&! =!!< U :((!< :'!<  2

    . G1& (+ &&) (22&)2H G1&(22 1&&) (4+&)2 

    = &.+,

    C#o s! int!rpr!ta un corr!laci#n d! &.+,J %ri!roK !s positi"a as? Eu! s! "! Eu! !xist!

    una r!laci#n dir!cta !ntr! !l n!ro d! t!l!:on!as y !l n!ro d! copiadoras "!ndidas. sto

    con:ira !l ra@onai!nto basado !n !l grá:ico d! disp!rsi#n. l "alor d! &.+, !stá uy c!rca

  • 8/18/2019 Lecturas UNID Estimación, Tamaño y Regresion 2016

    23/23

    d! 1.&& as? Eu! s! concluy! Eu! la asociaci#n !s :u!rt!. %ara !xpr!sarlo d! otro odo un 2+L

    d! incr!!nto !n las llaadas probabl!!nt! conducirá a un 2+L d! au!nto !n las "!ntas.

    /oeficiente de determinación

    Una medida que tiene una aceptación más fácil de interpretar es el coeficiente dedeterminación. Se calcula elevando al cuadrado el coeficiente de correlación. 3ara el

    e4emplo, dicho coeficiente de determinación, r , vale ?.@D>, que proviene de $?.D@B'. Estaes una relación proporcional o porcenta4eF puede decirse que @D.>\ de la variación en elnmero de copiadoras vendidas se e!plica por la variación en el nmero de telefonemas.

    &oeficiente de determinación %a porción de la variación total en la variable G, que e!plicapor la variación en la variable independientes V.