cuál es el propósito de la regresión lineal
DESCRIPTION
MatematicaTRANSCRIPT
UNIVERSIDAD DE CARABOBO.
FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES.
ESCUELA DE ADMINISTRACIÓN COMERCIAL Y
CONTADURIA PÚBLICA.
TRABAJO FINAL DE ESTADISTICA III.
BACHILLER: ZULEMA NAVAS C.I 12.250.923
CORINDA LODISE C.I
GILBERTO PARADA C.I 10.367.303
VALENCIA, MARZO DE 2002
PARTE I
¿Cuál es el propósito de la regresión lineal?
El propósito principal de la regresión lineal es para estudiar la relación entre el
promedio de una variable y los valores de una ó mas variables independientes de las
cuales depende.
¿Cómo se utiliza el modelo de la regresión lineal simple?
Consideremos una variable aleatoria respuesta (o dependiente) Y, que
supondremos relacionada con otra variable (no necesariamente aleatoria) que
llamaremos explicativa, predictora o independiente y que se denotará por X. A partir
de una muestra de n individuos para los que se dispone de los valores de ambas
variables, {(Xi,Yi),i = 1,...n}, se puede visualizar gráficamente la relación existente
entre ambas mediante un gráfico de dispersión, en el que los valores de la variable X
se disponen en el eje horizontal y los de Y en el vertical. El problema que subyace a
la metodología de la regresión lineal simple es el de encontrar una recta que ajuste a
la nube de puntos del diagrama así dibujado, y que pueda ser utilizada para predecir
los valores de Y a partir de los de X. La ecuación general de la recta de regresión será
entonces de la forma: Y = a + bX .
El problema radica en encontrar aquella recta que mejor ajuste a los datos.
Tradicionalmente se ha recurrido para ello al método de mínimos cuadrados, que
elige como recta de regresión a aquella que minimiza las distancias verticales de las
observaciones a la recta. Más concretamente, se pretende encontrar a y b tales que:
Resolviendo este problema mediante un sencillo cálculo de diferenciación, se
obtienen los estimadores mínimo cuadráticos de los coeficientes de la recta de
regresión:
¿Qué significa el error estándar de estimación?
El error estándar de estimación representa el porcentaje en el cual el resultado
a obtener difiere de los datos, posiciones, acciones, procesos y otros en la realidad, es
decir, el grado de equivocación de la respuesta obtenido en
cualquier estudio estadístico a realizar.
¿Cómo se aplican los conceptos de inferencia estadística a este análisis? ¿Por qué se
aplican?
Cuando se realiza una regresión lineal, se está infiriendo sobre un
experimento, proceso o acción que está afectada por las diversas variables que
intervienen en dichos actos. Por lo cual, el resultado obtenido se va a aplicar a la
generalidad del acto, el cual se somete a estudio. Se aplican para determinar como
actúan en un proceso determinado las variables que en ella intervienen, para de esta
manera, aplicar las correcciones a dicho experimento, proceso u acción que este
afectada por los actos de estos elementos que son capaces de alterar su normal
desenvolvimiento.
¿Cómo se realiza una estimación y Prueba de Hipótesis de la pendiente de la recta de
regresión?
Estimación de parámetros
Los parámetros de la recta de regresión, a y b, se calculan siguiendo el criterio de los
mínimos cuadrados, lo que lleva a los siguientes resultados:
siendo
y
las medias de ambas variables estadísticas.
La varianza residual es desconocida, siendo su estimador insesgado
Prueba de Hipótesis
La prueba de hipótesis entre las variables es más objetivo que la simple
observación del coeficiente de correlación r. Así se plantea comprobar si los datos
observados corroboran o no la hipótesis nula:
H0: "la variable explicativa X no influye en la respuesta Y".
frente a la alternativa:
H1: "la variable explicativa X influye linealmente en la respuesta Y".
Mediante el estadístico de contraste
que se distribuye como una tn-2 de Student, se puede contrastar la hipótesis nula H0 al
nivel de significación del 5%.
Caso
Se dispone de los datos de ocho anestesias de diferente duración, efectuadas
con un anestésico volátil y del tiempo en que se restablece la conciencia
suficiente como para contar hacia atrás desde un número determinado sin
error:
Duración
anestesia (min)
Duración
despertar (min)
150 13
127 16
160 21
210 20
250 16
130 13
60 12
55 14
Se intenta probar la hipótesis de que la duración del despertar no está influida
por la de la anestesia.
El coeficiente de correlación para esta muestra es de 0.562231, a medio
camino entre el 0 y el 1, no permitiendo dar una respuesta segura sobre el
contraste; en cambio, el estadístico A toma un valor de 1.66531, del que se
puede deducir que la hipótesis no puede rechazarse al nivel del 5%; en
conclusión, no hay indicios de que la duración del despertar esté linealmente
relacionada con el tiempo de duración de la anestesia. Si se hubiese rechazado
la hipótesis de independencia, se podrían ajustar los datos a la recta de
ecuación
y = 0.03 x + 11.62,
siendo x la duración de la anestesia e y la del despertar.
PARTE II
X Frecuencia Xi Xi . Fi5 9 1 7 7 841,0
10 14 10 12 120 576,015 19 37 17 629 361,020 24 36 22 792 196,025 29 13 27 351 81,030 34 2 32 64 16,035 39 1 37 37 1,0
100 2000 2072,0
Media = 36desviación estándar = 4,55