coeficientes de correlacion spearman y pearson

13
Republica Bolivariana de Venezuela Ministerio del Poder Popular Para la Educación Superior Instituto Universitario Politécnico “Santiago Mariño” Sede-Barcelona Escuela Ing. Industrial Profesor: Pedro Beltrán Realizado por: Kevin He C.I:26,009,278

Upload: kevin-vallenilla

Post on 22-Jan-2018

82 views

Category:

Education


4 download

TRANSCRIPT

Republica Bolivariana de Venezuela

Ministerio del Poder Popular Para la Educación Superior

Instituto Universitario Politécnico “Santiago Mariño”

Sede-Barcelona

Escuela Ing. Industrial

Profesor: Pedro Beltrán

Realizado por:

Kevin He

C.I:26,009,278

Coeficiente de correlación de Pearson

El Coeficiente de Correlación de Pearson es una medida de la relación lineal entre

dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de

Pearson es independiente de la escala de medida de las variables. De manera menos

formal, podemos definir el coeficiente de correlación de Pearson como un índice que

puede utilizarse para medir el grado de relación de dos variables siempre y cuando

ambas sean cuantitativas.

En el caso de que se esté estudiando dos variables aleatorias X y Y sobre

una población; el coeficiente de correlación de Pearson se simboliza con la letra

Px,y, siendo la expresión que nos permite calcularlo:

Donde:

es la covarianza de (X.Y)

es la desviación típica de la variable X

es la desviación típica de la variable Y

De manera análoga podemos calcular este coeficiente sobre un estadístico maestral,

denotado como a:

Usos del coeficiente de correlación de Pearson

• Permite predecir el valor de una variable dado un valor determinado de la otra

variable.

• Se trata de valorar la asociación entre dos variables cuantitativas estudiando el

método conocido como correlación.

• Dicho cálculo es el primer paso para determinar la relación entre las variables.

Consiste en la posibilidad de calcular su distribución muestra y así poder determinar

su error típico de estimación.

• Reporta un valor de correlación cercano a 0 como un indicador de que no hay

relación lineal entre 2 variables.

• Reporta un valor de correlación cercano a 1 como un indicador de que existe una

relación lineal positiva entre las 2 variables. Un valor mayor a cero que se acerque a 1

da como resultado una mayor correlación positiva entre la información.

Ventajas

El valor del coeficiente de correlación es independiente de cualquier unidad usada

para medir variables.

Mientras mas grande sea la muestra mas exacta será la estimación.

Desventajas

Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas.

Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo

y que la distribución de ambas sea semejante a la de la curva normal.

Usos de Enfoques de Pearson a Problemas Estadísticos

En la perspectiva de Pearson, para establecer el nivel de significación estadística habría

que atender al impacto de cada tipo de error en el objetivo del investigador, y a partir de

ahí se decidiría cuál de ellos es preferible minimizar.

En la perspectiva de Pearson, para establecer el nivel de significación estadística habría

que atender al impacto de cada tipo de error en el objetivo del investigador, y a partir de

ahí se decidiría cuál de ellos es preferible minimizar.

En la perspectiva de Pearson, para establecer el nivel de significación estadística habría

que atender al impacto de cada tipo de error en el objetivo del investigador, y a partir de

ahí se decidiría cuál de ellos es preferible minimizar.

Coeficiente de Correlación de Spearman

El Coeficiente de Correlación de Spearman, ρ (rho) es una medida de la correlación

(la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular

ρ, los datos son ordenados y reemplazados por su respectivo orden.

El estadístico ρ viene dado por la expresión:

Donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es

el número de parejas.

Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque

si éstos son pocos, se puede ignorar tal circunstancia.

Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación

a la distribución t de Student

La interpretación de coeficiente de Spearman es igual que la del coeficiente de

correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o

positivas respectivamente, 0 cero, significa no correlación pero no independencia.

La correlación estimada entre X e Y se halla calculando el coeficiente de correlación de

Pearson para el conjunto de rangos apareados.

La correlación de Spearman puede ser calculada con la fórmula de Pearson, si antes

hemos transformado las puntuaciones en rangos.

Usos del Coeficiente de correlación de Spearman

A partir de un conjunto de n puntuaciones, la formula que permite el calculo de la

correlación entre dos variables X e Y, medidas al menos en escala ordinal, es la

siguiente:

P=0 No hay correlación

p≠ 0 Hay correlación

Donde d es la distancia existente entre los puestos que ocupan las puntuaciones

correspondientes a un sujeto i cuando estas puntuaciones han sido ordenadas para

X y para Y.

Ventajas

No esta afectada por los cambios en las unidades de medida.

Al ser una técnica no parámetro, es libre de distribución probabilística.

Desventajas

Es recomendable usarlo cuando los datos presentan valores extremos, ya que dichos

valores afectan mucho el coeficiente de correlación de Pearson, o ante distribuciones

no normales.

r no debe ser utilizado para decir algo sobre la relación entre causa y efecto.

Propiedades Coeficiente de Correlación de Spearman

El Coeficiente de Correlación de Spearman se encuentra siempre comprendido entre

los valores -1 y 1. Es decir, -1 < rs < 1.

Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la

variable Y, el valor de rs es 1. Si ocupan valores opuestos, es decir; al primer sujeto

en X le corresponde el ultimo lugar en Y, al segundo en X le corresponde el penúltimo

en Y, etc. Entonces el valor de rs es -1.

Usos de Enfoques de Spearman a Problemas Estadísticos

Una generalización del coeficiente de Spearman es útil en la situación en la cual hay tres

o más condiciones, varios individuos son observados en cada una de ellas, y predecimos

que las observaciones tendrán un orden en particular. Por ejemplo, un conjunto de

individuos pueden tener tres oportunidades para intentar cierta tarea, y predecimos que

su habilidad mejorará de intento en intento.

El coeficiente de correlación de rangos de Spearman debe utilizarse para series de datos

en los que existan valores extremos, pues si calculamos la correlación de Pearson, los

resultados se verán afectados.

La interpretación del resultado del coeficiente de correlación de Spearman se encuentra

entre los valores de -1 y 1.

La significación estadística de un coeficiente debe tenerse en cuenta conjuntamente con

la relevancia clínica del fenómeno que se estudia.

Bibliografía

Correlación en Wikipedia (español): http://es.wikipedia.org/wiki/Correlaci%C3%B3n

Relación entre variables cuantitativas.

http://www.fisterra.com/mbe/investiga/var_cuantitativas/var_cuantitativas2.pdf

Correlation en Wikipedia (inglés).

http://personal.us.es/vararey/adatos2/correlacion.pdf.

https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pearson.