2 repaso de estádistica descriptiva r

Post on 11-Dec-2015

222 Views

Category:

Documents

3 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Repaso de estadística descriptiva con R

Prof. Marcela Ríos

Instalación de R y R Studio

• Revisar los pasos en el siguiente link:

• http://blog.urcera.com/wordpress/?p=242

¿Cómo establecer el directorio de trabajo en RStudio?

¿Cómo establecer el directorio de trabajo en RStudio?

¿Cómo establecer el directorio de trabajo en RStudio?

¿Cómo establecer el directorio de trabajo en RStudio?

¿Cómo establecer el directorio de trabajo en RStudio?

Crear variable en R

• Crear la variable edad con c( )

• edad <-c(8,8,7,7,5,6,7,5,9,3,4,7,6)

Medidas de tendencia central

Medidas de tendencia central

• Moda: puntuación más frecuente de la distribución.

• Mediana: valor por debajo del cual queda el 50% de los puntajes (P50)

• Si la cantidad de puntajes es impar es el puntaje central.

• Si la cantidad de puntajes es par es el promedio de los dos puntajes centrales.

• Media: suma de los puntajes divididos entre la cantidad de puntajes.

moda

moda

Medidas de tendencia central en R

• Media

• Mediana

Medidas de posición

Medidas de posición

• Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.

• Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.

• Las medidas de posición son: cuartiles, deciles y percentiles.

Cuartiles

• Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales.

• Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.

• Q2 coincide con la mediana.

Deciles

• Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.

• Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.

• D5 coincide con la mediana.

Percentiles

• Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.

• Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.

• P50 coincide con la mediana.

Medidas de posición en R

• Cuartiles

Medidas de variabilidad

Medidas de dispersión o variabilidad

• Rango: la diferencia entre los puntajes más alto y más bajo en la distribución

• Desviación estándar: valor que nos permite saber cuán alejado está el puntaje en bruto de la media de su distribución.

• Varianza: cuadrado de la desviación estándar.

Medidas de dispersión en R

• Rango

• Desviación estándar

• Varianza

Asociación entre variables

Correlación

• Correlación producto-momento de Pearson: describe la fuerza de una asociación lineal entre dos variables numéricas.

• La relación puede representarse con mayor precisión con una línea recta.

• El coeficiente de correlación expresa la magnitud y la dirección de la relación de forma cuantitativa.

• Variabilidad de Y explicada por X.

Correlación en R

Práctica

• En R Studio y utilizando la base “Exam.Anxiety.dat”:

1. calcule las medidas de tendencia central y variabilidad de la variable “Anxiety”.

2. calcule el valor del tercer cuartil de la variable “Anxiety”.

3. calcule la correlación entre la variable “Anxiety” y “Exam”.

• Envíe los resultados al correo de la profesora.

top related