Download - Cueva López
-
7/22/2019 Cueva Lpez
1/36
-
7/22/2019 Cueva Lpez
2/36
2
1. INTRODUCCIN A R 3
2. ESTADSTICA DESCRIPTIVA 14
3. ESTADSTICA BIDIMENSIONAL 20
4. ANLISIS DESCRIPTIVO DE SERIES TEMPORALES 22
5. INFERENCIA ESTADSTICA 25
6. MODELOS DE REGRESIN LINEAL 33
7. BIBLIOGRAFA 36
-
7/22/2019 Cueva Lpez
3/36
3
Una vez realizado el proyecto de programas de prcticas, vamos a
empezar a desarrollar el contenido de este en cada uno de los
apartados propuestos.
Para ello, vamos a ir desarrollando los temas a travs de las
secciones de este documento.
1. Introduccin a REn este primer contenido del temario, vamos a ensear al alumno como
instalar R, as como empezar a manejar el programa.
Para empezar, indicaremos que, para obtener el programa que se va autilizar, introduciremos la direccin cran.r-project.org.
Esta es la pgina oficial donde est el programa y todos los paquetes
que, personas, universidades, ect van creando y colgando en la web
para facilitar el trabajo.
A continuacin, le daremos al hipervnculo Download for R
dirigindonos al hipervnculo que sea conveniente con el sistema
operativo de nuestro ordenador.
-
7/22/2019 Cueva Lpez
4/36
4
Ej.:
Mi sistema Operativo es Windows, por lo que pulsar:
Una vez estemos en dicha pgina, pulsaremos install R forthe first
time y seguiremos las instrucciones para instalar.
-
7/22/2019 Cueva Lpez
5/36
5
Ej.:
Si seguimos con el ejemplo anterior, pulsaremos:
Terminada la instalacindel programa, procederemos a mostrar el
programa.
Primero abrimos el programa R, obteniendo la siguiente pantalla:
-
7/22/2019 Cueva Lpez
6/36
6
Como se puede observar en la anterior imagen, existe una ventana
llamada R Console, donde escribiremos las ordenes y se mostrarn los
resultados. Arriba de la ventana, hay unos mens desplegables, con las
siguientes funciones:
a. Archivo:
En esta ventana tenemos las funciones de Interpretar cdigo
fuente R, que nos lee las rdenes implementadas en la consola y
muestra los resultados, Nuevo script nos abre un archivo donde
se puede escribir las ordenes y que se muestren las soluciones
en la consola. Esta funcin, nos permite modificar las rdenes
sin tener que volver a escribirlas o si existe algn error en
las rdenes, poder obtener los resultados sin necesidad de estar
interrumpido por el error. En Abrir script, podemos abrir
archivos de rdenes previamente redactados.Otra funcin importante es Cambiar dir.., donde podremos poner
la direccin donde R coger los datos, y as nos ahorraremos el
poner la direccin del ordenador donde estn al abrirlos.
-
7/22/2019 Cueva Lpez
7/36
7
b. Editar:
En esta ventana, estn las funciones caractersticas de dicho
men en otros programas.
c. Visualizar:
-
7/22/2019 Cueva Lpez
8/36
8
d. Misc:
e. Paquetes:
Este men es ms caracterstico de R. En l, podemos cargar
paquetes, previamente instalados en el programa, buscar los
paquetes para instalarlos o actualizarlos.
Tambin podemos instalarlos a partir de .zip previamente
descargados.
-
7/22/2019 Cueva Lpez
9/36
9
f. Ayuda:El ltimo men del programa est compuesto por:
Una vez presentado el programa, procedemos a explicar al alumno cmo
introducir los datos al programa.
-
7/22/2019 Cueva Lpez
10/36
10
Los datos los vamos a introducir de dos formas distintas.
Introducimos los datos mediante rdenes:Se realizar a partir de la siguiente orden:
Nombre_conjunto
-
7/22/2019 Cueva Lpez
11/36
-
7/22/2019 Cueva Lpez
12/36
12
Una vez cargado el paquete se abrir la siguiente ventana:
-
7/22/2019 Cueva Lpez
13/36
13
Finalmente, realizamos las siguientes acciones:
As, podemos introducir los datos a travs de R, con la opcin
Nuevo conjunto de datos o de Importar datos.
-
7/22/2019 Cueva Lpez
14/36
14
2. Estadstica DescriptivaPara el mdulo de estadstica descriptiva, se va a utilizar el paquete
ds.
Este mdulo lo cre Emmanuel Arnhold, y en l nos vamos a basar para
obtener la mayora de las medidas que se aprendern.
Por tanto, empezaremos introduciendo los datos de la forma que hemos
visto en la seccin anterior. Una vez introducidos los datos,
aplicaremos las siguientes rdenes:
Grfico de nube de puntosLa funcin que usaremos es:dplot data,xlab=variable x,ylab=variabley,position=1,colors=TRUE,type=o,mean=TRUE)Donde los argumentos que hemos usado son:
- data: es el nombre del conjunto de datos que hemosintroducido anteriormente en el programa
- xlab: es el ttulo del eje x.- ylab: es el ttulo del eje y.- position: es la posicin que queremos en que quede la leyenda
del grfico. Las posiciones que vienen dadas por el autor son
las siguientes: top=1, bottomright=2, bottom=3, bottomleft=4,
left=5, topleft=6, topright=7, right=8, center=9.
- colors: si intoducimos TRUE, las lneas aparecern en color ysi utilizamos la orden FALSE, las lneas saldrn de color
negro.
- type: es el tipo de punto.- mean: si queremos que aparezca el punto media utilizaremos
TRUE, si queremos que slo aparezca el dato original,
pondremos false.
-
7/22/2019 Cueva Lpez
15/36
15
Estadsticos descriptivos general:La orden que utilizaremos para esto es:
gds data)Dicha funcin nos devuelve la media, el mximo, el mnimo, la
mediana, la media + o la desviacin tpica, los cuantiles, el
nmero de datos, el rango, la varianza, la desviacin tpica, el
error cuadrtico medio, el coeficiente de variacin de skewness,
curtosis y el test de normalidad, mostrando el p-valor asociado
al test de normalidad de Shapiro-Wilks.
Ahora vamos a realizar un ejemplo de dicho paquete:
Los datos introducidos en el programa son:
-
7/22/2019 Cueva Lpez
16/36
16
Y al usar la orden gds(Datos), obtenemos los siguientes resultados:
-
7/22/2019 Cueva Lpez
17/36
17
Finalmente, vamos a realizar un grfico con las dos variables que
hemos introducido con nuestros datos.
-
7/22/2019 Cueva Lpez
18/36
18
Lo mismo que hemos realizado antes con el paquete ds, podemos
realizarlo a travs del paquete descargado en la seccin anterior,
RCMDR.
Realizando la siguiente operacin:
Una vez pulsado en Resmenes numricos realizamos la siguiente accin:
Y al darle a aceptar, aparecern los valores que hayamos sealizado en
esta ventana.
A continuacin, vamos a introducir otro paquete de R, el cual, no slo
nos servir para estaseccin, sino que lo utilizaremos ms adelante
para realizar algunos anlisis.
Este paquete se llama DescTools. Primero procederemos adescargarlo y una vez instalado, usaremos las siguientes funciones:
-
7/22/2019 Cueva Lpez
19/36
19
Media armnica:Para realizar la media armnica, utilizaremos la siguiente
orden:
Hmean x,na.rm=FALSE)Los argumentos que utilizaremos son:
x: Datos introducidos en R.
na.rm: Indica si existen valores lgicos en los datos que hemos
introducido.
Esta funcin nos devuelve el valor de la media armnica.
Media geomtrica:La media geomtrica tiene la siguiente orden:
Gmean x,na.rm=FALSE)Los argumentos que utilizaremos son:
x: Datos introducidos en R.
na.rm: Indica si existen valores lgicos en los datos que hemos
introducido.
Al final, la funcin nos devuelve el valor de la media
geomtrica.
-
7/22/2019 Cueva Lpez
20/36
20
3. Estadstica BidimensionalHay veces que nos interesa ver el comportamiento de las variables que
estn relacionados.
Este comportamiento se conoce, a travs de la covarianza, el
coeficiente de correlacin...
Para dicha finalidad, vamos a usar los siguientes paquetes:
- ds- stats ( puesta por defecto en el programa )
Para calcular la covarianza, vamos a programarlo nosotros mismo,
realizando el siguiente programa:
table
-
7/22/2019 Cueva Lpez
21/36
21
El paquete estadstico para calcular la correlacin es ds, en
concreto,la funcin que nos calcula la correlacin es:
Dscor data,method=1,option=1)Esta orden nos devolver el dato de la correlacin y el p-valor del
contraste de correlaciones asociado, pero en nuestro caso, slo nos
interesa el valor de la correlacin.
Si eligisemosel method=2, estaramos calculando la correlacin de
Spearman, de la forma anteriormente escrita, se obtiene la correlacin
de Pearson.
Ejemplo:
En este ejemplo, hemos introducido dos variables de datos, ponindolo
en formato tabla posteriormente.
Finalmente, aplicamos la orden y obtenemos el valor de la correlacin.
-
7/22/2019 Cueva Lpez
22/36
22
4.Anlisis Descriptivo de Series TemporalesEn dicha seccin, vamos a utilizar el paquete ya instalado en el
programa, por defecto, como es el paquete stats.
Dentro de este paquete, hay una funcin, llamada ts, en la que
podremos realizar la descomposicin de la tendencia a travs de las
Medias Mviles.
Por tanto, introduciremos las siguientes rdenes en el programa:
temp.ts=ts Datos,start=fecha,frequency=periodo)temp.tsplot temp.ts)tempdecomp.ts=decompose temp.ts)tempdecomp.tsHay que recalcar que, en nuestro fichero de datos, Datos, no
introduciremos las fechas de nuestra serie temporal, por ello, la
funcin ts, nos genera la la serie temporal.
Start nos permite incluir la fecha de inicio de nuestros datos, y as
no utilizar la cronologa puesta por defecto por el programa.Finalmente, en frecuency, marcaremos cual es la frecuencia de nuestros
datos, es decir, si los datos son mensuales, cuatrimestrales,
trimestrales,...
Una vez vistas las rdenes que hay que utilizar para realizar la
descomposicin, vamos a ver un ejemplo.
-
7/22/2019 Cueva Lpez
23/36
23
Ejemplo:
Introducimos datos en el programa.
Ahora introducimos la variable tiempo en nuestros datos,
Finalmente, aplicamos la descomposicin por medias mviles:
-
7/22/2019 Cueva Lpez
24/36
24
Tambin, podemos realizar un grfico de los datos que hemos introducido:
As, hemos obtenido la tendencia de la serie anteriormente
introducida.
-
7/22/2019 Cueva Lpez
25/36
25
5. Inferencia EstadsticaLos contrastes que vamos a realizar sern a travs de los siguientes
paquetes:
-
desctools ( ya instalado en secciones anteriores )- ds- n
Esta seccin la dividiremos en los siguientes apartados:
5.1. Intervalos de confianzaPara realizar intervalos de confianza para la media, utilizaremos el
paquete desctools, y usaremos la siguiente orden:
MeanCI x,trim=0,type=c classic,norm,basic,stud,perc,bca),conf.level=0.95,na.rm=FALSE,R=999)Donde tenemos los siguientes argumentos:
- x: vector de datos- trim: vector de datos- type: tipo de intervalo que se quieres- conf.level: nivel de confianza que se requiere- na.rm: existencia de valores perdidos- R:Nmero de repeticiones posibles.
Tambin, podemos realizar el intervalo de confianza para la diferencia
de medias, utilizando la siguiente orden:
MeanDiffCI x,y,type=c classic,norm,basic,stud,perc,bca),conf.level=0.95,na.rm=FALSE,R=999)Donde los argumentos son iguales que en la orden anterior.
Si ahora queremos realizar el intervalo de confianza para la varianza,
se utiliza la siguiente orden:
VarCI x,type=c classic,norm,basic,stud,perc,bca),conf.level=0.95,na.rm=FALSE,R=999)Con argumentos iguales a la orden de intervalo de confianza para la
media.
-
7/22/2019 Cueva Lpez
26/36
26
Hay que tener en cuenta que, en dichas rdenes, tambin aparecer la
estimacin tanto de la media como de la varianza.
As, realizamos un ejemplo:
-
7/22/2019 Cueva Lpez
27/36
27
5.2. Contrastes de HiptesisPara realizar el contraste de igualdad de medias vamos a usar el
paquete estadstico Rcmdr.
- Contraste de igualdad de mediasPrimero empezaremos por cargar el paquete. Una vez cargado, al ser un
programa por mens, seguiremos los siguientes pasos:
Una vez en introducidos, aparece la siguiente pantalla:
-
7/22/2019 Cueva Lpez
28/36
28
As, utilizaremos el tipo de contraste que se desee realizar, el valor
con a comparar y la variable que vayamos a analizar.
- Contraste de igualdad de medias de dos muestras dependientesSi estamos en un cotraste de igualdad de medias de dos muestras
dependientes, realizaremos la siguiente operacin:
As, aparecer la siguiente ventana:
-
7/22/2019 Cueva Lpez
29/36
29
Una vez sealadas las variables, nos introduciremos en la ventana
Opciones, donde aparece:
En dicha ventana introduciremos el tipo de contraste que se quiera
realizar y el nivel de confianza al que queramos realizarlo.
- Contraste de NormalidadVamos a realizar un contraste de normalidad. El contraste que vamos a
usar es el test de Shapiro-Wilks, instalado en el paquete Ds,
instalado anteriormente.
La orden que utilizaremos para dicho test es la misma utilizado en elapartado 2 de este documento, gds.
Aplicaremos un ejemplo para su uso:
Los datos introducidos en el programa son:
-
7/22/2019 Cueva Lpez
30/36
30
Y al usar la orden gds(Datos), obtenemos los siguientes resultados:
-
7/22/2019 Cueva Lpez
31/36
31
5.3. ANOVAVamos a proceder a realizar el anlisis de la varianza apartir del paquete
RCMDR.
Para proceder con dicho paquete, primero vamos a crear un modelo por el cualse relacionen ambas variables.
Este se crea a partir de:
-
7/22/2019 Cueva Lpez
32/36
32
Una vez creado el modelo, podemos realizar el anlisis de la varianza
a partir del siguiente men:
Por lo tanto, al aceptar obtendremos el contraste.
-
7/22/2019 Cueva Lpez
33/36
33
6. Modelos de Regresin LinealPara realizar el ajuste de regresin, vamos a utilizar el paquete
Rcmdr.
En dicho paquete, en el men de Estadsticos -> Ajuste de modelos ->Regresion lineal, podremos realizar una regresin del tipo:
y=ax+b.
Cuando realizamos dicho ajuste, nos aparece en la ventana de
soluciones los coeficientes de nuestro modelo junto con los contrastes
individuales de estos para saber si son o no significativos.
Una vez estimados los coeficientes, realizaremos el ANOVA del modelo,
usando lo explicado en el apartado anterior.
Si no tenemos dos variables, y queremos realizar un anlisis del tipo:
Y= ax1+bx2+Para realizar dicho contraste, seguiremos los siguientes pasos:
Al introducirnos en Modelo Lineal, aparece la siguiente ventana:
-
7/22/2019 Cueva Lpez
34/36
34
Donde introduciremos la forma de nuestro modelo.
Una vez realizados dichos pasos, obtenemos una estimacin de los
parmetros del modelo, con sus respectivos contrastes individuales de
los modelos.
Para hacer ver si el modelo es significativo, realizaremos el anlisis
ANOVA.
A la hora de validar el modelo, se realizar el contraste de Breuch-
Pagan para heterocedasticidad, utilizando el siguiente men:
Una vez en el men,aparecer la siguiente ventana:
-
7/22/2019 Cueva Lpez
35/36
35
En donde podremos realizar el contraste.
Tambin, realizaremos el test de Durbin-Watson para autocorrelacin,
usando el siguiente men:
-
7/22/2019 Cueva Lpez
36/36
7. BibliografaLa bibliografa utilizada para dicho trabajo es:
- Cran.r-project.org-
Apuntes de la asignatura Entornos de ComputacinEstadstica, Mster de Estadstica Aplicada, Universidad de
Granada