primera clase.pptx [s lo lectura]) - gedic · 2020. 11. 9. · exportación de datos - los datos...

14
09/11/2020 1 Curso R Primera clase Javier Mariani [email protected] Sobre el curso: - Encuentros presenciales cada 2 semanas de 120’. - Introducción teórica de aprox 40’ (repaso de conceptos y corrección de ejercicios pendientes). - Trabajo con la computadora el resto del tiempo. - Último encuentro, actividad integradora y consultas. - Todo lo que haremos está disponible en campus por lo que no es necesario tomar apuntes. Estadísticas con R Javier Mariani Requerimientos - Instalar R. - Instalar RStudio. - Los encuentros utilizarán paquetes específicos que serán enviados antes de cada clase. Estadísticas con R Javier Mariani

Upload: others

Post on 26-Jan-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

  • 09/11/2020

    1

    Curso R

    Primera clase

    Javier Mariani

    [email protected]

    Sobre el curso:

    - Encuentros presenciales cada 2 semanas de 120’.

    - Introducción teórica de aprox 40’ (repaso de conceptos y corrección de

    ejercicios pendientes).

    - Trabajo con la computadora el resto del tiempo.

    - Último encuentro, actividad integradora y consultas.

    - Todo lo que haremos está disponible en campus por lo que no es necesario

    tomar apuntes.

    Estadísticas con R Javier Mariani

    Requerimientos

    - Instalar R.

    - Instalar RStudio.

    - Los encuentros utilizarán paquetes específicos que serán enviados antes de

    cada clase.

    Estadísticas con R Javier Mariani

  • 09/11/2020

    2

    Introducción

    - R es un conjunto integrado de programas para la manipulación de datos, el

    cálculo y la visualización gráfica.

    Estadísticas con R Javier Mariani

    - Es una implementación del lenguaje S (utilizado por el programa S-Plus).

    - Es gratuito y abierto.

    - Tiene más de 2.000 paquetes para resolver las más diversas situaciones.

    - Sin embargo, puede ser frustrante al comienzo.

    Estadísticas con R Javier Mariani

  • 09/11/2020

    3

    Introducción

    - Tiene la posibilidad de realizar desde cálculos sencillos hasta integrar datos

    en tiempo real por vía web (gráficos interactivos, mapas, traducción).

    Estadísticas con R Javier Mariani

    - A diferencia de otros paquetes estadísticos, R es orientado a objetos

    - Los resultados que muestra son menos que otros paquetes.

    - Todo se puede almacenar para utilizarlo.

    Estadísticas con R Javier Mariani

    Estadísticas con R Javier Mariani

  • 09/11/2020

    4

    Estadísticas con R Javier Mariani

    Introducción

    - Tiene la posibilidad de realizar desde cálculos sencillos hasta integrar datos

    en tiempo real por vía web (gráficos interactivos, mapas, traducción).

    Estadísticas con R Javier Mariani

    - A diferencia de otros paquetes estadísticos, R es orientado a objetos

    - Los resultados que muestra son menos que otros paquetes.

    - Todo se puede almacenar para utilizarlo.

    - RStudio es un programa que permite una interface más dinámica y ofrece

    funcionalidades adicionales.

    Estadísticas con R Javier Mariani

  • 09/11/2020

    5

    Introducción

    - Tras la instalación inicial seleccionar el lugar donde R guardará el trabajo

    (todo se guarda allí, e incluso los gráficos).

    Estadísticas con R Javier Mariani

    Estadísticas con R Javier Mariani

    Ayuda

    - Junto con la instalación, hay una gran cantidad de información útil (muchas

    de las búsquedas en la web, derivan a documento disponibles): help.start()

    Estadísticas con R Javier Mariani

  • 09/11/2020

    6

    Estadísticas con R Javier Mariani

    Ayuda

    - Junto con la instalación, hay una gran cantidad de información útil (muchas

    de las búsquedas en la web, derivan a documento disponibles): help.start()

    Estadísticas con R Javier Mariani

    - Desde R: RSiteSearch("logistic regression"). Va al término en la página

    de R (www.r-project.org)

    - En la Web hay muchas páginas muy útiles (Stack Overflow es muy buena).

    Estadísticas con R Javier Mariani

  • 09/11/2020

    7

    Ayuda

    - Junto con la instalación, hay una gran cantidad de información útil (muchas

    de las búsquedas en la web, derivan a documento disponibles): help.start()

    Estadísticas con R Javier Mariani

    - Desde R: RSiteSearch("logistic regression"). Va al término en la página

    de R (www.r-project.org)

    - En la Web hay muchas páginas muy útiles (Stack Overflow es muy buena).

    - Los paquetes tienen los mails de los autores y responden dudas y corrigen errores

    (bugs) de los paquetes.

    Estadísticas con R Javier Mariani

    Instalación de paquetes

    - Los paquetes necesarios se pueden instalar desde diferentes vías:

    Estadísticas con R Javier Mariani

    - Desde la consola: install.packages(“”)

  • 09/11/2020

    8

    Estadísticas con R Javier Mariani

    Instalación de paquetes

    - Los paquetes necesarios se pueden instalar desde diferentes vías:

    Estadísticas con R Javier Mariani

    - Desde la consola: install.packages(“”, dependencies=TRUE)

    - Desde la ventana interactiva ”Install” de RStudio.

    Estadísticas con R Javier Mariani

  • 09/11/2020

    9

    Instalación de paquetes

    - Los paquetes necesarios se pueden instalar desde diferentes vías:

    Estadísticas con R Javier Mariani

    - Desde la consola: install.packages(“”, dependencies=TRUE)

    - Desde la ventana interactiva ”Install” de RStudio.

    - Desde Github.com

    - Este es un repositorio, y requiere el paquete ”devtools”

    - Usualmente, las versiones más nuevas están antes de estar en el

    Comprehensive R Archive Network (CRAN)

    Estadísticas con R Javier Mariani

    Tipos de objetos

    - R puede almacenar una gran cantidad de objetos diferentes, los básicos:

    Estadísticas con R Javier Mariani

    - Vectores: conjunto de valores del mismo tipo.

    - Matrices: conjuntos de vectores del mismo tipo.

    - Cuadros de datos (dataframe): conjuntos de vectores de distintos

    tipos.

    - Listas: conjuntos de objetos de distintos tipos.

  • 09/11/2020

    10

    Tipos de Variables

    - Las variables son similares a otros paquetes estadísticos:

    Estadísticas con R Javier Mariani

    - Numéricos: números continuos.

    - Enteros (integer): números enteros.

    - Factores: variables categóricas. Se utilizan en análisis que requieren

    categorías (por ejemplo, ANOVA o lm) y para agrupar.

    - Carácter: variables de texto.

    - Fechas.

    - Lógicas: usualmente resultantes de operaciones lógicas.

    Importación de datos

    - R importa (y exporta numerosos formatos de bases de datos):

    Estadísticas con R Javier Mariani

    - En RStudio, en el cuadrante superior derecho en “Environment”,

    hacer click en “Import dataset”.

    Estadísticas con R Javier Mariani

  • 09/11/2020

    11

    Importación de datos

    - R importa (y exporta numerosos formatos de bases de datos):

    Estadísticas con R Javier Mariani

    - En RStudio, en el cuadrante superior derecho en “Environment”,

    hacer click en “Import dataset”.

    - El paquete “foreign” permite importar aún más formatos de datos.

    - R no importa datos desde MS Access.

    - Revisar los nombres de las variables y la base ANTES de importar.

    Estadísticas con R Javier Mariani

    Exportación de datos

    - Los datos que se importan se copian en formato R en el espacio de trabajo,

    para guardar una versión de las bases en otros formatos, se deben exportar:

    Estadísticas con R Javier Mariani

    - R trae una función genérica para exportar en formato texto (csv).

    - write.csv(nombre de la base, “lugar y nombre del achivo”)

    - El paquete “xlsx” tiene funciones para exportar en .xlsx

  • 09/11/2020

    12

    Estadísticas con R Javier Mariani

    Manipulación de variables

    - Existen numerosas funciones para trabajar con variables y recodificarlas:

    Estadísticas con R Javier Mariani

    - Para utilizar una variable se puede ”unir” la variable al directorio de

    trabajo.

    - Escribir la ubicación de la variable en el espacio de trabajo

    mibasededatos$variable

    Estadísticas con R Javier Mariani

  • 09/11/2020

    13

    Estadísticas con R Javier Mariani

    Manipulación de variables

    - Las conversiones de formatos, por ejemplo de números a factores, pueden

    ser necesarios en algunos análisis y gráficos.

    Estadísticas con R Javier Mariani

    Estadísticas con R Javier Mariani

  • 09/11/2020

    14

    Estadísticas con R Javier Mariani

    Manipulación de variables

    - Las conversiones de formatos, por ejemplo de números a factores, pueden

    ser necesarios en algunos análisis y gráficos.

    Estadísticas con R Javier Mariani

    - Se pueden realizar cálculos entre variables, conversiones lógicas,

    búsquedas de texto, etc.

    - Otro tipo de transformaciones como operaciones con un escalar o

    transformaciones logarítmicas, raíces, exponentes, son igualmente

    factibles y frecuentes.