deber n° 09 lenguajes de programación

22
ESCUELA SUPERIOR POLITÉCNICA DE CHIMBORAZO FACULTAD CIENCIAS ESCUELA DE FÍSICA Y MATEMÁTICA Lenguajes de Programación Orientados a la Estadística R. Nombre: Almache Mayra Carrera: Estadística e Informática Fecha: 20/01/2015

Upload: mayra-almache

Post on 26-Jul-2015

52 views

Category:

Software


2 download

TRANSCRIPT

ESCUELA SUPERIOR POLITÉCNICA DE CHIMBORAZO

FACULTAD CIENCIAS ESCUELA DE FÍSICA Y MATEMÁTICA

Lenguajes de Programación Orientados a la Estadística R.

Nombre: Almache MayraCarrera: Estadística e Informática

Fecha: 20/01/2015

INTRODUCCIÓN

El presente trabajo vamos a analizar el lenguaje de programación orientados a la Estadística r que es un conjunto de programas integrados para manejo de datos, simulaciones, cálculos y realización de gráficos.Cuando usamos una computadora, estamos intentado resolver un problema. Puede ser un problema de negocios, que involucra ganancias y perdidas; un problema científico que emplea modelos de comportamiento físico; una investigación estadística que evalúa la posibilidad de que ocurra algún evento; etc.

OBJETIVOSGENERAL:El objetivo fundamental, que tenemos como estudiantes es ser capaces de manipular y generar datos con facilidad y usar adecuadamente R para efectuar análisis de datos y generación de gráficos.ESPECÍFICOS:• Conocer una breve historia del Lenguaje r, así

como sus principales características.• Observar y comprender el funcionamiento de sus

códigos para la realización de ejercicios.

LENGUAJE DE PROGRAMACIÓN RR es un lenguaje de programación especialmente orientado al análisis estadístico y a la representación gráfica de los resultados obtenidos.

Es un proyecto GNU. Los usuarios son libres de modificarlo y extenderlo

Se trata de un lenguaje basado en comandos, en lugar de pinchar y arrastrar iconos o menús con el ratón se escriben comandos o instrucciones que son ejecutados.

Una sucesión de instrucciones o comandos de R que implementa un flujo de trabajo para realizar una tarea se denomina script o guión R.

HISTORIA.

Fue desarrollado inicialmente por Robert Gentleman y Ross Ihaka del Departamento de Estadística de la Universidad de Auckland en 1993.

Su desarrollo actual es responsabilidad del R Development Core Team.

HITOS EN EL DESARROLLO

DE R

Versión 0.16: Es la última versión alfa desarrollada esencialmente por Ihaka y Gentleman, que incluye gran parte de las características descritas en el "White Book".

Versión 0.49 (23 de abril de 1997): Es la versión más antigua de la que se conserva el código (que todavía compila en algunas plataformas UNIX). Poco después aparecieron las versiones alfa para Windows y Mac OS.

.HITOS EN EL DESARROLLO

DE R

Versión 0.60 (5 de diciembre de 1997): R se integra oficialmente en el Proyecto GNU. El código se versiona a través de CVS.

Versión 1.0.0 (29 de febrero de 2000): Los desarrolladores lo consideran suficientemente estable para su uso en producción.

Versión 1.4.0: Se introducen los métodos S4 y aparece la primera versión para Mac OS X.

Versión 2.0.0 (4 de octubre de 2004): Introduce el lazy loading, que permite una carga rápida de datos con un coste de memoria mínimo.

HITOS EN EL DESARROLLO

DE R

Versión 2.1.0: Aparece el soporte para UTF-8 y comienzan los esfuerzos de internacionalización para distintos idiomas.

Versión 2.9.0: El paquete 'Matrix' se incluye en la distribución básica de R.

Versión 2.11.0 (22 de abril de 2010): Soporte para sistemas Windows de 64 bits.

Versión 2.13.0 (14 de abril de 2011): Añadida una nueva función al compilador que permite acelerar las funciones convirtiéndolas a byte-code.

¿En qué me puede ayudar R?

R al estar orientado a las estadísticas, proporciona un amplio abanico de herramientas.

Capacidad gráfica, que permite generar gráficos con alta calidad, con sólo utilizar las funciones de graficación.

R también puede usarse como herramienta de cálculo numérico y a la vez ser útil para la minería de datos.

R es un lenguaje interpretado, el usuario normalmente accede por líneas de comandos o consola.

Se trata de un lenguaje de programación, lo que permite que permite extender sus propias funciones.

EJEMPLOSSi queremos hacer un Hola mundo podemos hacerlo de la siguiente manera:

Sumemos 2 números:

Vamos a crear una colección:

Vamos a calcular el cuadrado de cada elemento:

Ahora vamos a calcular la media, la varianza.

Además, R puede integrarse con distintas bases de datos y existen bibliotecas que facilitan su utilización desde lenguajes de programación interpretados como Perl, Python y Ruby. Y por supuesto existen proyectos que permiten utilizar R desde Java o .net.Cuenta con un poderoso entorno de desarrollo llamado R studio que se puede descargar de forma gratuita.

Los datos pueden almacenarse en variables que se identifican con un nombre.

Almacena datos en una variable se utiliza el operador de asignación <-

mi.variable.numerica <- 3.524mi.variable.caracter <- "control"mi.variable.booleana <- TRUE

R soporta como tipo de datos básicos valores numéricos, caracteres, cadenas de caracteres y valores booleanos.

Se diferencia entre mayúsculas y minúsculas. Los nombres de las variables deben ser informativos utilizando por convenio el, para separar distintas palabras.

VARIABLES Y TIPOS DE DATOS EN R.

.

VECTORES

Es una concatenación de una colección de datos del mismo tipo. Cada dato recibe un índice según el orden en el que se concatenó (comenzando por 1).

Para crear un vector usamos la función c(), un vector que consista en una serie de número consecutivos se utiliza el operador.

Por ejemplo:

.

Podemos acceder a un dato utilizando su índice. Para acceder a un subconjunto de datos de un vector podemos utilizar otro vector con los índices correspondientes

Por último, podemos acceder a un subconjunto de datos de un vector utilizando un vector lógico. En este caso, se devolverán los datos que corresponden a TRUE en el vector lógico correspondiente

Por ejemplo:

MATRICES

Es una colección de datos del mismo tipo que tiene dos dimensiones. Para crear una matriz usamos la función matrix. Los elementos se proporcionan en un vector y se colocan por columnas.

M <- matrix(1:10, nrow = 2, ncol = 5)

M

Si queremos que se rellene por filas es necesario especificar el argumento byrow = TRUE:M <- matrix(1:10, nrow = 2, ncol = 5, byrow=TRUE)

M

• Podemos asignar nombres a las filas y las columnas de una matriz:

rownames(M) <- c("fila1", "fila2")

colnames(M) <- c("columna1", "columna2", "columna3", "columna4", "columna5")

M

La función dim devuelve las dimensiones de una matriz:

dim(M)

La función nrow devuelve el número de filas:

nrow(M)

La función ncol devuelve el número de columnas:

ncol(M)

.

• Podemos seleccionar un elemento por el nombre de su fila y su columna:

M[1,2]M["fila2","columna2"]• Podemos extraer filas y columnas enteras

como vectores de matrices utilizando sólo el primer o segundo índice respectivamente y dejando el segundo en blanco:

M[1,]M[,"columna3"]

Operaciones Aritmético-Lógicas.Las operaciones aritméticas en R se escriben con los siguientes operadores:

Suma: +

Diferencia: -

Producto *División /

Potencia ^

POR EJEMPLO:

a <- 4

b <- 3

suma <- a + b

diferencia <- a – b

producto <- a * b

división <- a / b

potencia <- a ^ b

Operaciones de comparación en R.

Mayor que: >

Mayor o igual que:

>=

Menor que: <

Menor o igual que:

<=

Igual a: ==

Distinto de: !=

Estas operaciones devuelven un valor lógico TRUE o FALSE.

POR EJEMPLO:

a > 5

b >= 3

a < b

a <= 10

a == 5

b != a

Operaciones Lógicas en R.

POR EJEMPLO:(a > 5) && (b > 2)(a > 5) || (b > 2)

!(a > 5)

Conjunción (y): && o &

Disyunción (o): || o |

Negación (no): !

CONCLUSIONES

Como puede verse, existen lenguajes específicos para cada tarea diferente. Y en este caso este lenguaje r nos permite realizar cálculos estadísticos que nos pueden ayudar mucho en nuestra vida estudiantil.De este modo, una computadora podrá resolver un problema si alguien desarrolla un programa que contenga las instrucciones adecuadas que permitan transformar los datos.

LINCOGRAFÍA

http://www.genbetadev.com/formacion/r-un-lenguaje-y-entorno-de-programacion-para-analisis-estadistico

http://www.cs.us.es/~fran/curso_unia/introduccion_R.html

http://areaestadistica.uclm.es/events/Sesion1/Sesion1.html

http://acteon.webs.upv.es/docs/Apuntes/CursoR.pdf

BIBLIOGRAFÍA

John M. Chambers. Programming with R: Software for Data Analysis. Springer, Stanford University, Palo Alto, 2008.

Graham Williams, Data Mining with Rattle and R. Springer, New York, 2011