conociendo software r

12
Centro de Ciencias de la Salud Departamento de Optometría Maestría en Rehabilitación Visual Profesor: Dr. Rogelio Salinas Gutiérrez Alumna: Opt. Melissa P. García Félix 20 de Febrero del 2014 METODOS ESTADISTICOS Conociendo el Software R

Upload: melissa-garcia-felix

Post on 05-Jun-2015

117 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Conociendo software r

Centro de Ciencias de la Salud

Departamento de Optometría

Maestría en Rehabilitación Visual

Profesor: Dr. Rogelio Salinas Gutiérrez

Alumna: Opt. Melissa P. García Félix

20 de Febrero del 2014

METODOS ESTADISTICOS

Conociendo el Software R

Page 2: Conociendo software r

Índice

• Conociendo al Software R…………………………………………..……………………………………………..3

• Origen histórico del Software R ¿De dónde proviene R y para qué fue hecho?.....................................................................................4

• Tipo de licencia “GNU General Public License” de R. ¿Cuánto se debe pagar por utilizar R?.………………………………………………………………………....7

• Uso del software R en instituciones educativas y centros de investigación.

¿Quién usa R y por qué?...........................................................................................................................8

• Ventajas y desventajas del software R. ¿Qué tanto vale la pena usar R?.............................................................................................................9 • Conclusiones………………………………………………………………………………………………………..11

• Referencias……………………………………………………………………………………………………….....12

2

Page 3: Conociendo software r

Objetivo

Conocer el Software R, su origen histórico, así como su tipo de licencia e instituciones educativas

que utilizan dicho programa; además de sus ventajas y desventajas para saber el porque se usa este programa estadístico.

3

Conociendo el Software R

Page 4: Conociendo software r

Origen histórico del Software R ¿De dónde proviene R y para qué fue hecho?

R tiene una naturaleza doble de programa y lenguaje de programación y es considerado como un dialecto del lenguaje S creado por los Laboratorios AT&T Bell.

S esta disponible como el programa S-PLUS comercializado por Insightful. Existen diferencias importantes en el diseño de R y S R toma mucho del lenguaje S, desarrollado por Rick Becker, John Chambers y colegas en Bell Labs en los años setentas y ochentas. Los creadores describen a S como un lenguaje y un ambiente de programación interactiva para el análisis de datos y graficación. Sin embargo, R no es S. Las diferencias principales entre los lenguajes son resultado de la herencia de Scheme, fundamentalmente el manejo de la memoria y el acceso a las variables dependiendo de

donde fueron definidas. Se distinguen también en el manejo del color, áreas de graficación, rotulación matemática, etc.

4

Ross Ihaka es Profesor Asociado de Estadística en la Universidad de Auckland, que se reconoce, junto con Robert Gentleman, como uno de los creadores del

lenguaje de programación R (1996); el cual es un sistema para análisis estadísticos y gráficos, que es altamente reconocido y que además recibió la Real Sociedad de Nueva Pickering Medalla de Zelanda en 2008.

Page 5: Conociendo software r

• En agosto de 1993 y lo anunciaron en la lista de distribución s-news. En respuesta recibieron comentarios de varios interesados sobre su ambiente. El mas persistente fue Martin Machler de ETH Zurich quien los animo a liberar el código fuente como Software libre.

• En junio de 1995 los autores deciden distribuir R bajo licencia general de la fundación GNU de software libre. En marzo de 1996 se crean tres listas de distribución de mensajes para anuncios, desarrollo y ayuda sobre R.

Desde entonces la pagina principal del proyecto R es:

http://www.r-project.org/ • Ese mismo año se publica el artculo donde se anuncia a R formalmente.

• A partir de la creación de las listas de distribución la aportación de mejoras, sugerencias y

aplicaciones se hizo tan frecuente que Ihaka, Gentleman y Machler no respondan con la rapidez necesaria.

• A mediados de 1997 se creo un grupo de desarrollo mas amplio, R-core, el único autorizado a

modificar el código fuente. Actualmente el grupo cuenta con 18 miembros, incluyendo al mismo John Chambers, y estadísticos como Brian Ripley, de Oxford University.

Algunas fechas importantes en el desarrollo de R:

• En febrero de 2000 sale finalmente la versión 1.0 de R

• En 2001 se publica el primer numero de R-News, revista electrónica dedicada a la discusión y anuncios de nuevos procedimientos y paquetes de R; la revista es reemplazada por R -Journal en el 2009.

5

Page 6: Conociendo software r

Genealogía de R

6

Page 7: Conociendo software r

Tipo de licencia “GNU General Public License” de R.

¿Cuánto se debe pagar por utilizar R?

R se distribuye gratuitamente bajo los términos de la GNU General Public Licence; su desarrollo y distribución son llevados a cabo por varios estadísticos conocidos como el Grupo Nuclear de Desarrollo de R. R esta disponible en varias formas: El código fuente escrito principalmente en C (y algunas rutinas en Fortran), esencialmente para

maquinas Unix y Linux, o como archivos binarios precompilados para Windows, Linux (Debian, Mandrake, RedHat, SuSe), Macintosh y Alpha Unix. Los archivos necesarios para instalar R, ya sea desde las fuentes o binarios pre-compilados, se distribuyen desde el sitio de internet Comprehensive R Archive Network (CRAN) junto con las instrucciones de instalación. Para las diferentes distribuciones de Linux (Debian, . . . ), los binarios están disponibles generalmente para las versiones más actualizadas de estas y de R.

Finalmente, para garantizar que R sea siempre software libre de código abierto, se creo R foundation, que entre sus objetivos están: 1. Avanzar el proyecto R para calculo estadístico que provea de software libre y código abierto para el análisis de datos y graficas. 2. Guardar y administrar los derechos de copia de R y su documentación.

7

Page 8: Conociendo software r

Uso del software R en instituciones educativas y centros de investigación.

¿Quién usa R y por qué?

8

El Software o sistema R es también el nombre de un popular lenguaje de programación utilizado por un número creciente de analistas de datos dentro de las empresas y el mundo académico. R es similar al de otros lenguajes de programación, como C, Java y Perl, ya que ayuda a las personas realizan una amplia variedad de tareas de computación , dándoles acceso a los distintos comandos

. Para los estadísticos; por lo tanto, R es particularmente útil , ya que contiene una serie de mecanismos integrados para organizar los datos, ejecutar cálculos en la información, además de la creación de representaciones gráficas de los conjuntos de datos EN DIVERSAS ESPECIALIDADES (Medicina, Finanzas, Biología, Bioestadística, Economía etc.), Y GRAN CANTIDAD DE EMPRESAS para monitorear la producción y utilidad de algún producto o estudio en especifico. Resulta muy útil por su gran ayuda a su rápida explicación, comprensión y aceptación; ya que estadísticos , ingenieros, licenciados y científicos pueden mejorar el código del software o escribir variaciones para tareas específicas, además de que los paquetes escritos para R añaden los algoritmos avanzados, colores y gráficos con texturas y técnicas fáciles de profundizar en las bases de datos . Se usa con mucha frecuencia ya que el lenguaje, paquetes y ambiente de programación, le redundará la capacidad de cuestionar y contestar con confianza el cálculo con datos. Además de que "La exploración de los datos con las preguntas correctas y respuestas confiables son fundamentales para el análisis de datos"

Page 9: Conociendo software r

Ventajas y desventajas del software R. ¿Qué tanto vale la pena usar R?

9

VENTAJAS • En el desarrollo de R están involucrados científicos de primer nivel tanto en el lado estadístico como

de computo lo que garantiza un software de excelencia.

• Es sin duda el software estadística mas empleado en investigación estadística, pero también en

otras áreas como finanzas, medicina y psicología.

• El R-core ha creado una serie de procedimientos que ha hecho sencilla la participación de la gente aunque se tengan pocos elementos de computo.

• Basta saber un poco de R para poder colaborar con paquetes de su área de especialidad.

• El carácter de colaboración abierta por medio de paquetes se refleja en la posición que ocupa R en la frontera de la investigación.

• Por el mismo carácter de colaboración, la información de apoyo es muy extensa. La redes de

comunicación incluye listas de discusión a varios niveles; documentos de distribución libre que explican a distintos niveles generalidades y detalles de R

Page 10: Conociendo software r

10

• Se distribuye bajo licencia GNU. El software es libre y de código abierto. Es decir, R es gratis y si lo

desea, tiene disponible el código para modificarlo. Es el mismo caso para la mayora de los paquetes disponibles

• R esta compilado y disponible para los sistemas operativos mas populares: distintas versiones de

Linux, Mac OS X y Windows 32 y 64 bits.

• R le ofrece un ambiente que permite llevar a cabo sus ideas sin limitarlas únicamente a los procedimientos incluidos en su aplicación estadística

DESVENTAJAS • Requiere de conocimiento básicos de programación y estadística para operarlo, ejecutarlo y

comprenderlo. • Existen programas menos complejos de utilizar con un producto final muy similar al programa R.

• No tiene la capacidad de interactuar con Excel. • El sistema GNU tiene limitaciones, por ser versión gratuita.

Page 11: Conociendo software r

11

Conclusiones • R es un lenguaje de alto nivel y un ambiente para el análisis de datos y graficacion, creado por Ross

Ihaka y Robert Gentleman.

• Su diseño sigue la sintaxis de S pero el manejo de memoria y la manera de evaluar lo hace mas eficientemente como Scheme.

• En el desarrollo actual de R colaboran investigadores de primer nivel estadístico y en computación.

• Entre otras razones de porque aprender R se enuncian: 1. Es de excelente calidad. 2. Es libre y de código abierto

3. Es un proyecto por colaboración por lo que hay mucho material de apoyo y ayuda. 4. Gran variedad de paquetes. 5. El sistema le ofrece la facilidad para que usted realizar procedimiento y si as lo considera, contribuya

al acervo de R. 6. Por ultimo, R se enriquece con la colaboración de personas literalmente de todo el mundo. 7. Ofrece mayor cantidad de ventajas que desventajas.

Page 12: Conociendo software r

12

Referencias • R: Un lenguaje para análisis de datos y graficacion Ernesto Barrios Zamudio, 2010 • Material Didáctico Maestría en Rehabilitación Visual Plataforma de Métodos Estadísticos

• Introducción al uso y programación del sistema estadístico R. Ramón Díaz Uriarte, http://cran.r-project.org/doc/contrib/curso-R.Diaz-Uriarte.pdf

• Google Académico http://www.slideshare.net/ODISDIER/introduccion-al-programa-r http://csg.sph.umich.edu/docs/R/graphics-1.pdf