introducción a la ciencia de datos - movimiento libre · 2020. 11. 1. · introducción a la...
TRANSCRIPT
![Page 1: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/1.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
Introducción a la Ciencia de Datos
Guillermo Valdés Lozano
25 de septiembre de 2015
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 2: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/2.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
Documento protegido por GFDL
Copyright (c) 2015 Guillermo Valdés Lozano.e-mail: guillermo(en)movimientolibre.comhttp://www.movimientolibre.com/
Se otorga permiso para copiar, distribuir y/o modificar este documento bajo lostérminos de la Licencia de Documentación Libre de GNU, Versión 1.2 o cualquier otraversión posterior publicada por la Free Software Foundation; sin Secciones Invariantesni Textos de Cubierta Delantera ni Textos de Cubierta Trasera.
Una copia de la licencia está enhttp://www.movimientolibre.com/licencias/gfdl.html
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 3: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/3.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
¿Qué es la Ciencia de Datos?¿Qué es un Científico de Datos?¿Qué se necesita saber para ser un científico de datos?
¿Qué es la Ciencia de Datos?
La Ciencia de Datos pretende abarcar a un conjunto deherramientas (basadas en la ciencia) y habilidades (humanas einformáticas) con un nombre muy atractivo.Se define como es la extracción de conocimiento a partir degrandes volúmenes de información estructurada o noestructurada.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 4: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/4.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
¿Qué es la Ciencia de Datos?¿Qué es un Científico de Datos?¿Qué se necesita saber para ser un científico de datos?
Conceptos que involucra
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 5: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/5.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
¿Qué es la Ciencia de Datos?¿Qué es un Científico de Datos?¿Qué se necesita saber para ser un científico de datos?
¿Qué es un Científico de Datos?
Un Científico de Datos (Data Scientists) es una persona conhabilidades estadísticas, computacionales (que sabe programar) yde visualización de datos que lo llevan a encontrar los patrones quele servirán a la empresa o institución para capitalizar la informaciónrecogida.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 6: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/6.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
¿Qué es la Ciencia de Datos?¿Qué es un Científico de Datos?¿Qué se necesita saber para ser un científico de datos?
Demanda de C. en D. en aumento
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 7: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/7.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
¿Qué es la Ciencia de Datos?¿Qué es un Científico de Datos?¿Qué se necesita saber para ser un científico de datos?
¿Qué se necesita saber para ser un científico de datos?
Domine las matemáticas, la estadística y la informática.
Aprenda a programar.Conozca las Bases de Datos.Sea ágil en herramientas de procesamiento y visualización.De el salto al Big Data.No deje de aprender y practicar.Colabore con la asociaciones, gobierno o con la iniciativaprivada.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 8: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/8.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
¿Qué es la Ciencia de Datos?¿Qué es un Científico de Datos?¿Qué se necesita saber para ser un científico de datos?
¿Qué se necesita saber para ser un científico de datos?
Domine las matemáticas, la estadística y la informática.Aprenda a programar.
Conozca las Bases de Datos.Sea ágil en herramientas de procesamiento y visualización.De el salto al Big Data.No deje de aprender y practicar.Colabore con la asociaciones, gobierno o con la iniciativaprivada.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 9: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/9.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
¿Qué es la Ciencia de Datos?¿Qué es un Científico de Datos?¿Qué se necesita saber para ser un científico de datos?
¿Qué se necesita saber para ser un científico de datos?
Domine las matemáticas, la estadística y la informática.Aprenda a programar.Conozca las Bases de Datos.
Sea ágil en herramientas de procesamiento y visualización.De el salto al Big Data.No deje de aprender y practicar.Colabore con la asociaciones, gobierno o con la iniciativaprivada.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 10: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/10.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
¿Qué es la Ciencia de Datos?¿Qué es un Científico de Datos?¿Qué se necesita saber para ser un científico de datos?
¿Qué se necesita saber para ser un científico de datos?
Domine las matemáticas, la estadística y la informática.Aprenda a programar.Conozca las Bases de Datos.Sea ágil en herramientas de procesamiento y visualización.
De el salto al Big Data.No deje de aprender y practicar.Colabore con la asociaciones, gobierno o con la iniciativaprivada.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 11: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/11.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
¿Qué es la Ciencia de Datos?¿Qué es un Científico de Datos?¿Qué se necesita saber para ser un científico de datos?
¿Qué se necesita saber para ser un científico de datos?
Domine las matemáticas, la estadística y la informática.Aprenda a programar.Conozca las Bases de Datos.Sea ágil en herramientas de procesamiento y visualización.De el salto al Big Data.
No deje de aprender y practicar.Colabore con la asociaciones, gobierno o con la iniciativaprivada.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 12: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/12.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
¿Qué es la Ciencia de Datos?¿Qué es un Científico de Datos?¿Qué se necesita saber para ser un científico de datos?
¿Qué se necesita saber para ser un científico de datos?
Domine las matemáticas, la estadística y la informática.Aprenda a programar.Conozca las Bases de Datos.Sea ágil en herramientas de procesamiento y visualización.De el salto al Big Data.No deje de aprender y practicar.
Colabore con la asociaciones, gobierno o con la iniciativaprivada.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 13: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/13.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
¿Qué es la Ciencia de Datos?¿Qué es un Científico de Datos?¿Qué se necesita saber para ser un científico de datos?
¿Qué se necesita saber para ser un científico de datos?
Domine las matemáticas, la estadística y la informática.Aprenda a programar.Conozca las Bases de Datos.Sea ágil en herramientas de procesamiento y visualización.De el salto al Big Data.No deje de aprender y practicar.Colabore con la asociaciones, gobierno o con la iniciativaprivada.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 14: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/14.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
¿Qué es la Ciencia de Datos?¿Qué es un Científico de Datos?¿Qué se necesita saber para ser un científico de datos?
Requerimientos para ser un C. en D.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 15: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/15.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
Descargue en Red México AbiertoConfigure LibreOffice con PostgreSQLDetermine la cantidad por tipo de escuelas
Red México AbiertoEn datos.gob.mx encontrará datos abiertos de nuestro país.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 16: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/16.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
Descargue en Red México AbiertoConfigure LibreOffice con PostgreSQLDetermine la cantidad por tipo de escuelas
Busque, encuentre y descargueDescargue el Catálogo de Centros de Trabajo de la SEP.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 17: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/17.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
Descargue en Red México AbiertoConfigure LibreOffice con PostgreSQLDetermine la cantidad por tipo de escuelas
Tipos de archivos recomendadosCSV para hojas de cálculo.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 18: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/18.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
Descargue en Red México AbiertoConfigure LibreOffice con PostgreSQLDetermine la cantidad por tipo de escuelas
LibreOffice BaseConfigure la comunicación con PostgreSQL.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 19: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/19.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
Descargue en Red México AbiertoConfigure LibreOffice con PostgreSQLDetermine la cantidad por tipo de escuelas
Tablas en LibreOffice BaseVerifique que puede ver la tabla con los Centros de Trabajo.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 20: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/20.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
Descargue en Red México AbiertoConfigure LibreOffice con PostgreSQLDetermine la cantidad por tipo de escuelas
Consultas con filtros en LibreOffice BaseCriterio: ent 05 (Coah.), mun 035 (Torreón) y loc 0001 (Torreón).
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 21: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/21.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
Descargue en Red México AbiertoConfigure LibreOffice con PostgreSQLDetermine la cantidad por tipo de escuelas
Importe la consulta a LibreOffice CalcArrastre desde Orígenes de Datos (F4) la consulta.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 22: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/22.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
Descargue en Red México AbiertoConfigure LibreOffice con PostgreSQLDetermine la cantidad por tipo de escuelas
Cree consultas por tipo de centro de trabajoFiltre en Base y ponga cada consulta en su hoja de cálculo.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 23: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/23.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
Descargue en Red México AbiertoConfigure LibreOffice con PostgreSQLDetermine la cantidad por tipo de escuelas
Analize los datosCalcule la cantidad de filas en cada hoja y grafique. Luego analize.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 24: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/24.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
PythonRHadoop
Python
Python es un lenguaje de programación creado por Guido vanRossum a principios de los años 90 cuyo nombre estáinspirado en el grupo de cómicos ingleses Monty Python.
Es un lenguaje interpretado o de script, con tipado dinámico,fuertemente tipado, multiplataforma y orientado a objetos.Python es un lenguaje que todo el mundo debería conocer. Susintaxis simple, clara y sencilla.Disponibilidad Windows, Mac, Linux.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 25: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/25.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
PythonRHadoop
Python
Python es un lenguaje de programación creado por Guido vanRossum a principios de los años 90 cuyo nombre estáinspirado en el grupo de cómicos ingleses Monty Python.Es un lenguaje interpretado o de script, con tipado dinámico,fuertemente tipado, multiplataforma y orientado a objetos.
Python es un lenguaje que todo el mundo debería conocer. Susintaxis simple, clara y sencilla.Disponibilidad Windows, Mac, Linux.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 26: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/26.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
PythonRHadoop
Python
Python es un lenguaje de programación creado por Guido vanRossum a principios de los años 90 cuyo nombre estáinspirado en el grupo de cómicos ingleses Monty Python.Es un lenguaje interpretado o de script, con tipado dinámico,fuertemente tipado, multiplataforma y orientado a objetos.Python es un lenguaje que todo el mundo debería conocer. Susintaxis simple, clara y sencilla.
Disponibilidad Windows, Mac, Linux.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 27: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/27.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
PythonRHadoop
Python
Python es un lenguaje de programación creado por Guido vanRossum a principios de los años 90 cuyo nombre estáinspirado en el grupo de cómicos ingleses Monty Python.Es un lenguaje interpretado o de script, con tipado dinámico,fuertemente tipado, multiplataforma y orientado a objetos.Python es un lenguaje que todo el mundo debería conocer. Susintaxis simple, clara y sencilla.Disponibilidad Windows, Mac, Linux.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 28: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/28.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
PythonRHadoop
R
Inspirado por el lenguaje S. Desarrollado por John Chambersen los laboratorios Bell.
R es un lenguaje de script para manipulación de datos, análisisestadístico y visualización.Es comparable y a menudo superior en poder a productoscomerciales. Lenguaje de propósito general.Disponibilidad Windows, Mac, Linux.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 29: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/29.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
PythonRHadoop
R
Inspirado por el lenguaje S. Desarrollado por John Chambersen los laboratorios Bell.R es un lenguaje de script para manipulación de datos, análisisestadístico y visualización.
Es comparable y a menudo superior en poder a productoscomerciales. Lenguaje de propósito general.Disponibilidad Windows, Mac, Linux.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 30: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/30.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
PythonRHadoop
R
Inspirado por el lenguaje S. Desarrollado por John Chambersen los laboratorios Bell.R es un lenguaje de script para manipulación de datos, análisisestadístico y visualización.Es comparable y a menudo superior en poder a productoscomerciales. Lenguaje de propósito general.
Disponibilidad Windows, Mac, Linux.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 31: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/31.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
PythonRHadoop
R
Inspirado por el lenguaje S. Desarrollado por John Chambersen los laboratorios Bell.R es un lenguaje de script para manipulación de datos, análisisestadístico y visualización.Es comparable y a menudo superior en poder a productoscomerciales. Lenguaje de propósito general.Disponibilidad Windows, Mac, Linux.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 32: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/32.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
PythonRHadoop
Hadoop
Creado por Apache Software Foundation. Fuertementedesarrollado por Yahoo.
Es un framework de software que soporta aplicacionesdistribuidas.Puede usarse en granjas de computadoras y entornos de altorendimiento.Hadoop implementa un paradigma computacional llamadomap/reduce, donde la aplicación se divide en muchospequeños fragmentos de trabajo, cada uno de los cuales sepueden ejecutar o volver a ejecutar en cualquier nodo delclúster.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 33: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/33.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
PythonRHadoop
Hadoop
Creado por Apache Software Foundation. Fuertementedesarrollado por Yahoo.Es un framework de software que soporta aplicacionesdistribuidas.
Puede usarse en granjas de computadoras y entornos de altorendimiento.Hadoop implementa un paradigma computacional llamadomap/reduce, donde la aplicación se divide en muchospequeños fragmentos de trabajo, cada uno de los cuales sepueden ejecutar o volver a ejecutar en cualquier nodo delclúster.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 34: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/34.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
PythonRHadoop
Hadoop
Creado por Apache Software Foundation. Fuertementedesarrollado por Yahoo.Es un framework de software que soporta aplicacionesdistribuidas.Puede usarse en granjas de computadoras y entornos de altorendimiento.
Hadoop implementa un paradigma computacional llamadomap/reduce, donde la aplicación se divide en muchospequeños fragmentos de trabajo, cada uno de los cuales sepueden ejecutar o volver a ejecutar en cualquier nodo delclúster.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos
![Page 35: Introducción a la Ciencia de Datos - Movimiento Libre · 2020. 11. 1. · Introducción a la Ciencia de Datos Author: Guillermo Valdés Lozano Created Date: 9/24/2015 11:18:57 PM](https://reader036.vdocumento.com/reader036/viewer/2022071415/610f924b49770b22e621162e/html5/thumbnails/35.jpg)
IntroducciónEjemplo SEP Centros de Trabajo
Software Libre avanzado
PythonRHadoop
Hadoop
Creado por Apache Software Foundation. Fuertementedesarrollado por Yahoo.Es un framework de software que soporta aplicacionesdistribuidas.Puede usarse en granjas de computadoras y entornos de altorendimiento.Hadoop implementa un paradigma computacional llamadomap/reduce, donde la aplicación se divide en muchospequeños fragmentos de trabajo, cada uno de los cuales sepueden ejecutar o volver a ejecutar en cualquier nodo delclúster.
Guillermo Valdés Lozano Introducción a la Ciencia de Datos