information retrieval: api & web scraping - dmc · biográficas, datos de redes sociales, datos...

9
1 Information Retrieval: Api & Web Scraping Extracción de datos relevantes de diferentes fuentes de información Curso:

Upload: others

Post on 18-Jul-2020

6 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Information Retrieval: Api & Web Scraping - DMC · biográficas, datos de redes sociales, datos de sucesos, oportunidades de proyectos, etc. Utilizando el lenguaje R y sus librerías

1

Information Retrieval: Api & Web ScrapingExtracción de datos relevantes de diferentes fuentes de información

Curso:

Page 2: Information Retrieval: Api & Web Scraping - DMC · biográficas, datos de redes sociales, datos de sucesos, oportunidades de proyectos, etc. Utilizando el lenguaje R y sus librerías

Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

2

9 Extraer el significado y valor de este tipo de datos no resulta sencillo. Básicamente, porque los sitios que habilitan estos datos, no quieren que sean recuperados. La disciplina que conocemos como “Information retrieval” describe la obtención de datos relevantes en una fuente de información que no la provee de manera estructurada. Esta captura de información se puede hacer a través de dos disciplinas y enfoques: (1) de sitios web con llamadas a API y web scraping (cuando la API no está habilitada); (2) de redes sociales, fundamentalmente a través de sus API.

9 Estas disciplinas comienzan a ser de enorme interés para las organizaciones porque cada vez hay una mayor cantidad de datos en la web: discursos, informaciones biográficas, datos de redes sociales, datos de sucesos, oportunidades de proyectos, etc. Utilizando el lenguaje R y sus librerías de information retrieval (rvest, httr, etc.), combinaremos conceptos y técnicas de ciencias de la computación, inteligencia artificial, lingüística y algoritmia para extraer valor de datos públicos de diferente índole.

Presentación

9 Se requiere que el participante cuente con conocimiento y experiencia en el manejo de análisis de datos.

Requerimientos: 9 Portar Laptop personal para desarrollo de sesión con programa R

Studio instalado. 9 Versión de R. 9 Librerías.

Pre-requisitos:

Page 3: Information Retrieval: Api & Web Scraping - DMC · biográficas, datos de redes sociales, datos de sucesos, oportunidades de proyectos, etc. Utilizando el lenguaje R y sus librerías

Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

3

Metodología 9 Metodología Learning by Doing. 9 El aprendizaje que proponemos se basa en la práctica y el desarrollo de casos

reales. El analítico aprende mejor en la práctica y solucionando casos, los cuales son tomados de las experiencias del medio local e internacional.

9 Para eso se dispone de lo siguiente: 9 Base de datos de prueba para aplicar lo aprendido. 9 Casos de aplicación, situaciones reales con aplicación en el mercado

peruano e internacional.

ObjetivosAl finalizar el curso, el alumno será capaz de aplicar técnicas avanzadas para mejorar los tiempos de respuesta de una aplicación. Adicionalmente, estará preparado para:

9 Aprender las principales técnicas de obtención de datos públicos que pueden enriquecer la toma de decisiones de negocio.

9 Diseñar y procedimentar la extracción de datos públicos para coordinar tanto técnicas de Web Scraping como API.

9 Aprender a introducir en modelos analíticos los datos extraídos de fuentes públicas.

Page 4: Information Retrieval: Api & Web Scraping - DMC · biográficas, datos de redes sociales, datos de sucesos, oportunidades de proyectos, etc. Utilizando el lenguaje R y sus librerías

Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

4

Beneficios 9 Certificado de Especialización. 9 Pertenecer a la Comunidad más grande de profesionales de Business Analytics. 9 Plana docente compuesta por líderes del sector, especializados en herramientas y temas a

desarrollar. 9 Descuentos en programas complementarios. 9 Material didáctico con el desarrollo del curso. 9 Acceso a Bibliografía Especializada. 9 Acceso a la bolsa de trabajo especializada de DMC. 9 Plana docente: líderes de la industria a nivel internacional.

• Rentabilidad única en el mercado laboral.• Desarrollo de pensamiento crítico y analítico.• Serás un profesional muy valorado en la actualidad.

Las empresas actuales están buscando profesionales que se diferencien en la gestión.Las ventajas competitivas que obtienes al estar en constante capacitación son muchas,entre las que destacamos:

Page 5: Information Retrieval: Api & Web Scraping - DMC · biográficas, datos de redes sociales, datos de sucesos, oportunidades de proyectos, etc. Utilizando el lenguaje R y sus librerías

PhD. Alex Rayón J.

Actualmente Vicedecano de Relaciones Externas y Formación Continua de la Facultad Deusto-Ingeniería y director de Deusto Data. Es también profesor del

área de economía y transformación digital, tanto en la Facultad de Ingeniería como

en la Business School de la Universidad de Deusto. Es además, consultor, conferenciante y divulgador de Big Data, Industria 4.0 y Economía Digital, habiendo dirigido e implantado proyectos de Big Data en grandes y medianas empresas, tanto en España como en Latinoamérica, y en diferentes sectores de actividad económica (industria, consumo, marketing, administraciones públicas, etc.)

Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

5

Syllabus

Instructor

I. Introducción• ¿Por qué es interesante y relevante obtener

datos públicosCo?• Principales técnicas.• Paquetes de R.

II. Captura de datos (Information retrieval)1. Web a) API.

• Portales de datos abiertos del Perú.• Transacciones financieras.• AirBnB.• Datos climatológicos.

b) Web scraping.• Webs deportivas.• Patrones de consumo.• Tendencias de consumo.

2. Redes Sociales. • Facebook.• Instagram.• Twitter.• Spotify.

3. Social Network Analysis.• Modelización de datos sociales.• Extracción de insights de datos expresados

en redes sociales.• Casos reales de aplicación.

Page 6: Information Retrieval: Api & Web Scraping - DMC · biográficas, datos de redes sociales, datos de sucesos, oportunidades de proyectos, etc. Utilizando el lenguaje R y sus librerías

Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

6

Medios de Pago

1. Depósito en las cuentas BBVA o BCP:

N° Cuenta de Ahorros: 0011-0177-02-00180473

N° Cuenta de Corriente: 193-2251181-0-01

3. Oficina DMC

2. Pago Online:

Dirección: Calle Río de la Plata 167. Of. 203. San Isidro. Lima - Perú.

Horario de Atención:Lunes a Viernes de 9:00 a.m. a 7:00 p.m. y Sábados de 9:00 a.m. a 4:00 p.m.

Razón Social

R.U.C

J&J Data Mining Consulting S.A.C

20520972740

Page 7: Information Retrieval: Api & Web Scraping - DMC · biográficas, datos de redes sociales, datos de sucesos, oportunidades de proyectos, etc. Utilizando el lenguaje R y sus librerías

Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

7

CertificadoCertificación otorgada a nombre de DMC Perú. Empresa de capacitación en herramientas analíticas del Perú.

9 Certificado de especialización.

Workshops: (Duración de desarrollo menor a 12 horas académicas)

¿Cómo obtengo mi certificado de especialización? 9 El participante deberá cumplir con la asistencia mínima requerida para ello se requiere una asistencia mínima del 80% del desarrollo del curso.

Page 8: Information Retrieval: Api & Web Scraping - DMC · biográficas, datos de redes sociales, datos de sucesos, oportunidades de proyectos, etc. Utilizando el lenguaje R y sus librerías

Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

8

DMC PerúDMC es una empresa pionera dedicada a la extracción de conocimiento desde grandes bases de datos, con más de 8 años experiencia en la capacitación de temas de Minería de Datos, Scoring de Riesgo Crediticio, Business Intelligence, Técnicas de segmentación, Business Analytics y Big Data. DMC es la única empresa peruana reconocida como uno de los referentes de capacitación en temas de Big Data.

Algunas empresas que confiaron en nosotros:

Page 9: Information Retrieval: Api & Web Scraping - DMC · biográficas, datos de redes sociales, datos de sucesos, oportunidades de proyectos, etc. Utilizando el lenguaje R y sus librerías

Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

9

Contacto

Email: [email protected] / [email protected]: www.dmc.peTeléfono: (511) 253-5066Móvil: 995900126 / 975491764 Dirección: Calle Rio de la Plata 167. Of. 203. San Isidro. Lima - Perú.Lunes a Viernes de 9:00 a.m. a 7:00 p.m. y Sábados de 9:00 a.m. a 1:00 p.m.