brochure curso básico de análisis predictivo minería de textos (dm042)

Upload: kasperu-sac

Post on 04-Apr-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/29/2019 Brochure Curso Bsico de Anlisis Predictivo Minera de Textos (DM042)

    1/6

    Av. Jos Pardo 138, Oficina 1402 [email protected] Lima - Per www.kasperu.comTelf. (51-1) 6978227 / 725-7209

    1

    Curso Bsico de Anlisis PredictivoMinera de Textos (DM042)

    SUMILLA

    Este curso expone las tcnicas y tecnologas de la minera de textos. La minera de textoses el proceso para descubrir conocimiento almacenado en documentos (datos noestructurados), el conocimiento se puede representar como tendencias, promedios,desviaciones, dependencias, grupos, etc. Se entiende como la extensin de los mtodosestndar de prediccin y descripcin de la minera de datos. La minera de textoscomprende las siguientes actividades fundamentales: Clasificacin de documentos para laasignacin automtica a clases pre-definidas. Agrupamiento de documentos para laidentificacin de documentos similares. Recuperacin de informacin (similar a unbuscador). Extraccin de la informacin incluida en esos textos (hechos) y Extraccin deasociaciones entre los hechos extrados. Por otro lado, dado que el vector de caractersticasobtenido es por lo general muy grande se requiere el uso de tcnicas para la reduccin dela dimensionalidad.

    OBJETIVOS

    Al final del curso los alumnos estarn en capacidad de: Conocer y entender los fundamentos y problemticas actuales de Minera de Textos en

    comparacin a Data Mining tradicional. Comprender y usar las tcnicas para el anlisis y la preparacin de documentos. Aplicar y evaluar tcnicas de agrupamiento y clasificacin de documentos. Aplicar y evaluar tcnicas para la recuperacin de documentos. Aplicar y evaluar tcnicas para la extraccin de informacin. Aprender a utilizar las herramientas disponibles para la minera de textos.

    CONTENIDO

    El curso est conformado por los siguientes temas.

  • 7/29/2019 Brochure Curso Bsico de Anlisis Predictivo Minera de Textos (DM042)

    2/6

    Av. Jos Pardo 138, Oficina 1402 [email protected] Lima - Per www.kasperu.comTelf. (51-1) 6978227 / 725-7209

    2

    METODOLOGA

    Desarrollo de clases tericas para explicar los conceptos necesarios. Desarrollo de talleres, donde se aplica lo aprendido en clase. Uso de medios audiovisuales (proyectores) Materiales de clase impresos y en CD.

    DOMINIOS DE APLICACIN

    Anlisis de similaridad de documentos Bsqueda e indexacin de documentos Anlisis de mensajes en redes sociales Anlisis de encuestas abiertas. Anlisis de post en blogs. Anlisis de correos electrnicos (spam). Estructuracin de base de datos. Depuracin de bases de datos.

    REQUISITOS

    Es deseable que los alumnos tengan experiencia en (no indispensable): Estadstica y probabilidades. Mtodos de clasificacin, agrupamiento y asociacin Disponer de una computadora para el desarrollo de las clases

    QUIENES PUEDEN ASISTIR

    Profesionales en TI.Consultores en minera de datos.Analistas de marketing en la web.Investigadores de mercado que desean analizar encuestas abiertas.Profesionales en estadstica interesados en analizar el contenido de textos no estructurados(formularios, encuestas, etc.).

    HERRAMIENTASPara el desarrollo del curso se hace uso de las siguientes herramientas de software

    MATERIALES

    El alumno recibe como parte de su capacitacin Un CD conteniendo el material del curso, ejercicios prcticos, software libre y documentos

    relacionados. Material impreso

  • 7/29/2019 Brochure Curso Bsico de Anlisis Predictivo Minera de Textos (DM042)

    3/6

    Av. Jos Pardo 138, Oficina 1402 [email protected] Lima - Per www.kasperu.comTelf. (51-1) 6978227 / 725-7209

    3

    CERTIFICADO

    Para recibir el certificado de aprobacin del curso, los alumnos deben asistir al 100% de lassesiones y desarrollar un conjunto de ejercicios que demuestran su aprendizaje.

    Los alumnos que asistan al 100% de las sesiones y no entregan la tareas reciben unaconstancia de asistencia por 24 horas.

    INSTRUCTOR

    Ing. Samuel Oporto Daz. Especialista en el desarrollo de modelospredictivos. Magster en Inteligencia Artificial ITESM-Mxico. Ingenierode Sistemas UNI-Per. Estudios de Especializacin en robticaaplicada-CNAD-Mxico DF. Poltica Educativa Virtual-UAH-Chile. Docentedel curso de Inteligencia Artificial en la UNI, UPAO, USMP y UPC.Docente del Curso de Minera de Datos en el IIFIIS, CTIC-UNI y la UPC.Jefe del Proyectos en el CTIC-UNI. Investigador Principal del Instituto deInvestigacin de la FIIS (IIFIIS). Especialista en Visin Artificial,Reconocimiento de Patrones y Redes Neuronales. Investigador enCiencias de Computacin con publicaciones en: IJCNN2007, ICAIPR2007,ICIAR2005, LNCS2005, CLEI2004, CLEI2006. Consultor en SistemasInteligentes y Sistemas Autnomos. Consultor del programa deModernizacin del Estado Peruano. Consultor de la Secretara dePlanificacin Estratgica del Ministerio de Educacin del Per.

  • 7/29/2019 Brochure Curso Bsico de Anlisis Predictivo Minera de Textos (DM042)

    4/6

    Av. Jos Pardo 138, Oficina 1402 [email protected] Lima - Per www.kasperu.comTelf. (51-1) 6978227 / 725-7209

    4

    TEMARIO

    Nombre de los temas a tratar DuracinINTRODUCCIN A LA MINERIA DE TEXTOS (TEXT MINING)Qu es la minera de textos?. Colecciones de documentos corpus. Datossemi-estructurados y datos no estructurados. Tcnicas de minera detextos. El proceso de la minera de textos. Herramientas

    2 h

    PREPARACION DE DATOSLingstica, Morfologa, Sintaxis, Semntica. Conceptos bsicos,Gramtica, Lxico, Sintaxis. Tokenizacin. Stop words. Stemming.

    4 h

    MODELOS PREDICTIVOS PARA TEXTOS - CLASIFICACIONClasificacin de documento. Similaridad de documentos y el vecino mscercano. Reglas de decisin. Red Bayesiana, Mquina de Vector Soporte.Evaluacin del desempeo. Aplicaciones.

    4 h

    AGRUPAMIENTO (CLUSTERING) DE TEXTOSMedida de similaridad para la recuperacin. Bsqueda de documentosbasados en la Web y anlisis de links. Matching de Documentos.Agrupamiento por similaridad. Agrupamiento K-means. Agrupamiento

    jerrquico. Evaluacin del agrupamiento. Aplicaciones.

    4 h

    RECUPERACIN DE INFORMACIN (BINARIO Y VECTORIAL)Modelos de recuperacin de informacin, Relevancia. Modelos clsicos,

    indice de trminos, importancia, medidas de similaridad. Modelo Booleano.Modelo Vectorial, pesos, similaridad.

    4 h

    EXTRACCION DE INFORMACION DESDE TEXTOSObjetivos de extraccin de informacin. Bsqueda de patrones yentidades. Expresiones regulares. Extraccin de entidades y el mtodo demxima entropa. Plantillas de llenado. Aplicaciones. Tagging.

    4 h

    SELECCIN DE CARACTERSTICAS EN TEXTOS (REDUCCIN DEDIMENSIONALIDAD)

    Mtodos de muestreo, mtodos de seleccin de caractersticas, bsqueda.

    2 h

    Total de horas a dictar 24 h

  • 7/29/2019 Brochure Curso Bsico de Anlisis Predictivo Minera de Textos (DM042)

    5/6

    Av. Jos Pardo 138, Oficina 1402 [email protected] Lima - Per www.kasperu.comTelf. (51-1) 6978227 / 725-7209

    5

    EX ALUMNOS

    EDELNOR SUNAT Pacifico Vida Profuturo AFP Caja Municipal de Trujillo FondeSurco SCI Nextel del Per Telefnica del Per ATENTO Corporacin Radial del Per RPP TECSUP UPCH UPC BSH Electrodomsticos LAN Per Visanet Per Corporacin Lindley Citibank del Per S.A. Aceros Arequipa Financiera Efectiva S.A. Red Cientfica Peruana

  • 7/29/2019 Brochure Curso Bsico de Anlisis Predictivo Minera de Textos (DM042)

    6/6

    Av. Jos Pardo 138, Oficina 1402 [email protected] Lima - Per www.kasperu.comTelf. (51-1) 6978227 / 725-7209

    6

    KASPeruAv. Jos Pardo 138, Oficina 1402MirafloresLima Per(51-1) 697-8227 (51-1) 725-7209

    www.kasperu.com [email protected] los derechos reservados.Todos los nombres de empresas y/o productos mencionados tienen propsitos de identificacinnicamente, ellos son registrados por sus respectivos dueos.

    http://www.kasperu.com/mailto:[email protected]:[email protected]://www.kasperu.com/