weka: waitako environment for knowledge analysiscalonso/mui-tic/mineriadatos/... · 2009. 5....

Post on 12-Oct-2020

5 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Carlos J. Alonso González

Departamento de Informática

Universidad de Valladolid

Weka: Waitako Environmentfor Knowledge Analysis

Introducción

Explorer

Introducción a Weka: explorer 2

Contenidos

Fuentes

Introducción

The Explorer

Introducción a Weka: explorer 3

Fuentes

El contenido de esta presentación se basa en el capítulo 10 deI. Witten, E. Frank. Data Minig: Practical Machine Learning tools and Techniques, Second Edition. Morgan Kaufmman, Elsevier. San Francisco, CA, 2005. ISBN: 0 12 088407

Sitio weka: http://www.cs.waikato.ac.nz/ml/weka/

Presentación weka.ppt (descripción de todas las interfaces gráficas de weka, por E. Franck)

Varios tutoriales, en el sitio wekaTutorial.pdf (parte II de la obra citada)

Introducción de Alex K. Seewald

Manual en español: http://metaemotion.com/diego.garcia.morate/download/weka.pdf

Introducción a Weka: explorer 4

Introducción

Software para el aprendizaje automático/minería de datos escrito en JAVA con licencia GNU

Principalmente investigación, educación

Complementa DATA MINIG, de Witten y Frank

Características principales Sistema integrado de herramientas de preprocesado

de datos, algoritmos de aprendizaje y métodos de evaluación de algoritmos

Interfaces gráficas

Entorno para la comparación de herramientas de aprendizaje

Introducción a Weka: explorer 5

Ejecución

Instalada máquina virtual java

Instalado weka

java –jar weka.jar

Aparece la ventana selector de interfaces

Introducción a Weka: explorer 6

Selector de interfaces

Introducción a Weka: explorer 7

Introducción a Weka: explorer 8

Explorer: formato de datos ARFF

@relation heart-disease-simplified

@attribute age numeric@attribute sex { female, male}@attribute chest_pain_type { typ_angina, asympt, non_anginal,

atyp_angina}@attribute cholesterol numeric@attribute exercise_induced_angina { no, yes}@attribute class { present, not_present}

@data63,male,typ_angina,233,no,not_present67,male,asympt,286,yes,present67,male,asympt,229,yes,present38,female,non_anginal,?,no,not_present...

Introducción a Weka: explorer 9

Explorer: formato de datos ARFF

@relation heart-disease-simplified CABECERA

@attribute age numeric DECLARACIóN DE ATRIBUTOS@attribute sex { female, male}@attribute chest_pain_type { typ_angina, asympt, non_anginal,

atyp_angina}@attribute cholesterol numeric@attribute exercise_induced_angina { no, yes}@attribute class { present, not_present}

@data SECCIÓN DE DATOS63,male,typ_angina,233,no,not_present67,male,asympt,286,yes,present67,male,asympt,229,yes,present38,female,non_anginal,?,no,not_present...

Introducción a Weka: explorer 10

Explorer: preprocesado

Se pueden importar datos en varios formatos: ARFF, CSV, binarios...

Herramientas de preprocesado: filters

Filtros para: discretización, normalización, selección de atributos, resampling,...

Introducción a Weka: explorer 11

Datos: IRIS

Problema: determinar la clase de planta Iris: setosa, versicoulor, virginica

Descripción de instancias: 4 atributos numéricos

1. sepal longitud en cm

2. sepal anchura en cm

3. petal longitud en cm

4. petal anchura en cm

Nº de ejemplos: 150 (50 de cada clase)

Dominio muy simple

Introducción a Weka: explorer 12

Archivo IRIS.ARFF

@relation iris

@attribute sepallength numeric@attribute sepalwidth numeric@attribute petallength numeric@attribute petalwidth numeric@attribute class {Iris-setosa,Iris-versicolor,Iris-virginica}

@data

5.1,3.5,1.4,0.2,Iris-setosa4.9,3,1.4,0.2,Iris-setosa4.7,3.2,1.3,0.2,Iris-setosa4.6,3.1,1.5,0.2,Iris-setosa....

Introducción a Weka: explorer 13

Introducción a Weka: explorer 14

Introducción a Weka: explorer 15

Introducción a Weka: explorer 16

Introducción a Weka: explorer 17

Introducción a Weka: explorer 18

Introducción a Weka: explorer 19

Introducción a Weka: explorer 20

Introducción a Weka: explorer 21

Introducción a Weka: explorer 22

Introducción a Weka: explorer 23

Introducción a Weka: explorer 24

Introducción a Weka: explorer 25

Introducción a Weka: explorer 26

Introducción a Weka: explorer 27

Introducción a Weka: explorer 28

Introducción a Weka: explorer 29

Introducción a Weka: explorer 30

Introducción a Weka: explorer 31

Introducción a Weka: explorer 32

Introducción a Weka: explorer 33

Explorer: construcción de clasificadores

WEKA denomina clasificador a cualquier modelo con capacidad de predecir un valor nominal (clase discreta, clasificación) o un valor numérico (regresión)

Numerosos métodos básicos

Listas decisión, árboles decisión, reglas, PMC, SVM...

Meta-clasificadores

Baggin, boosting, stacking...

Introducción a Weka: explorer 34

Introducción a Weka: explorer 35

Introducción a Weka: explorer 36

Introducción a Weka: explorer 37

Introducción a Weka: explorer 38

Introducción a Weka: explorer 39

Introducción a Weka: explorer 40

Introducción a Weka: explorer 41

Introducción a Weka: explorer 42

Introducción a Weka: explorer 43

Introducción a Weka: explorer 44

Introducción a Weka: explorer 45

Introducción a Weka: explorer 46

Introducción a Weka: explorer 47

Introducción a Weka: explorer 48

Introducción a Weka: explorer 49

Introducción a Weka: explorer 50

Introducción a Weka: explorer 51

Introducción a Weka: explorer 52

Introducción a Weka: explorer 53

Introducción a Weka: explorer 54

Introducción a Weka: explorer 55

Introducción a Weka: explorer 56

Introducción a Weka: explorer 57

top related