![Page 1: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/1.jpg)
Algoritmos de Minería
Los métodos básicos
![Page 2: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/2.jpg)
Algoritmos de Minería
“Las ideas sencillas, frecuentemente funcionan bien”
Un atributo hace todo Todos los atributos contribuyen Estructura lógica capturada en un árbol
de decisión Reglas independientes etc...
![Page 3: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/3.jpg)
Inferencia de Reglas
El método más simple es llamado
“1-rule” Genera un árbol de decisión de un nivel Conjunto de reglas que prueban un
atributo en particular Cada rama corresponde a un valor
distinto del atributo
![Page 4: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/4.jpg)
Método 1-Rule
La asignación de la clase para la rama será la más frecuente en el conjunto de entrenamiento (clase mayoritaria)
La tasa de error se calcula contando las instancias que no tienen la clase mayoritaria
Cada atributo genera un conjunto distinto de reglas, una regla por cada valor del atributo
Es necesario calcular la tasa de error para elegir el mejor conjunto de reglas
![Page 5: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/5.jpg)
Método 1-Rule
Para cada atributo
Para cada valor del atributo:
Calcular la frecuencia de cada clase
Determinar la clase mayoritaria CM
Construye la regla:
si valor de atributo entonces CM
Calcular la tasa de error de las reglas
Escoger las reglas con la menor tasa de error
![Page 6: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/6.jpg)
EjemploConjunto attribute rules errors total errors
1 outlook sunny --> no 2/4 4/14overcast --> yes 0/4rainy --> yes 2/5
2 temperature hot --> no 2/4 5/14mild --> yes 2/6cool --> yes 1/4
3 humidity high --> no 3/7 4/14normal --> yes 1/7
4 windy false --> yes 2/8 5/14true --> no 3/6
![Page 7: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/7.jpg)
Valores faltantes y atributos numéricos
Valores faltantes– Es tratado como otro valor del atributo
• if outlook = missing then yes
Atributos numéricos– Convertirlos
![Page 8: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/8.jpg)
Golf con valores numéricos
outlook temperature humidity windy playovercast 64 65 true yesrainy 65 70 true no rainy 68 80 false yessunny 69 70 false yesrainy 70 96 false yesrainy 71 91 true nosunny 72 95 false noovercast 72 90 true yesrainy 75 80 false yessunny 75 70 true yessunny 80 90 true noovercast 81 75 false yesovercast 83 86 false yessunny 85 85 false no
![Page 9: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/9.jpg)
Particiónoutlook Temp play play play play
overcast 64 yes 64.5 yes yes yesrainy 65 no 66.5 no no no rainy 68 yes yes yes yessunny 69 yes yes yes yesrainy 70 yes 70.5 yes yes yesrainy 71 no no no nosunny 72 no 72 no no noovercast 72 yes yes yes yesrainy 75 yes yes yes yessunny 75 yes 77.5 yes yes yessunny 80 no 80.5 no no noovercast 81 yes yes yes yesovercast 83 yes 84 yes yes yessunny 85 no no no no
If temperature <=77.5 then Play=yeselse Play = No
![Page 10: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/10.jpg)
Árboles de Decisión
Utiliza la técnica de Divide y Conquista Procedimiento inductivo La salida es un árbol de decisión top-down induction of decision trees Desarrollada y refinada por Ross
Quinlan de la universidad de Sydney, Australia
Conocido como ID3
![Page 11: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/11.jpg)
Árboles de Decisión
Clasifica patrones con atributos no numéricos
Mejorado con el uso del radio de ganancia
Variaciones – C4.5, – C5
![Page 12: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/12.jpg)
Árboles de Decisión Puede expresarse recursivamente
– Seleccionar un atributo– Colocar una rama para cada valor del
atributo– Dividir las instancias en subconjuntos uno
por cada valor– Repetir el proceso para cada rama
utilizando el subconjunto apropiado– Si las instancias de una rama son de la
misma clase, el proceso termina para esa rama.
![Page 13: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/13.jpg)
Ejemplo
Estatura Cabello Ojos Clasealto negro azul abajo negro azul aalto rubio azul oalto rojo azul oalto rubio café abajo rubio azul obajo rubio café aalto negro café a
![Page 14: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/14.jpg)
Por atributo
Estatura Clase Cabello Clase Ojos Clasealto a negro a azul aalto a negro a azul aalto a negro a azul oalto o rojo o azul oalto o rubio a azul obajo a rubio a café abajo a rubio o café abajo o rubio o café a
![Page 15: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/15.jpg)
¿Cuál es el mejor atributo?
Intuitivamente, cualquier hoja con instancias de solo una clase no tendrá que dividirse después
Se desea que quede un árbol pequeño Medida de la pureza de cada nodo Escoger el atributo que produzca los
nodos hijos mas puros
![Page 16: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/16.jpg)
Medida de Pureza
Información Se mide en fracciones de bit, y
frecuentemente es menor a 1 Se asocia a cada nodo y se calcula con base
al número de instancias de cada clase en él Representa la cantidad de información
esperada que sería necesaria para especificar la clase de una instancia dada
![Page 17: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/17.jpg)
Información
Propiedades esperadas– Cuando queda una sola clase, la
información debe ser cero– Cuando el número de instancias de cada
clase es igual, la información alcanza su máximo valor
La función que satisface estas propiedades es conocida como entropía
![Page 18: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/18.jpg)
Entropía
n
iiin pppppEntropía
1221 log,,,
Información del Sistema Información del atributo Información de cada rama Ganancia del atributo Se busca el atributo que provee la mayor
ganancia en información.
![Page 19: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/19.jpg)
Información del sistema
La entropía del sistema es
bit954.083log8
38
5log85
22
![Page 20: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/20.jpg)
Ejemplo
Ganancia de información al probar la característica de Cabello
![Page 21: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/21.jpg)
Entropía sistema: 0.954 bit Entropía de la rama negro: 0 Entropía de la rama rojo: 0 Entropía de la rama rubio:
Entropía de cabello respecto a I:
bit12
1log
2
1
2
1log
2
1
bit5.018
40
8
10
8
3
![Page 22: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/22.jpg)
Ejemplo
Ganancia de información al evaluar cabello:
Entropía (I) - Entropía (I, cabello)
= 0.954 - 0.5 = 0.454 bit
![Page 23: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/23.jpg)
Ejemplo
Ganancia al evaluar ojos
![Page 24: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/24.jpg)
Entropía sistema: 0.954 bit Entropía de la rama café: 0 Entropía de la rama azul:
Entropía de ojos respecto a I:
bit971.05
3log
5
3
5
2log
5
2
bit607.008
3971.0
8
5
![Page 25: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/25.jpg)
Ejemplo
Ganancia de información al evaluar ojos:
Entropía (I) - Entropía (I, ojos)
= 0.954 - 0.607 = 0.347 bit
![Page 26: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/26.jpg)
![Page 27: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/27.jpg)
outlook temperature humidity windy Playovercast hot high false Playrain mild high false Playrain cool normal false Playovercast cool normal true Playsunny cool normal false Playrain mild normal false Playsunny mild normal true Playovercast mild high true Playovercast hot normal false Playsunny hot high false Don't Playsunny hot high true Don't Playrain cool normal true Don't Playsunny mild high false Don't Playrain mild high true Don't Play
![Page 28: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/28.jpg)
rainy
outlook
yesyesnonono
yesyesyesnono
yesyesyesyes
sunny overcast
temperature
yesyesnono
yes yesyesno
yesyesyesyesnono
hot mild cool
![Page 29: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/29.jpg)
humidity
yesyesyesnononono
yesyesyesyesyesyesno
highnormal
windy
yesyesyesyesyesyesnono
yesyesyesnonono
false true
![Page 30: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/30.jpg)
Información del sistema
No se considera ningún atributo.
IS([9,5]) = -(9/14) lg (9/14) - (5/14) lg (5/14)
= 0.4097 + 0.5305
= 0.940
![Page 31: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/31.jpg)
Información
De cada rama– ISunny ([2,3]) = 0.5287 + 0.4421 0.971– IOvercast ([4,0]) = 0– IRainy ([3,2]) = 0.4421 + 0.5287 0.971
Del atributo– IOutlook =
693.0
971.0145
0144
971.0145
![Page 32: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/32.jpg)
Ganancia
GOutlook = IS - IOutlook
= 0.940 - 0.693 = 0.247 GTemperature = IS - ITemperature
= 0.940 - 0.911 = 0.029 GHumidity = IS - IHumidity
= 0.940 - 0.788 = 0.152 GWindy = IS - IWindy
= 0.940 - 0.892 = 0.048
![Page 33: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/33.jpg)
outlook
temperature
nono
yesno
yes
hot mild cool
... ...
sunny
humidity
nonono
yesyes
high normal
... ...
outlook
sunny
... ...
outlook
sunny
windy
yesyesnono
yesno
false true
![Page 34: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/34.jpg)
Outlook - Sunny
ISOutlook = 0.971 ITemperature = 0.4 GTemperature = 0.571 IHumidity = 0 GHumidity = 0.971 IWindy = 0.95098 GWindy = 0.020
![Page 35: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/35.jpg)
Outlook - Rainy
ISOutlook = 0.971 ITemperature = 0.95098 GTemperature = 0.20 IHumidity = 0.95098 GHumidity = 0.20 IWindy = 0 GWindy = 0.971
![Page 36: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/36.jpg)
outlook
windyhumidity yes
no yes yes no
sunnyovercast
rainy
high normalfalse true
![Page 37: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/37.jpg)
Radio de Ganancia
Atributos altamente ramificados Atributo identificador = información 0 No es bueno para predecir la clase de
instancias desconocidas La medida de ganancia de información
tiende a preferir atributos con dominios grandes
![Page 38: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/38.jpg)
ID code
no no yes yes no
a b mn
c ...
![Page 39: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/39.jpg)
Radio de Ganancia
Se obtiene considerando el número y tamaño de los nodos hijos en los cuales el atributo divide al conjunto sin tomar en cuenta cualquier información acerca de la clase
![Page 40: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/40.jpg)
outlook temperature 0.911info: 0.693 info: 0.029gain: 0.940- 0.693 0.247 gain: 0.940-0.911 1.362split info:info ( [ 5, 4, 5 ] ) 1.577 split info: info ( [ 4,6,4 ] ) 0.021gain ratio; 0.247/ 1.577 0.156 0.029/ 1.362
humidity windyinfo: 0.788 info: 0.982gain: 0.940- 0.788 0.152 gain: 0.940-0.892 0.048split info:info ( [ 7, 7 ] ) 1 split info: info ( [ 8, 6 ] ) 0.985gain ratio: 0.152 0.152 gain ratio: 0.048/ 0.985 0.049
![Page 41: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/41.jpg)
Atributos
Numéricos Binario Seleccionar un punto Calcular la información de la misma
forma Preprocesamiento: Ordenar ¿Reordenar?
![Page 42: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/42.jpg)
Atributos
Faltantes ¿es relevante?
– Ignorar instancias– un nuevo valor del atributo– Dividir y enviar a cada rama en proporción
al número de instancias que van a cada rama considerando el conjunto de entrenamiento.
![Page 43: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/43.jpg)
Poda
Prepruning (forward pruning)– Durante la construcción, decidir cuando se
debe de parar el desarrollo de subárboles Postpruning (backward pruning)
– individualmente no proporcionan información
– en conjunto sí.
![Page 44: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/44.jpg)
El Índice Gini
El índice Gini es una medida para determinar el grado al que una población comparte un recurso.
El índice Gini básicamente nos indica la equidad en la distribución de un recurso.
Los valores del índice Gini van de 0 a 1, siendo 0 la mayor equidad en la distribución y 1 representa el mayor grado de desigualdad posible.
![Page 45: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/45.jpg)
El Índice Gini
Para calcular el índice Gini se utiliza la siguiente fórmula:
Nota: p(j|t) es la frecuencia relativa de la clase j en el nodo t.
La medida de información en un nodo es máximo 1-1/nc que es cuando lexiste una distribución uniforme y esto realmente no nos resulta interesante. El caso es interesante cuando el resultado es 0 ya que todos los registros pertenecen a una misma clase.
![Page 46: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/46.jpg)
El Índice Gini Como Separador
Un ejemplo de esta medida es:
Para poder hacer una separación, necesitamos del índice Gini de separación:
Esto se calcula cuando dividimos un nodo p en k particiones o hijos.
Donde ni es el número de registros en el hijo i y n es el número de registros en el nodo que se esta investigando.
![Page 47: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/47.jpg)
El Índice Gini Como Separador
Basados en el criterio anterior, calculamos el índice Gini de separación para todas las posibles particiones y la que tenga el valor menor será la elegida para dividir el nodo.
Este criterio es utilizado en software como CART, SLIQ y SPRINT.
![Page 48: Algoritmos de Minería Los métodos básicos. Algoritmos de Minería n Las ideas sencillas, frecuentemente funcionan bien n Un atributo hace todo n Todos](https://reader033.vdocumento.com/reader033/viewer/2022061216/54b0e9df497959b5408b466f/html5/thumbnails/48.jpg)
Applet De Prueba
Para hacer algunos experimentos y comprobar resultados, pueden acudir a la siguiente dirección:
http://www.cs.ualberta.ca/~aixplore/learning/DecisionTrees/Applet/DecisionTreeApplet.html