estudio y desarrollo de un prototipo para la gestión de la evolución de competencias en una...

Post on 07-Mar-2015

15 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

TRANSCRIPT

1

Estudio y desarrollo de un prototipo para la gestión de la evolución de

competencias en una empresa utilizando lógica borrosa y otras

técnicas de Inteligencia Artificial

Autor: Iván Obeso AgüeraDirector: Luciano Sánchez Ramos

Proyecto fin de Carrera. Ingeniería Informática.

Escuela Politécnica de Ingeniería de GijónENERO 2013

2

Introducción (I)• Hoy en día las empresas cuentan con grandes

volúmenes de datos, muchos de ellos inmanejables de forma manual.

• Necesitan extraer la máxima información posible de ellos para tomar decisiones (Data mining).“Data mining es el proceso de extracción de información implícita, previamente desconocida, y potencialmente útil de un conjunto de datos” (Data Mining. Practical Machine Learning Tools and Techniques).

3

Introducción (II)• Problema: Una organización cuenta con los

perfiles de sus trabajadores y necesita explotar esos datos para conseguir información útil. Ejemplos:o Seleccionar los empleados más adecuados para formarse en una

nueva tecnología.o Detectar carencias de recursos humanos en competencias que

necesitan ser cubiertas.o Descubrir grupos de empleados con las mismas capacidades.

• Una empresa necesita recursos humanos en una serie de competencias.

• Cada empleado es evaluado en esas competencias.

4

Introducción (III)• Necesidad de una herramienta para extraer

automáticamente toda la información subyacente de las evaluaciones disponibles de sus empleados.

• Representación gráfica de esa información (Data visualization).

5

Introducción (IV)• El algoritmo MDS (MultiDimensional Scaling) ya

soluciona este problema.

Algoritmo de exploración gráfica que transforma un conjunto de vectores en un espacio N-dimensional en otro conjunto 2-dimensional representable en un eje de coordenadas.

…En otras palabras:

Transforma un conjunto de empleados con un grupo de N evaluaciones cada uno en otro conjunto 2-dimensional representable en un eje de coordenadas.

6

Introducción (V)¿Cuál es el problema?

• Los datos que manejan las empresas sobre las capacidades de sus propios empleados pueden ser incompletos o poco fiables.

• El objetivo de este proyecto es investigar una forma de representar visualmente estos datos de baja calidad y desarrollar un prototipo software que implemente esa solución.

MDS FuzzyMDS

7

Toma de decisiones. Organizaciones

(I)• La toma de decisiones es un punto crucial en cualquier organización.• ¿Cómo se toma una buena decisión?

o Buena información y experiencia.o Contar con una buena visión de todas las alternativas y consecuencias.o Disponer de herramientas que apoyen este proceso.

• Existen varios tipos de decisiones:o Según su ejecución: programadas o no-programadas.o Según su nivel: decisiones estratégicas, tácticas y operacionales.

• Es un proceso que sigue una serie de pasos.

8

Toma de decisiones. Herramientas

(II)• Las herramientas exploran todas las alternativas de forma

precisa y evalúan cada una de ellas.• Actúan de forma automática y sistemática.• Sirven como apoyo para un agente a la hora de tomar

decisiones.• Permiten identificar oportunidades de hacer crecer la

compañía y detectar riesgos que pudieran resultar ocultos al gestor. Analizan los puntos fuertes y puntos débiles de la empresa.

Determinan futuras estrategias de la organización

9

Toma de decisiones. Herramientas

(III)• Organizan datos en crudo, documentación, conocimiento

personal y modelos de negocio para producir información útil.• Incluyen un sistema experto basado en conocimiento.• Se utilizan en muchos áreas: diagnosis médica, órdenes

ejecutivas, decisiones sobre producción agrícola, control del medio ambiente…

10

Contenido de la investigación

11

MDS (I)• Cada ítem es descrito por una serie de características.• Parte de una matriz de similitud entre los ítems a

representar.• Busca una posición en un espacio bidimensional para cada

ítem de forma que quede cercano a los ítems parecidos a él, y alejado geométricamente de los que son más diferentes.

• Ejemplo:

12

MDS (II)Aplicado al problema:• Cada ítem es un empleado descrito por una serie de evaluaciones sobre las

competencias que interesan en la empresa.• Los empleados son proyectados en un mapa en el que las distancias entre

los puntos representan la distancia entre los perfiles.

13

Extensión de MDS: FuzzyMDS

• MDS funciona cuando las evaluaciones son valores exactos, cosa que no siempre es cierta.

• Primer enfoque: Utilizar métodos estadísticos para aproximar esos valores desconocidos.o Problemas:

• Se introduce un error• Las decisiones pueden estar influidas por ese error.• Se pierde la noción de la imprecisión.

• Segundo enfoque: Extender MDS para representar la incertidumbre de las evaluaciones.

• Este estudio se centra buscar una manera de representar datos imprecisos en un mapa de proyecciones, siguiendo el método MDS.

Datos exactos MDS simpleDatos imprecisos Fuzzy MDS

14

Tipos de evaluaciones• Una evaluación de un empleado en una

competencia puede ser una nota exacta o puede ser un dato impreciso:o Un intervalo de valoreso Un número borrosoo Un intervalo borroso

15

Tipos de evaluaciones: intervalos numéricos

• Es el mayor grado de incertidumbre• Lo máximo que podemos decir una evaluación es

puede ser cualquier número entre un mínimo y un máximo.o Ejemplo: un empleado cuya evaluación en “C++” es [2, 5].

16

Tipos de evaluaciones: números borrosos

• ¿Qué es un número borroso?o Un número borroso puede entenderse como un intervalo de números

reales ponderado.o Cada valor puede tener su grado de pertenencia entre 0 y 1.o Solo un valor tiene el grado máximo.

o Ejemplo: distintos niveles de conocimiento para la competencia “Java”.

17

Tipos de evaluaciones: números borrosos (II)

• En este proyecto se han contemplado distintos tipos de funciones de pertenencia.o Gaussiana, lineal, exponencial y cuadrática

18

Tipos de evaluaciones: Intervalos borrosos

• Un intervalo borroso es un número borroso con varios valores con máximo grado de pertenencia: 1o Ejemplo: distintos niveles de dominio sobre la competencia “Python”.

19

Fuentes de evaluación (I)

• Indican el origen de las evaluaciones.• Tienen asociado un grado de desconfianza.• Una evaluación es modificada por la desconfianza de su fuente.

o Ejemplos:

Desconfianza 0.5

Desconfianza 0.3

Desconfianza 0.7

20

Fuentes de evaluación (II)

• La desconfianza por debajo y la desconfianza por arriba de la nota pueden ser distintas

Desconfianza de 0.5 por abajo y de 0.1 por arriba

21

Similaridad entre empleados (I)

• La distancia numérica entre 2 empleados se expresa como la distancia euclídea entre sus evaluaciones.

• Además, un empleado puede tener varias evaluaciones para una misma competencia.

P = (p1, p2, p3…) Dist(P, Q) =

Q = (q1, q2, q3…)

22

Método distancia (I) • La resta entre 2 evaluaciones de distintos

empleados se calcula como la distancia de esas evaluaciones.

23

Método distancia (II)

24

Método distancia (III)• Casos especiales: Solapamientos

25

Similaridad entre empleados (II)

• Se agrupan las distancias numéricas de todos los empleados entre sí en la matriz de similaridad.

• Representación: Mapa de proyecciones

Distancias numéricas Distancias geométricas

Empleados SIN incertidumbre Puntos de coordenadasEmpleados CON incertidumbre Figuras con área

26

Puntos característicos• Son empleados modelo que sirven como puntos de referencia en el mapa

de proyecciones.• Cada competencia tiene 2 puntos característicos:

o El empleado modelo con el máximo conocimiento en esa competencia.

o El empleado modelo con el mínimo conocimiento en esa competencia.• Con N competencias habrá 2*N puntos característicos.• Su colocación en el mapa se controla con el parámetro alpha-smoothing.

α-smoothing=1.0 α-smoothing=0.85 α-smoothing=0.0

27

Formas de proyección (I)

• ¿Qué forma deben tener las proyecciones para optimizar el fitness?o Empleado sin imprecisión punto de coordenadas.o Empleados con imprecisión:

CircunferenciaElipse

Posibilidades Elipse rotadaPolígono

28

Formas de proyección (II)

• Circunferencia:

Empleado:• Iniciativa = 5• Inglés = 5• PHP = [0,

10]

Fitness: 1.65

Fitness: 5.83

29

Formas de proyección (III)• Elipse paralela a los ejes:

• Elipse rotada:

Fitness: 1.52

Fitness: 1.36

30

Formas de proyección (IV)

• Polígono:

Empleado:• Iniciativa = 5• Inglés = [2.5,

7.5]• PHP = [0, 10]

Demasiada complejidad

31

Formas de proyección (V)• Las proyecciones con imprecisión borrosa se representan como elipses concéntricas.• Tantas elipses internas como alpha-cortes.

Empleado:• Iniciativa = 5• Inglés = 5• PHP =

max_uncert

32

Algoritmo genético (I)• ¿Cómo calcular un mapa en el que todas las

proyecciones se ajusten lo máximo posible a la matriz de similaridad?o Primer enfoque: Cálculo geométrico de todos los parámetros del

mapa.• Problemas:

o Gran cantidad de operaciones complejas.o Imposibilidad de encontrar una solución perfecta.

o Segundo enfoque: Usar un algoritmo genético para encontrar un buen mapa por fuerza bruta.

“Los algoritmos genéticos son una rama de la computación evolutiva que resuelven problemas de búsqueda en un espacio de soluciones imitando el proceso de evolución natural” – An Introduction to

Genetic Algorithms (Melanie Mitchel)

33

Algoritmo genético (II)• ¿Cómo funciona?

o Población inicial.o Cromosomas y Genes.o Función fitness.o Operaciones genéticas: Selección, cruce, mutación.o Proceso iterativo.

34

Algoritmo genético (III)

Fitness: 23.54

Fitness: 15.01 Fitness: 13.66

Fitness: 10.71

35

Algoritmo genético (IV)

• 5 minutos• Fitness =

41.61

• 25 segundos• Fitness = 57.27

36

…Recapitulando• El tamaño del área de una elipse indica el grado

de incertidumbre en las evaluaciones de ese empleado.

• La distancia geométrica entre las proyecciones de 2 empleados indica la diferencia de sus perfiles.

• Los empleados con incertidumbre tienen una distancia mínima y máxima al resto de puntos, fruto de esa imprecisión.

• La posición de un empleado con respecto a los dos puntos característicos de una competencia indica su nivel de conocimiento en esa competencia.

• Los empleados se segmentan en grupos según su perfil.

37

Conclusiones• Se ha estudiado, diseñado y construido una

herramienta para explotar los datos sobre las capacidades de una plantilla.

38

Trabajo futuro (I)• Permite analizar el cambio que ha producido en

un empleado el haber recibido un curso de formación con respecto a sus conocimientos iniciales.

• Extensión: se puede aplicar a pacientes hospitalarios, perfiles psicológicos, alumnos de un curso…

39

Trabajo futuro (II)

40

Demostración

top related