representación de la información
DESCRIPTION
Representación De La Información. Solo para principiantes. ¿Qué Es Información?. Bit, Como Unidad Mínima De Información. Es la forma básica de representar información. Con un conjunto de bits se puede representar información más compleja como: Números, caracteres, imágenes, etc. - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/1.jpg)
Representación De La Información.
Solo para principiantes.
![Page 2: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/2.jpg)
¿Qué Es Información?
![Page 3: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/3.jpg)
Bit, Como Unidad Mínima De Información.
Es la forma básica de representar información. Con un conjunto de bits se
puede representar información más compleja como:
Números, caracteres, imágenes, etc.
![Page 4: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/4.jpg)
Representación De Números
La representación de números se basa en el álgebra de bool. La mísma es capaz de representar, con un número (n) finito de dígitos booleanos, un número finito
de números naturales (2n).
N = 2:00 = 0, 01 = 1, 10 = 2, 11 = 3.
![Page 5: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/5.jpg)
Números Enteros
Si existen 2n números en n dígitos binarios, entonces podemos
representar 2n-1-1 números enteros positivos y 2n-1-1 negativos.
000 = 0, 001 = 1, 010 = 2, 011 = 3100 = 0, 101 = -1, 110 = -2, 111 = -
3.
![Page 6: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/6.jpg)
Números Reales
Si tenemos números enteros podemos representar a los números
reales con la fórmula M.2n, donde M y n son números enteros.
(¡Notación exponente, pero en base 2!)
![Page 7: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/7.jpg)
Enumerados
Si a cada número entero lo asociamos a un valor en especial, estos valores
especiales los llamamos enumerados.0 = calor, 1 = frío, 2 = cómodo.
![Page 8: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/8.jpg)
Caracteres
Ahora si asignamos a cada valor natural un símbolo tenemos un
enumerado de símbolos: caracteres.Existen varias normas para
determinar esa asociación de símbolos con números, la más
conocida es ASCII.
![Page 9: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/9.jpg)
Secuencias De Caracteres.
La secuencia de caracteres es una lista de símbolos seguidas una de otra.
Tienen orden y las operaciones más comunes son:
S[i] : referencia el carácter que está en la posición i de la secuencia S.
S.a : agregamos el carácter a al final de la secuencia S.
H O L A
![Page 10: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/10.jpg)
Vectores
Es una secuencia de elementos (números, enumerados, referencias, etc.) Donde la referencia a uno de esos elementos es
instantánea. Al igual que una secuencia una referencia es instantánea. Podemos decir que
una cadena de caracteres es un vector de caracteres, la mayor diferencia existe que en un
vector no es común insertar y eliminar datos.
V[i]: referencia al i-ésimo elemento del vector V.
4 5 5 5 6
![Page 11: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/11.jpg)
Matrices
Un vector de vector es una matriz.
M[i][j]: referencia el elemento (i,j) de la matriz M.
0 5 3 8 0
1 1 4 7 1
1 1 1 6 0
![Page 12: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/12.jpg)
Referencias
Las referencias son elementos que identifican elementos.
Los elementos podemos copiarlos, con lo que cualquier modificación a la
copia no modifica al original. O referenciarlo, con lo que si
modificamos la referencia modificamos el origina.
5
![Page 13: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/13.jpg)
Listas
Una lista, a diferencia de una secuencia de caracteres, hay que recorrerla secuencialmente para
poder llegar a algún elemento de la misma.
H O L A
![Page 14: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/14.jpg)
Árboles
Un árbol es una estructura donde se almacenan nodos y referencia a los
nodos. La cantidad de referencias de un nodo determina la topología de un
árbol.
H O L A
L
![Page 15: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/15.jpg)
Redes
Al igual que un árbol, cada nodo tiene un número determinado de
referencia. Pero las referencias puede generar ciclos.
BsAs
Córdoba
S. Fe
![Page 16: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/16.jpg)
Clases vs. Instancias
La clase refiere a la descripción de la estructura.
Una instancia refiere a la estructura.
![Page 17: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/17.jpg)
Programación
![Page 18: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/18.jpg)
Expresiones
Las expresiones devuelven un valor, tanto de verdad como numérico o
estructura.
5 + 4´HOLA´[i].'c'
a = b
![Page 19: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/19.jpg)
Asignación
Los valores devueltos en las expresiones se les puede recordar o
almacenar para luego usar nuevamente. Agrega la noción de
variable.
A <-- 5 + 6B, C <-- S[i], S[i+1]
A, B <-- B, A
![Page 20: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/20.jpg)
Condiciones
Las condiciones usan las expresiones booleanas tomar decisiones durante
un proceso.
Si 5 > a entonces imprimir Verdadero.
![Page 21: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/21.jpg)
Ciclos
Un proceso repetitivo necesita un ciclo. El mismo se detiene cuando cumple alguna
condición lógica.
A <-- 5B <-- 2Mientras A > 0 hacer
M <-- M + BA <-- A – 1
Fin Mientras.
![Page 22: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/22.jpg)
Formalidad y pseudocódigo.
Para poder entender un algoritmo hay que entender el lenguaje en que esta
descripto. Cómo la formalidad molesta a la hora de entender un algoritmo, se decidió que la mejor manera es describirlos un código pseudo formal: el pseudocódigo.
![Page 23: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/23.jpg)
Descanso...
![Page 24: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/24.jpg)
Aprendizaje Automático y Datamining
En Biología Molecular.
![Page 25: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/25.jpg)
¿Qué significa AA?
Decimos que un agente o un programa de computación
aprende de la experiencia E con respecto a cierta clase de tareas T con la medida de performance P, si su performance en la tarea T,
medida por P, mejora con respecto a la experiencia E.
![Page 26: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/26.jpg)
Por ejemplo...
Un programa de computación que aprende a jugar al ajedrez debería mejorar su performance, medida por su habilidad de ganar en la clase de tareas correspondientes a jugar partidas de ajedrez, a través de la experiencia obtenida jugando
partidas.
![Page 27: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/27.jpg)
Algunos ejemplos en Biología Molecular
Análisis inductivo de la estructura super-secundaria de proteínas.Inducción simbólica en secuencias de DNA y proteínas.Regulación molecular.Codificación basada en conocimiento de la topología de proteínas.
![Page 28: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/28.jpg)
Algunos ejemplos en Biología Molecular
Predicción de la topología proteica a través de satisfacción de restricciones.Diseño de drogas.Predicción de alfa-hélices.Etc.
![Page 29: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/29.jpg)
Datamining
Análisis y exploración automática de grandes bases de
datos para extraer información útil y no evidente.
![Page 30: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/30.jpg)
Visualización
Junto con las técnicas de AA, la visualización es esencial para el
datamining.
![Page 31: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/31.jpg)
Entrada
Conceptos, Instancias y Atributos.
![Page 32: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/32.jpg)
¿Qué es un concepto?
Clasificación: Conocer todos los posibles ejemplos, conocidos o no, que existan para una clase.Asociación: Conocer asociaciones entre atributos que nos permita predecir un valor.
![Page 33: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/33.jpg)
¿Qué es un concepto?
Clustering: Grupos de ejemplos que tengan alguna asociación.Predicción numérica: Igual que la asociación, pero el valor que se desea predecir no es discreto sino numérico.
![Page 34: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/34.jpg)
Conclusiones sobre conceptos.
El concepto varía según lo que queremos aprender.El conjunto de ejemplos que elijamos determinará el concepto que aprenderá el algoritmo de aprendizaje automático.
![Page 35: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/35.jpg)
¿Qué es un ejemplo?
La entrada en una esquema de aprendizaje automático es un conjunto de instancias.Las instancias son cosas que queremos clasificar, asociar o clusterizar.Una instancia es un ejemplo individual e independiente de un concepto a aprender.
![Page 36: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/36.jpg)
Ejemplos de Ejemplos
Apariencia, Temperatura, Humedad, Ventoso, Jugar
Soleado Caliente Alta No NoSoleado Caliente Alta Si NoNublado Caliente Alta No SiLluvioso Medio Alta No SiLluvioso Frio Normal No SiLluvioso Frio Normal Si No
![Page 37: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/37.jpg)
Ejemplos de Ejemplos
Nublado Frio Normal Si SiSoleado Medio Alta No NoSoleado Frio Normal No SiLluvioso Medio Normal No SiSoleado Medio Normal Si SiNublado Medio Alta Si SiNublado Caliente Normal No SiLluvioso Medio Alta Si No
![Page 38: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/38.jpg)
¿Qué es un atributo?
Cada instancia individual e independiente que es entrada de un
algoritmo de aprendizaje automático esta caracterizado por
valores fijos ó atributos.
![Page 39: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/39.jpg)
Salida
Representación del Conocimiento
![Page 40: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/40.jpg)
Tablas de decisión
Si apariencia = soleado y humedad = alta entonces jugar.Si apariencia = lluvioso y vientoso entonces no jugar.Si apariencia = nublado entonces jugar.Si humedad = normal entonces jugar.Otro estado entonces jugar.
![Page 41: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/41.jpg)
Árboles de decisión.
Apariencia
Ventoso
Humedad
No Si
No
Si
Si
![Page 42: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/42.jpg)
Reglas de Clasificación
A
CB
C D
D
X
X
X
Ejemplos:Si A y B entonces XSi C y D entonces X
![Page 43: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/43.jpg)
Reglas de asociación
Si ventoso y no juego entonces.apariencia = soleado y humedad = alta.
![Page 44: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/44.jpg)
Otras formas...
![Page 45: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/45.jpg)
Espacio de Búsqueda
Una muestra con todos los ejemplos.
![Page 46: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/46.jpg)
Sesgo
Sesgo del lenguaje.Sesgo de la búsqueda.Sesgo para el sobre-aprendizaje.
![Page 47: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/47.jpg)
Credibilidad
Evaluando lo aprendido.
![Page 48: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/48.jpg)
Entrenando y probando.
Espacio de prueba vs. Muestra: Error. Porcentaje de errores cometidos en la
prueba. Tamaño de la muestra con respecto
al tamaño del espacio de prueba.
¡Comparar algoritmos!
![Page 49: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/49.jpg)
Validación cruzada
Objetivo: Conocer el error y sesgo del algoritmo a partir de una muestra.De un conjunto de ejemplo, dividir aleatoriamente en dos conjuntos: Prueba y Test.Obtener el error del algoritmo.
![Page 50: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/50.jpg)
Validación cruzada
Realizar los dos pasos anteriores varias veces.Cuando exista una suficiente cantidad de pruebas realizadas (>30 ?) se puede calcular el error medio y el sesgo que tiene el algoritmo para ese tipo de prueba.
![Page 51: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/51.jpg)
¿Preguntas?
![Page 52: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/52.jpg)
Referencias Programación
A Method of ProgrammingAutor: Edsger Dijkstra y W.H.J. FeijenEditorial: Addison-WesleyLógica para ComputaciónAutor: Francisco NaishtatEditorial: EUDEBA
![Page 53: Representación De La Información](https://reader035.vdocumento.com/reader035/viewer/2022062723/56813b48550346895da430a3/html5/thumbnails/53.jpg)
Referencias AA y Datamining
Mitchell, T. M. Machine learning, Boston, McGraw-Hill, 1997.Datamining, practical machine learning tools and techniques with JAVA implementatios. IAN H. WITTEN, EIBE FRANK. Mourgan Kaufmann. 1999.