ensayo mnist

5
Visión Artificial Nombre: Byron Montero Tema: Base de datos MNIST Introducción: La base de datos MNIST constituye un estándar a la hora de testear y comparar métodos de reconocimiento de dígitos manuscritos. La misma contiene 7000 imágenes de números escritos a mano que incluyen diferentes estilos de escritura, extraídos de un conjunto mucho mayor de patrones manuscritos provistos por NIST, National Institute of Standars and Technology, organismo que depende del Departamento de Comercio de los Estados Unidos. El nombre de la base proviene de Modified NIST. MNIST presenta dos conjuntos de patrones rotulados, uno de entrenamiento constituido por 60000 imágenes, y otro de testeo, de 1000 imágenes. Cada imagen presenta un tamaño de 28x28 pixeles y está representada en escala de grises de 256 valores. Esta base de datos es de acceso libre. Para obtener las imágenes, los patrones originales en blanco y negro fueron normalizados en tamaño a 20X20 pixeles, preservando su forma. Se obtienen imágenes en escala de grises que luego son centradas en patrones de tamaño 28x28. Desarrollo: La MNIST es una gran base de datos de dígitos escritos a mano que se utiliza comúnmente para el procesamiento de imágenes de sistemas. La base de datos también es ampliamente utilizado para el entrenamiento y las pruebas en el campo de aprendizaje automático . Fue hereda por "re- mezclar" las muestras de conjuntos de datos originales del NIST. Los creadores sintieron que la formación de datos del NIST fue tomada de American Bureau de Censos de los empleados, mientras que el conjunto de datos de prueba se tomó de los estudiantes estadounidenses de secundaria, el

Upload: byron-montero

Post on 03-Sep-2015

227 views

Category:

Documents


4 download

DESCRIPTION

Visión Artificial

TRANSCRIPT

Visin ArtificialNombre: Byron MonteroTema: Base de datos MNISTIntroduccin:La base de datos MNIST constituye un estndar a la hora de testear y comparar mtodos de reconocimiento de dgitos manuscritos. La misma contiene 7000 imgenes de nmeros escritos a mano que incluyen diferentes estilos de escritura, extrados de un conjunto mucho mayor de patrones manuscritos provistos por NIST, National Institute of Standars and Technology, organismo que depende del Departamento de Comercio de los Estados Unidos. El nombre de la base proviene de Modified NIST.MNIST presenta dos conjuntos de patrones rotulados, uno de entrenamiento constituido por 60000 imgenes, y otro de testeo, de 1000 imgenes. Cada imagen presenta un tamao de 28x28 pixeles y est representada en escala de grises de 256 valores. Esta base de datos es de acceso libre. Para obtener las imgenes, los patrones originales en blanco y negro fueron normalizados en tamao a 20X20 pixeles, preservando su forma. Se obtienen imgenes en escala de grises que luego son centradas en patrones de tamao 28x28.Desarrollo:LaMNISTes una granbase de datosde dgitos escritos a mano que se utiliza comnmente parael procesamiento de imgenesde sistemas.La base de datos tambin es ampliamente utilizado para el entrenamiento y las pruebas en el campo deaprendizaje automtico.Fue hereda por "re-mezclar" las muestras de conjuntos de datos originales del NIST.Los creadores sintieron que la formacin de datos del NIST fue tomada de AmericanBureau de Censos delos empleados, mientras que el conjunto de datos de prueba se tom delos estudiantes estadounidensesde secundaria, el conjunto completo de datos del NIST era demasiado duro.Por otra parte, las imgenes en blanco y negro de NIST senormalizarona caber en un cuadro de lmite de pxeles 20x20 ysuavizado, que introdujo los niveles de escala de grises. La base de datos contiene 60.000 imgenes de entrenamiento y 10.000 imgenes de prueba.La mitad del conjunto de entrenamiento y la mitad de la prueba establecidos se tomaron de la formacin de datos del NIST, mientras que la otra mitad del conjunto de entrenamiento y la otra mitad de la prueba establecido se tomaron conjunto de datos de las pruebas de NIST.Ha habido un nmero detrabajos cientficossobre los intentos de lograr la tasa de error ms baja, utilizando un sistema jerrquico delas redes neuronales convolucionales, se las arregla para conseguir unatasa de erroren la base de datos MNIST de 0,23 por ciento.Los creadores originales de la base de datos mantienen una lista de algunos de los mtodos probados en l.Conjunto de datos:El conjunto de imgenes en la base de datos MNIST es una combinacin de dos de las bases de datos del NIST: Base Especial 1 y base de datos especial 3. Base de datos especial 1 y base de datos especial 3 consisten de dgitos escritos por estudiantes de secundaria y empleados de laOficina del Censo de Estados Unidos, respectivamente.Rendimiento:Algunos investigadores han logrado "un rendimiento casi humano" en la base de datos MNIST, utilizando un conjunto de las redes neuronales;en el mismo artculo, los autores logran un rendimiento del doble que la de los seres humanos en otras tareas de reconocimiento. La tasa de error ms alto enumeradoen el sitio web original de la base de datos es de 12%, lo que se consigue sin procesamiento previo mediante unSVMcon una red neuronal 1-capa. Una tasa de error mejor de los casos de 0,42% se logr sobre la base de datos por los investigadores utilizando un nuevo clasificador llamado la lira, que es un clasificador neural con tres capas de neuronas basadas en principios perceptrn de Rosenblatt.Algunos investigadores han probado sistemas de inteligencia artificial utilizando la base de datos sometidos a distorsiones aleatorias.Los sistemas en estos casos son por lo general redes neuronales y las distorsiones tienden a ser utilizados ya seadistorsiones afinesodistorsiones elsticas. A veces, estos sistemas pueden ser muy exitoso;Uno de tales sistemas alcanz una tasa de error en la base de datos de 0,39%. En 2011, una tasa de error del 0,27%, mejorando el mejor resultado, fue informado por los investigadores que utilizan un sistema similar de las redes neuronales. En 2013, un enfoque basado en la regularizacin de las redes neuronales utilizando DropConnect ha sido reclamado para lograr una tasa de error de 0,21%.Clasificadores:Esta es una tabla de algunos de losmtodos de aprendizaje de mquinautilizados en la base de datos y sus tasas de error, por tipo de clasificador:

TipoClasificadorPreprocesamientoTasa de error (%)

Clasificador linealClasificador lineal por parejasRestablecimiento7,6[9]

K-vecinos ms cercanosK-NN con deformacin no lineal (P2DHMDM)Bordes desplazables0,52[14]

Tocones ImpulsadoProducto de tocones encuenta HaarHaar cuenta0.87[15]

No lineal clasificador40 PCA + clasificador cuadrticoNinguno3,3[9]

Soporte de mquinas de vectoresVirtualSVM, deg-9 poli, 2 pxeles jitteredRestablecimiento0,56[16]

Red neuronal6 capas NN 784-2500-2000-1500-1000-500-10 (enGPU), condistorsiones elsticasNinguno0,35[17]

Red neural convolucionalComit de 35 conv.red, 1-20-P-40-P-150-10, con distorsiones elsticasNormalizaciones Ancho0,23[8]

Conclusin: La base de datos MNIST es una herramienta poderosa en el rea de visin artificial ya que permite realizar mltiples aplicaciones de entrenamiento y reconocimiento, para obtener un menor error es necesario usar diferentes tipos de clasificadores los cuales facilitaran el aprendizaje de la mquina.Bibliografa: http://itzamna.bnct.ipn.mx:8080/dspace/bitstream/123456789/5586/1/APLICACIONMODELOS.pdf http://www.kurims.kyoto-u.ac.jp/EMIS/journals/RCE/body/v31n1a02SanchezOsorioSuarez.pdf http://dc.uba.ar/inv/tesis/doctorado/TesisDocLSeijas2011.pdf/at_download/file