1 - título: propiedades geométricas del diseño óptimo de...

23
Título: Propiedades geométricas del diseño óptimo de experimentos Title: Geometrical properties of optimum experimental design Tutor: Juan M. Rodríguez Díaz Resumen: El Diseño Óptimo de Experimentos es una disciplina relativamente joven, creada a principios del S. XX y que en los últimos tiempos está experimentando un enorme desarrollo. Existe un gran interés en encontrar los mejores puntos en los que tomar las observaciones para obtener unas estimaciones óptimas de los parámetros del modelo de regresión. Existen diversos criterios de optimización, algunos de ellos resultantes de las distintas maneras de minimizar la matriz de covarianzas de los estimadores. En varios casos existe una caracterización geométrica de los diseños óptimos, que puede ser aplicada en la búsqueda de los mismos. Este trabajo se ocupará de recopilar y describir adecuadamente esas situaciones, ilustrándolas con convenientes ejemplos. Bibliografía Atkinson A. C., Donev A. N. and Tobias R. D. (2007). Optimum Experimental Designs, with SAS. Oxford University Press. Box G. E. P. and Lucas H. L. (1959). Design of experiments in nonlinear situations. Biometrika 46, 77-90. Elfving, G. (1952). Optimum allocation in linear regression theory. Ann. Math. Statist. 23, 255-262. López-Fidalgo, J. and Rodríguez-Díaz, J.M. (2004). Elfving method for computing c-optimal designs in more than two dimensions. Metrika, 59, 235- 244. Tipo: Trabajo de revisión e investigación bibliográfica Modalidad: Específico (un solo estudiante) Área: Estadística e Investigación Operativa Requisitos: Haber cursado el Taller ‘Diseño óptimo de experimentos’, de 4º curso del grado, o al menos tener una cierta base de conocimientos sobre la materia. 1 -

Upload: others

Post on 22-Jul-2020

12 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

Título: Propiedades geométricas del diseño óptimo de experimentos

Title: Geometrical properties of optimum experimental design

Tutor: Juan M. Rodríguez Díaz

Resumen:

El Diseño Óptimo de Experimentos es una disciplina relativamente joven, creada a principios del S. XX y que en los últimos tiempos está experimentando un enorme desarrollo. Existe un gran interés en encontrar los mejores puntos en los que tomar las observaciones para obtener unas estimaciones óptimas de los parámetros del modelo de regresión. Existen diversos criterios de optimización, algunos de ellos resultantes de las distintas maneras de minimizar la matriz de covarianzas de los estimadores. En varios casos existe una caracterización geométrica de los diseños óptimos, que puede ser aplicada en la búsqueda de los mismos. Este trabajo se ocupará de recopilar y describir adecuadamente esas situaciones, ilustrándolas con convenientes ejemplos.

Bibliografía

• Atkinson A. C., Donev A. N. and Tobias R. D. (2007). Optimum ExperimentalDesigns, with SAS. Oxford University Press.

• Box G. E. P. and Lucas H. L. (1959). Design of experiments in nonlinearsituations. Biometrika 46, 77-90.

• Elfving, G. (1952). Optimum allocation in linear regression theory. Ann. Math.Statist. 23, 255-262.

• López-Fidalgo, J. and Rodríguez-Díaz, J.M. (2004). Elfving method forcomputing c-optimal designs in more than two dimensions. Metrika, 59, 235-244.

Tipo: Trabajo de revisión e investigación bibliográfica

Modalidad: Específico (un solo estudiante)

Área: Estadística e Investigación Operativa

Requisitos: Haber cursado el Taller ‘Diseño óptimo de experimentos’, de 4º curso del grado, o al menos tener una cierta base de conocimientos sobre la materia.

1 -

Page 2: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

Título: Eficiencia de estimadores de modelos de regresión suponiendo independencia cuando en realidad las observaciones podrían estar correladas

Title: Efficiency of regression models estimators assuming independent observations when this assumption may be wrong

Tutor: Juan M. Rodríguez Díaz

Resumen:

En el estudio de fenómenos y experimentos la hipótesis habitual es que las observaciones son independientes, y a partir de esta idea se obtienen los correspondientes estimadores de los parámetros del modelo que describe el fenómeno. Sin embargo, en numerosas ocasiones esta hipótesis no es cierta, y como consecuencia los estimadores anteriores ya no serían los más adecuados. Se investigará en qué medida ocurre este hecho, es decir, la pérdida de eficiencia de los estimadores obtenidos bajo la hipótesis de independencia cuando las observaciones están relacionadas, para distintos modelos de regresión y diferentes estructuras de covarianza entre las observaciones. En particular, el ‘intercept only model’ será exhaustivamente estudiado.

Bibliografía

• Atkinson A. C., Donev A. N. and Tobias R. D. (2007). Optimum ExperimentalDesigns, with SAS. Oxford University Press.

• Smit J.C. (1961)Estimation of the mean of a stationary stochastic process byequidistant observations. Trabajos de Estadística 12, 35-45.

• Stehlik M. (2006). The D-optimal design for regression experiments withcorrelated errors. Research Report Series of the Department of Statistics andMathematics, Wirtschaftsuniversit\”at Wien, Austria

Tipo: Trabajo de revisión bibliográfica e investigación

Modalidad: Específico (un solo estudiante)

Área: Estadística e Investigación Operativa

Requisitos: Haber cursado el Taller ‘Diseño óptimo de experimentos’, de 4º curso del grado, o al menos tener una cierta base de conocimientos sobre la materia.

2 -

Page 3: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

*DEPARTAMENTO DE ESTADÍSTICA

PROPUESTA DE TRABAJO FIN DE GRADO

GRADO EN ESTADÍSTICA

CURSO 2019/2020

Página 1 de 1

Facultad de Ciencias, Plaza de los Caídos, S/N. 37008 Salamanca, España Telf.: + 34 923294451, Fax: + 34 923294514 Web: http://ciencias.usal.es , Email: [email protected]

Tutora: MARÍA TERESA CABERO MORÁN

Título en español: VALIDACIÓN EN ALGORITMOS DE CLUSTERING

Título en inglés: VALIDATION FOR CLUSTER ANALYSIS

Descripción del trabajo: Para poder extrapolar un patrón obtenido mediante un algoritmo de clustering a otros individuos, que se encuentren en otra base de datos, es necesario poder validar dicho modelo mediante procedimientos estadísticos. Cuando la técnica dada es no supervisada, como es el caso de estos algoritmos, se convierte en un tema difícil. Este trabajo presentará una forma de subsanar ese problema, planteando un método para poder validar los cluster que se obtienen. Se hará una aplicación práctica para mostrar cómo funciona.

Áreas de conocimiento preferente y afín: Estadística e Investigación Operativa.

Asignaturas del Grado con las que está directamente relacionado: Explotación Estadística de Almacenes de Datos y Técnicas Estadísticas en Minería de Datos.

Tipo: 1 (“Trabajos experimentales relacionados con la titulación y ofertados por los docentes que participan en el título”) (Artículo 3 del Reglamento de TFG de la Universidad de Salamanca).

Modalidad: 2 (específico), ofertado para la realización por un único estudiante (Artículo 3 del Reglamento de TFG de la Universidad de Salamanca).

• Específico

• General Nº de alumnos:

Citas bibliográficas:

HERNÁNDEZ ORALLO, J., RAMÍREZ, M.J. y FERRI, C. (2004): “Introducción a la Minería de Datos”, Editorial Pearson. Madrid.

TRUJILLO, J.C., MAZÓN, J.N. y PARDILLO, J. (2011): “Diseño y explotación de almacenes de datos. Conceptos básicos de modelado multidimensional”, Editorial Club Universitario. Alicante.

X

3 -

Page 4: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

*DEPARTAMENTO DE ---ESTADÍSTICA--

PROPUESTA DE TRABAJO FIN DE GRADO

GRADO EN ESTADÍSTICA

CURSO 2019/2020

Página 1 de 3

Facultad de Ciencias, Plaza de los Caídos, S/N. 37008 Salamanca, España Telf.: + 34 923294451, Fax: + 34 923294514 Web: http://ciencias.usal.es , Email: [email protected]

1. Título: ALGUNAS CARACTERÍSTICAS DE LAS OFERTAS DE TRABAJO EN INTERNET.

Some characteristics of work online offers.

2. Tutor: ÁNGEL ALCALÁ HERNÁNDEZ

Descripción del trabajo.:

El trabajo que se propone consiste en encontrar y analizar las características más sobresalientes de las ofertas de trabajo que aparecen en las diferentes páginas Web, principalmente Infojobs. Empleando análisis tanto descriptivos como inferenciales de las diferentes ofertas, en este caso, será necesario utilizar el Método de Muestreo más adecuado, así como la utilización de los estimadores que lleven a los mejores resultados posibles. El estudio se puede realizar en diferentes ámbitos geográficos, España, comunidades autónomas, provincias, así como comparaciones entre ellas. También es posible estudiar las características de las ofertas según la categoría de las mismas, comerciales, dependientes, ingenieros, etc., y en definitiva emplear cualquier filtro, de los que se utilizan en dichas páginas, para elegir un tipo determinado de oferta laboral a estudiar. El procedimiento más sencillo de muestreo a utilizar en estos casos es el Muestreo Sistemático, pero en cualquier caso necesitamos un tamaño de muestra suficiente, lo cual significa un esfuerzo considerable. Las principales dificultades que podemos tener es la falta de homogeneidad en la presentación de la información de las ofertas, incluso dentro de las mismas páginas web, como consecuencia nos veremos obligados a uniformar estos datos con cierta subjetividad, con la consiguiente pérdida de calidad. El alumno debe manejar Estadística Descriptiva y los diferentes Métodos de Muestreo, así como los estimadores más habituales en cada caso.

Área: ESTADÍSTICA E INVESTIGACIÓN OPERATIVA.

Asignaturas: Estadística Descriptiva, Muestreo Estadístico y Ampliación de Muestreo Estadístico

Tipo: 1

Modalidad: 2 (un alumno)

4 -

Page 5: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

*DEPARTAMENTO DE ---ESTADÍSTICA--

PROPUESTA DE TRABAJO FIN DE GRADO

GRADO EN ESTADÍSTICA

CURSO 2019/2020

Página 2 de 3

Facultad de Ciencias, Plaza de los Caídos, S/N. 37008 Salamanca, España Telf.: + 34 923294451, Fax: + 34 923294514 Web: http://ciencias.usal.es , Email: [email protected]

Tipo: 1

Modalidad: 2

Tipo:

Modalidad:

• Específico

Page 6: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

*DEPARTAMENTO DE ESTADÍSTICA

PROPUESTA DE TRABAJO FIN DE GRADO

GRADO EN ESTADÍSTICA---------------------------------- CURSO 2019/2020

Página 1 de 1

Facultad de Ciencias, Plaza de los Caídos, S/N. 37008 Salamanca, España Telf.: + 34 923294451, Fax: + 34 923294514 Web: http://ciencias.usal.es , Email: [email protected]

Título: Técnicas de Detección de Datos Atípicos / Outlier Detection Techniques

Tutor: Rosa A. Sepúlveda Correa.

Descripción del trabajo: El análisis de la calidad de los datos es de gran importancia, ya que datos con problemas pueden conducir a

decisiones erróneas. Entre los posibles problemas que pueden presentar los datos, se encuentran los conocidos

como valores atípicos (outliers). Según Hawkins (1980), la definición intuitiva de un valor atípico sería "una

observación que se desvía tanto de otras observaciones como para suscitar sospechas de que fue generada por un

mecanismo diferente".

Los métodos de detección de valores atípicos se pueden dividir en univariantes y multivariantes, siendo estos

últimos los más útiles dada la masificación de información producida en la actualidad. Algunos autores (Ben-Gal,

2010) también diferencian entre técnicas de detección paramétricas y no paramétricas.

El trabajo de fin de grado consistirá en realizar una revisión de la literatura especializada, para estudiar los

distintos métodos para detectar puntos atípicos, y realizar un estudio comparativo aplicando estas técnicas a

diferentes conjuntos de datos.

Área de conocimiento preferente: 265 Estadística e Investigación Operativa.

Área de conocimiento afín: No hay (Según documento Consejo de Gobierno de 26 de julio de 2012).

Asignatura del grado relacionada: Estadística Descriptiva / Lenguajes de Programación / Análisis Multivariante / Técnicas Estadísticas en Minería de Datos

Tipo: Trabajo de revisión bibliográfica e investigación.

Modalidad: Específico, se oferta para que lo realice un único estudiante.

Citas bibliográficas:

Hawkins, D. M. (1980). Identification of Outliers. London: Chapman & Hall.

Ben-Gal, I. (2010). Outlier detection. En Maimon O. and Rockach L. (Eds.) Data Mining and Knowledge Discovery Handbook: A Complete Guide for Practitioners and Researchers (2 ed.). New York: Springer.

5-

Page 7: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

Tutor académico. Ana Belén Nieto Librero y Nerea González García

Título. Análisis de campañas políticas mediante minería de texto

Political campaigns analysis using text mining

Descripción.

La minería de textos es un campo reciente en el análisis de datos, cuyo objetivo principal

consiste en la búsqueda de patrones a partir de documentos no estructurados; esto es,

haciendo uso de colecciones de texto como información de partida. Entre sus principales

ámbitos de aplicación destacan la detección de fraude o el análisis de tendencias en redes

sociales junto con el análisis de sentimiento. En este trabajo se realizará una aplicación

práctica para análisis de texto en el ámbito de las campañas políticas, haciendo uso de las

principales técnicas multivariantes de la minería de textos.

Área de conocimiento. Estadística e Investigación operativa

Asignaturas del grado con las que está relacionado. Análisis multivariante

Tipo y modalidad. Trabajo experimental

Bibliografía.

Aggarwal, C. C., & Zhai, C. (2012). Mining text data. Springer Science & Business

Media.

Feldman, R., & Sanger, J. (2007). The text mining handbook: advanced approaches in

analyzing unstructured data. Cambridge university press.

Silge, J., & Robinson, D. (2017). Text mining with R: A tidy approach. O'Reilly Media.

Song, M., Kim, M. C., & Jeong, Y. K. (2014). Analyzing the political landscape of 2012

Korean presidential election in Twitter. IEEE Intelligent Systems, 29(2), 18-26.

Vergeer, M. (2015). Twitter and political campaigning. Sociology Compass, 9(9), 745-

760.

6 -

Page 8: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

DEPARTAMENTO DE ESTADÍSTICA

PROPUESTA DE TRABAJO FIN DE GRADO

GRADO EN ESTADÍSTICA

CURSO 2019/2020

Página 1 de 1

Facultad de Ciencias, Plaza de los Caídos, S/N. 37008 Salamanca, España Telf.: + 34 923294451, Fax: + 34 923294514 Web: http://ciencias.usal.es , Email: [email protected]

Título: Aplicaciones de las redes neuronales avanzadas al campo biomédico Title: Applications of advanced neural networks to the biomedical field

Tutor: Quintín Martín Martín

Cotutor:

Descripción del trabajo:

En este trabajo el alumno deberá adentrarse en el conocimiento de las redes neuronales artificiales básicas (perceptrón, FBR, etc.) y avanzadas (convolucionales, de creencia, generativas, Kohonen, etc.). La utilización de redes neuronales artificiales en el campo de la medicina cada vez se amplía más. Se trabajará con las redes neuronales que predigan o clasifiquen un suceso (perceptrón multicapa) y con las que nos ayuden al reconocimiento de imágenes (redes neuronales avanzadas).

Asignaturas del Grado con las que está relacionado: Estadística, Análisis Matemático e Informática.

Tipo: Trabajo teórico experimental

Modalidad: Específica

Nº de alumnos: 1

Bibliografía:

Dybowski, R. & Gant, V. Clinical Applications of Artificial Neural Networks. Cambridge University Press, Cambridge 2001. Yihan Deng, Andre Sander, Lukas Faulstich, Kerstin Denecke. Towards automatic encoding of medical procedures using convolutional neural networks and autoencoders. Artificial Intelligence In Medicine. 2019, 93, 29–42

7-

Page 9: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

Tutor académico: José Manuel Sánchez Santos, Dpto. Estadística, Fac. Ciencias, Usal.

Título en español: Informes estadísticos con R Markdown: aplicación en informes de búsqueda de genes diferencialmente expresados en pacientes con Alzheimer.

Título en inglés: Statistical reports with R Markdown: application in search reports of differentially expressed genes in Alzheimer's patients.

Descripción (no menos de 500 caracteres, incluidos espacios):

A medida que el software estadístico R (https://www.r-project.org/) ha incrementado su utilización en todo tipo de campos, se ha hecho patente la necesidad de generar informes estadísticos claros, dinámicos y elegantes en todo tipo de formato informático (word, pdf, html, etc.) ya que hasta hace unos años dichos informes se generaban en texto plano sin formato, obtenido directamente de la consola del software R.

El principal objetivo del trabajo es el de recopilar, exponer y detallar las funciones más importantes del paquete “rmarkdown” de R (https://rmarkdown.rstudio.com/), que es una herramienta para la creación de ficheros *.Rmd que, mediante el lenguaje “markdown”, facilitan la aplicación de un formato claro y elegante a los informes estadísticos que se crean con R.

Como aplicación se utilizará dicho paquete para la elaboración de informes sobre la búsqueda y el análisis de genes que presenten diferencias significativas en sus señales de intensidad génica en microarrays de individuos sanos frente a microarrays de pacientes con Alzheimer. Para ello se utilizará la herramienta “SAM” (significance analisys of microarray) como generalización del contraste clásico de la t de Student. Se usarán datos de microarrays extraídos de bases de datos publicadas y herramientas de Bioconductor y R-project. Para el desarrollo del proyecto se utilizará el software estadístico R y la interfaz RStudio.

Área de conocimiento: Estadística e Investigación Operativa.

Asignaturas del grado con las que está directamente relacionado: Estadística descriptiva, Estadística no paramétrica, Técnicas estadísticas en bioinformática.

Tipo y modalidad (según se indica en el Art. 3 del Reglamento de TFG de la Universidad): 4 y específico.

Citas bibliográficas:

Allaire, J. J., Cheng, J., Xie, Y., McPherson, J., Chang, W., Allen, J., ... & Arslan, R. (2016). rmarkdown: Dynamic Documents for R. R package version 0.9, 5.

Chu, G., Narasimhan, B., Tibshirani, R., & Tusher, V. (2002). SAM Significance Analysis of Microarrays-Users guide and technical document. Stanford University.

8 -

Page 10: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

GRADO EN ESTADISTICA TRABAJO FIN DE GRADO - CURSO 2019-2020

Tutor académico: María Jesús Rivas López, Dpto. Estadística, Fac. Ciencias, USAL.

Título en español: Matriz de información parcial para el modelo de Cox con censura tipo I.

Título en inglés: Partial information matrix for the Cox model with type I censoring.

Descripción (no menos de 500 caracteres, incluidos espacios):

En un estudio de supervivencia, el tiempo hasta la ocurrencia de un suceso puede presentar censura por la derecha debido al abandono o por finalización del estudio. Esta situación se modeliza frecuentemente mediante el modelo de riesgos proporcionales de Cox, que permite la inclusión de covariables controlables que influyen en la supervivencia. Cuando el modelo es para ajustar unos datos observados, los tiempos de supervivencia o censura son conocidos. En cambio, en la fase del diseño experimental, no se conocen ni los tiempos de ocurrencia del suceso ni si serán o no censurados. Podría considerarse por tanto que el “tiempo de abandono” es una variable aleatoria con cierta función de probabilidad, en principio independiente del “tiempo hasta la ocurrencia del suceso”. Para la estimación de los parámetros del modelo de Cox se utiliza una función de verosimilitud parcial, en vez de la función de verosimilitud habitual. En este trabajo se pretende construir una matriz de información asociada a dicha función de verosimilitud parcial para poder utilizarla para hallar diseños óptimos.

Área de conocimiento: Estadística e Investigación Operativa.

Asignaturas del grado con las que está directamente relacionado: Diseño de Experimentos, Diseño óptimo de experimentos. Estadística médica.

Tipo y modalidad: Trabajo teórico-experimental y específico.

Citas bibliográficas:

Atkinson A.C., D. A. (1992). Optimum Experimental Desings. New York: Oxford Science publications.

Cox, D., 1975. Partial likelihood. Biometrika 62, 269–276.

López Fidalgo, J., Rivas-López, M., del Campo, R., 2009. Optimal designs for Cox regression. Statistica Neerlandica 63, 135–148.

Rivas-Lopez, M. J. ; López, J. F. , 2014, Optimal experimental designs for partial likelihood information. Computational statistics & data analysis, C/71, 859- 867.

Rodríguez Torreblanca C., O. R. (1999). Diseño Óptimo de Experimentos para Modelos de Regresión. UNIVERSIDAD DE ALMERIA. SERVICIO DE PUBLICACIONES.

9 -

Page 11: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

GRADO EN ESTADISTICA TRABAJO FIN DE GRADO - CURSO 2019-2020

Tutor académico: María Jesús Rivas López, Dpto. Estadística, Fac. Ciencias, USAL.

Título en español: Construcción matemática de un espacio probabilístico unidimensional.

Título en inglés: Mathematical construction of a one-dimensional probabilistic space.

Descripción (no menos de 500 caracteres, incluidos espacios):

El trabajo consistirá en el estudio del marco teórico subyacente a la construcción de un espacio probabilídtico. Así, a partir de un conjunto, se definirá la noción de sigma-álgebra de conjuntos, llegando a la noción de espacio de medida y la consiguiente definición axiomática de probabilidad de Kolmogorov. Se pasará al concepto de variable aleatoria y su caracterización a través del tipo de medida que inducen y se llegará al concento de función de distribución asociada a una medida probabilista.

Tras la construcción de la integral de Lebesgue en espacios de medida aparece el Teorema de Radon-Nikodym y la noción de función densidad de una medida. Lo que dará paso a la clasificación de las variables aleatorias.

Área de conocimiento: Estadística e Investigación Operativa.

Asignaturas del grado con las que está directamente relacionado: Cálculo de Probabilidades, Análisis matemático.

Tipo y modalidad: Trabajo teórico-experimental y específico.

Citas bibliográficas:

R. Ash. Probability and Measure Theory. Academic Press, 2000.

Hernández, V., Romo, J. J., & Ibarrola, R. V. (1989). Problemas y ejercicios de teoría de la probabilidad. Universidad Nacional de Educación a Distancia.

Ibarrola, P. Pardo. "L. y Quesada, V.(1997)." Teoría de la Probabilidad. Síntesis.

J. Villarroel, M.J. Rivas, R. Ardanuy. (2002)Teoría de la probabilidad y medida, Ed. Hespérides

10 -

Page 12: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

GRADO EN ESTADISTICA TRABAJO FIN DE GRADO - CURSO 2019-2020

Tutor académico: María Jesús Rivas López, Dpto. Estadística, Fac. Ciencias, USAL.

Título en español: Diseño D-óptimo para la ecuación de Westley de las reacciones enzimáticas con inhibición por exceso de sustrato.

Título en inglés: D- Optimal design for Westley equation in enzymatic reactions with excess of substrate inhibition.

Descripción (no menos de 500 caracteres, incluidos espacios):

Lo habitual en una reacción enzimática es que aumentando la cantidad de sustrato se consiga un aumento de la cantidad de producto. Existen, sin embargo, reacciones enzimáticas que presentan inhibición por exceso de sustrato consistente en que, a partir de cierta concentración de sustrato, el proceso presenta inhibición. El trabajo consiste en el estudio de las técnicas de diseño óptimo de experimentos para modelos no lineales, particularizar al caso de la Dóptimizacióin, y su posterior aplicación a la estimación de forma precisa de los distintos parámetros que aparecen en la ecuación de Westley, que más utilizada a la hora de modelar las reacciones enzimáticas que presentan este tipo de inhibición.

Área de conocimiento: Estadística e Investigación Operativa.

Asignaturas del grado con las que está directamente relacionado: Diseño de Experimentos, Diseño óptimo de experimentos.

Tipo y modalidad: Trabajo teórico-experimental y específico.

Citas bibliográficas:

Atkinson A.C., D. A. (1992). Optimum Experimental Desings. New York: Oxford Science publications.

Lizcano, J. T. (2000). Time-dependent activation of the semicarbazide-sensitive amine oxidasa (SSAO)from ox lung microsomes. Biochem. J. 351, 789-794.

Lopez–Fidalgo J., W. W. (2002). Optimal Designs for the Michaelis–Menten Model. Journal of Theoretical Biology 215, 1-11.

Rodríguez Torreblanca C., O. R. (1999). Diseño Óptimo de Experimentos para Modelos de Regresión. UNIVERSIDAD DE ALMERIA. SERVICIO DE PUBLICACIONES.

Varón Castellanos, J. T. (1985). Estudio cinético de la fase de transición del mecanismo de MichaeliS'Menten con inhibición por exceso de sustrato. . ANALES DE CIENCIAS. VOL. XLIV. NUMS. I - 4. , 21-24.

Westley, J. (1969). Enzymic Catalysis. . New York.: Harper & Row.

11 -

Page 13: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

PROPUESTAS TRABAJOS FIN DE GRADO

Grado en Estadística (curso 2019-20)

Título: Inversas generalizadas de operadores lineales y su aplicación a la Estadística Tutores: Arturo Álvarez Vázquez y Antonio López Almorox Área de conocimiento preferente: Geometría y Topología Área de conocimiento afín: Estadística e Investigación Operativa Tipo: Trabajo de revisión e investigación bibliográfica Modalidad: Específico (un solo estudiante)

Descripción. El concepto de inversa generalizada de una transformación lineal no invertible aparece en los trabajos de Moore, Tseng y Penrose de la primera mitad del siglo pasado permitiendo con ello formular, de una manera geométrica muy sencilla, la estimación insesgada por mínimos cuadrados que aparecen en los modelos de regresión lineal. Posteriormente se han generalizado estas ideas a situaciones no euclídeas mediante el uso de diferentes tipos de proyectores lineales o mediante la descomposición en valores singulares de un operador lineal, apareciendo nuevos tipos de inversas generalizadas (pseudo-inversas de Rao, g-inversa de Mitra, inversas de Drazin, etc.) que han sido utilizadas con éxito en el análisis de ciertos aspectos de la regresión estadística o en problemas relativos al análisis de la varianza entre otras muchas de sus aplicaciones. El trabajo fin de grado que se propone es un trabajo de revisión bibliográfica e investigación sobre los aspectos geométricos y algebraicos subyacentes a la teoría de los proyectores lineales en dimensión finita y su relación con los diferentes tipos de inversas generalizadas asociados que aparecen en Estadística. El estudiante deberá también analizar los diferentes algoritmos de cálculo de estas pseudoinversas que aparecen en la literatura. Sin embargo, el objetivo principal de este trabajo será la aplicación de estos resultados teóricos a la Estadística (análisis multivariante). Aplicaciones que el estudiante deberá saber buscar y abordar a partir de la bibliografía básica existente.

Referencias:

- Adi Ben-Israel y Thomas N.E. Greville: ‘’Generalized Inverses. Theory andApplications” CMB in Mathematis. 2ªedición. Springer. 2003.

- K.P.S. Bhaskara Rao: “The Theory of Generalized Inverses Over CommutativeRings” .Taylor and Francis Ed. 2002.

- Randall E. Cline: ”Elements of the Theory of Generalized Inverses for Matrices”UMAP. 1979.

- Robert Piziak y P. L. Odell: “Matrix Theory From Generalized Inverses to JordanForm”. Chapman & Hall. 2007

12 -

Page 14: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

- Stephen L. Campbell Carl D. Meyer. “Generalized Inverses of LinearTransformations”. SIAM. Dover Publications. 2009.

- Haruo Yanai , Kei Takeuchi y Yoshio Takane : “ Projection Matrices, GeneralizedInverse Matrices, and Singular Value Decomposition”. Springer 2011.

Page 15: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

PROPUESTAS TRABAJOS FIN DE GRADO

Grado en Estadística (curso 2019-20)

Título: Algebra tensorial para espacios vectoriales (Tensor algebra for vector spaces) Tutores: Arturo Álvarez Vázquez y Antonio López Almorox Área de conocimiento preferente: Geometría y Topología Área de conocimiento afín: Estadística e Investigación Operativa Tipo: Ampliación de los conocimientos de álgebra lineal Modalidad: Específico (un solo estudiante)

Descripción. Este trabajo fin de grado pretende dar continuación y aplicación a los conocimientos adquiridos en la asignatura ALGEBRA LINEAL del primer curso del grado de estadística. En este curso se han estudiado los rudimentos de los espacios vectoriales, bases, coordenadas, aplicaciones lineales.

El álgebra tensorial, es decir, los tensores definidos sobre un espacio vectorial junto con su producto tensorial un interés intrínseco como objeto matemático. Pero además tiene un uso generalizado en amplias regiones de la física teórica, como la física cuántica, relatividad, … Es más, los tensores fueron introducidos a principios de siglo en el contexto de la física: se descubrió que ciertas teorías físicas tienen unas formulaciones naturales, adecuadas en términos de tensores.

Este TFG tendrá solamente un carácter matemático. El alumno comenzará estudiando la noción axiomática de álgebra en matemáticas. Posteriormente, teniendo presente la noción de aplicación lineal para espacios vectoriales se introducirán las formas lineales y las aplicaciones multilineales coovariantes y contravariante para un espacio vectorial. Se definirá tensor p-coovariante y q-contravariante. Se introducirá el producto tensorial de dos tensores así quedará establecido el álgebra tensorial en un espacio vectorial. Se verá como las aplicaciones líneales entre espacios vectoriales dan lugar morfismos entre sus álgebras tensoriales respectivas. Además, dada una base en el espacio vectorial generará una base para el álgebra tensorial, se estudiarán fórmulas para el cambio de base en tensores.

Una vez introducida de manera general esta álgebra se introducirán y tendrán en cuenta de una manera más especial los tensores simétricos y hemisimétricos. De esta manera dará lugar al estudio de las métricas simétricas y el álgebra exterior, apareciendo de una manera natural la noción de determinante de un endomorfismo de un espacio vectorial y sus propiedades.

BIBLIOGRAFÍA

Serge Lang. Algebra (2005) Springer Verlag.

Daniel Hernández Ruiperez. Algebra lineal. (1990) Universidad de Salamanca.

13 -

Page 16: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

*DEPARTAMENTO DE MATEMÁTICA APLICADA

PROPUESTA DE TRABAJO FIN DE GRADO

GRADO EN ESTADÍSTICA

CURSO 2019/2020

Página 1 de 4

Facultad de Ciencias, Plaza de los Caídos, S/N. 37008 Salamanca, España Telf.: + 34 923294451, Fax: + 34 923294514 Web: http://ciencias.usal.es , Email: [email protected]

Título: Análisis de modelos de redes aleatorias

Área de Conocimiento: Matemática Aplicada

Tutores: Ángel Martín del Rey

Descripción del trabajo: El Análisis de Redes Complejas es una disciplina relativamente reciente que nace como herramienta utilizada por antropólogos y sociólogos para el estudio de las estructuras sociales y culturales. Posteriormente atrajo la atención de investigadores de disciplinas más técnicas debido al uso natural de la Teoría de Grafos para fundamentar matemáticamente los conceptos empleados, y al empleo de las Ciencias de la Computación para el procesamiento masivo y visualización de la gran cantidad de datos que se pueden emplear en algunas de sus aplicaciones.

Entre los diferentes tipos de redes, tienen especial importancia las redes aleatorias no sólo por su caracterización matemática y estadística sino por la gran cantidad de ámbitos de aplicación en donde aparecen.

El objetivo de este trabajo es definir y presentar las principales propiedades de este modelo de redes complejas, centrando especialmente la atención en el modelo de Erdös y Renyi. Asimismo, se detallarán los principales algoritmos de construcción de las citadas redes y sus aplicaciones más importantes.

Áreas de conocimiento: Matemática Aplicada (preferente), Estadística e Investigación Operativa (afín).

Asignaturas del grado con las que está relacionado: Investigación Operativa, Cálculo de Probabilidades y Procesos Estocásticos.

Bibliografía:

G. Chen, X. Wang, X. Li, Fundamentals of Complex Networks. Models, Structures and Dynamics, Wiley, 2015.

S. Havlin, R. Cohen, Complex Networks. Structure, Robustness and Function, Cambridge University Press,2010.

14-

Page 17: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

*DEPARTAMENTO DE MATEMÁTICA APLICADA

PROPUESTA DE TRABAJO FIN DE GRADO

GRADO EN ESTADÍSTICA

CURSO 2019/2020

Página 2 de 4

Facultad de Ciencias, Plaza de los Caídos, S/N. 37008 Salamanca, España Telf.: + 34 923294451, Fax: + 34 923294514 Web: http://ciencias.usal.es , Email: [email protected]

E.D. Kolaczyk, Statistical Analysis of Network Data, Springer Series in Statistics, Springer Science+BusinessMedia, 2009.

Tipo: 1

Modalidad: Teórico-experimental

Tipo: 1

Modalidad:

• Específico

• General Nº de alumnos :

X

Page 18: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

*DEPARTAMENTO DE MATEMÁTICA APLICADA

PROPUESTA DE TRABAJO FIN DE GRADO

GRADO EN ESTADÍSTICA

CURSO 2019/2020

Página 3 de 4

Facultad de Ciencias, Plaza de los Caídos, S/N. 37008 Salamanca, España Telf.: + 34 923294451, Fax: + 34 923294514 Web: http://ciencias.usal.es , Email: [email protected]

Título: Generación de secuencias pseudoaleatorias de bits de uso en criptografía

Área de Conocimiento: Matemática Aplicada

Tutor: Ángel Martín del Rey

Descripción del trabajo:

La generación de secuencias pseudoaleatorias de bits juega un papel fundamental en el diseño de criptosistemas de clave secreta (criptosistemas de cifrado en flujo y cifrado en bloque). Para determinar si un determinado algoritmo produce secuencias de bits con buenas propiedades criptográficas es necesario aplicar una batería de tests estadísticos que determinan su calidad.

El objetivo de este trabajo fin de grado es realizar un análisis detallado de los principales generadores pseudoaleatorios de bits junto con las técnicas estadísticas utilizadas para la determinación de la calidad de las secuencias producidas

Áreas de conocimiento: Matemática Aplicada (preferente), Estadística e Investigación Operativa (afín).

Asignaturas del grado con las que está relacionado: Estadística Matemática, Álgebra Lineal.

Bibliografía:

L. Bassham, A. Rukhin, J. Soto, J. Nechvatal, M. Smid, E. Barker, S. Leigh, M. Levenson, M. Vangel, D. Banks,N. Heckert, J. Dray, A Statistical Test Suite for the Validation of Random Number Generators and PseudoRandom Number Generators for Cryptographic Applications, NIST SP 800-22rev1a (dated April 2010).

A. Menezes, Handbook of Applied Cryptography, CRC Press, 2001.

Tipo: 1

Modalidad: Teórico-experimental

15 -

Page 19: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

*DEPARTAMENTO DE MATEMÁTICA APLICADA

PROPUESTA DE TRABAJO FIN DE GRADO

GRADO EN ESTADÍSTICA

CURSO 2019/2020

Página 4 de 4

Facultad de Ciencias, Plaza de los Caídos, S/N. 37008 Salamanca, España Telf.: + 34 923294451, Fax: + 34 923294514 Web: http://ciencias.usal.es , Email: [email protected]

Tipo: 1

Modalidad:

• Específico

• General Nº de alumnos :

X

Page 20: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

PROPUESTAS TRABAJOS FIN DE GRADO Curso 2019/2020.

Grado en Estadística

16 - Título: Cálculo integral estocástico múltiple

Tutor: Ángel Tocino

Área de conocimiento preferente: Análisis Matemático

Área de conocimiento afín: Estadística e Investigación Operativa

Tipo: Trabajo de revisión e investigación bibliográfica.

Modalidad: Específico (1 estudiante)

Asignaturas del grado directamente relacionadas con la propuesta: Análisis Matemático, Procesos estocásticos orientados a las finanzas.

Citas bibliográficas (al menos 2):

• Kloeden, P. E.; Platen, E., Numerical Solution of Stochastic Differential Equations. Springer‐Verlag 1992

• Wolfram, S., The Mathematica Book, Wolfram Media, Inc., 2003.

Descripción:

Se recordará el cálculo integral múltiple ordinario. Se definirá el concepto de integral de Itô y se estudiarán sus propiedades fundamentales. También se definirán integrales múltiples y en el caso de que el integrando sea constante e igual a 1 se analizarán las relaciones entre ellas, elaborando mediante algún programa de cálculo simbólico como Mathematica rutinas para obtener de modo sistemático estos resultados.

Page 21: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

17.- Título del trabajo: El cálculo del tamaño muestral en diseño de experimentos biológicos. Nombre del tutor o tutores: José Luis Vicente Villardón. Grado para el que se oferta el trabajo (Estadística) Descripción del trabajo: Una de las cuestiones importantes, y muchas veces olvidada, en el diseño de experimentos biológicos es determinar el número de observaciones necesario para sacar conclusiones con la suficiente precisión y confianza. El tamaño muestral depende de muchos factores entre los que se incluyen el tipo de experimento, la forma en la que se lleva acabo, los recursos disponibles y la precisión y confianza requeridas. El trabajo consistiría en una revisión general de los métodos o bien en una revisión de la utilización de éstos en un campo concreto y en la realización de un protocolo aplicable a proyectos de experimentación en Biología, especialmente a aquellos experimentos que se realizan con animales de laboratorio. Tipo de trabajo - Bibliográfico.

Page 22: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

18- Título del trabajo: Uso del Técnicas Multivariantes en datos procedentes de encuestas o de cualquier otra fuente (El conjunto concreto de datos queda a elección del alumno). En los últimos años en el Departamento de Estadística hemos trabajado en el desarrollo de técnicas biplot para datos nominales y ordinales. El paso siguiente consiste en aplicaciones de las técnicas desarrolladas en diversos campos, por ejemplo, en las tradicionales encuestas de opinión y compararlas con técnicas tradicionales como el Análisis de Correspondencias Multiples. Como ejemplo, en el barómetro de febrero de 2018 del CIS se tratan temas relacionados con la salud y con medicinas alternativas que pueden estudiarse con este tipo de técnicas. El barómetro puede descargarse en http://www.cis.es/cis/opencms/ES/formulario.jsp?dwld=/Microdatos/MD3205.zip Además de este ejemplo hay innumerables archivos de datos disponibles en internet. El trabajo consistiría en la aplicación de las técnicas multivariantes para representar datos nominales y ordinales a archivos de datos elegidos por el propio alumno y para los que tenga cierto conocimiento previo del problema. El trabajo puede extenderse para varios alumnos siempre que no coincidan en el tema y la encuesta concreta. El objeto es la divulgación y extensión de las técnicas recientemente desarrolladas. Requisitos: - Leer artículos en inglés - Ser capaz de manejar la notación matemática para escribir las técnicas, al menos en un nivel básico. - Manejo de R para poder utilizar los paquetes. Bibliografía: Artículo Básico: Hernández-Sánchez, J. C., & Vicente-Villardón, J. L. (2017). Logistic biplot for nominal data. Advances in Data Analysis and Classification, 11(2), 307-326. (https://link.springer.com/article/10.1007/s11634-016-0249-7 ) Resto elaborar dependiendo del tema.

Page 23: 1 - Título: Propiedades geométricas del diseño óptimo de ...fciencias.usal.es/files/207-DESARROLLO.PROP_.DPTOS...El trabajo de fin de grado consistirá en realizar una revisión

19.- Título del trabajo: Los métodos de Machine Learning (Aprendizaje Automático) en Genómica, Cardiología, Cáncer, Genética o cualquier otra especialidad de su elección. Es conocido que los métodos de Machine Learning, cuyo objeto es el desarrollo de algoritmos computacionales que aprendan con la experiencia, permiten que los ordenadores asistan a las personas en el análisis de conjuntos de datos grandes y complejos, en particular, en datos procedentes de la genómica y campos relacionados. En el análisis de datos de expresión génica hay varias áreas de análisis como son la predicción de clases (class prediction), la búsqueda de grupos homogéneos (class Discovery) o la búsqueda de genes desregulados. En todas estas áreas las técnicas de aprendizaje automático pueden ser de utilidad. En este trabajo trataremos de realizar una revisión de los métodos que se han utilizado hasta el momento en este contexto y trataremos de explorar el potencial de otros nuevos, tanto en el contexto de la investigación como en el de la detección de riesgos y sus variantes genéticas asociadas. Las principales técnicas serán aplicadas y comparadas en un conjunto de datos reales, por ejemplo, los procedentes del proyecto NCI60 para el estudio de distintas líneas celulares correspondientes a distintos tipos de cáncer. Plan de trabajo: - Revisión bibliográfica de los métodos. (El 99,9% de los artículos serán en inglés) tomando como base los artículos que se le proporcionan. No se trata de hacer una revisión exhaustiva sino suficiente para poder escribir las bases de los métodos. - Exposición y redacción de los métodos más relevantes. - Búsqueda del software necesario para poner en práctica los métodos o creación de programas para llevarlos a cabo, a ser posible en R. - Aplicación de los métodos a datos reales. Los datos no son importantes en si mismos, sólo una forma de aplicar los métodos, por lo que no es relevante el campo concreto ni una revisión exhaustiva del entorno de los mismos. El alumno buscará conjuntos de datos públicos para la aplicación de los métodos. Requisitos: - Leer artículos en inglés - Ser capaz de manejar la notación matemática para escribir las técnicas, al menos en un nivel básico. Bibliografía: A elaborar dependiendo del tema.