Metaheurísticas, optimización multiobjetivo y paralelismo para descubrir motifs en secuencias de ADN

Repositorio Dspace/Manakin

español português english

Metaheurísticas, optimización multiobjetivo y paralelismo para descubrir motifs en secuencias de ADN

Mostrar el registro completo del ítem

Título: Metaheurísticas, optimización multiobjetivo y paralelismo para descubrir motifs en secuencias de ADN
Autor: González Álvarez, David Lesmes
Resumen: La resolución de problemas complejos mediante técnicas evolutivas es uno de los aspectos más investigados en Informática. El objetivo principal de esta tesis doctoral es desarrollar nuevos algoritmos capaces de resolver estos problemas con el menor tiempo computacional posible, mejorando la calidad de los resultados obtenidos por los métodos ya existentes. Para ello, combinamos tres conceptos importantes: metaheurísticas, optimización multiobjetivo y paralelismo. Con este fin, primero buscamos un problema de optimización importante que aún no fuese resuelto de forma eficiente y encontramos el Problema del Descubrimiento de Motifs (PDM). El PDM tiene como objetivo descubrir pequeños patrones repetidos (motifs) en conjuntos de secuencias de ADN que puedan poseer cierto significado biológico. Para abordarlo, definimos una formulación multiobjetivo adecuada a los requerimientos del mundo real, implementamos un total de diez algoritmos de distinta naturaleza (población, trayectoria, inteligencia colectiva...), analizando aspectos como la capacidad de escalar y converger. Finalmente, diseñamos diversas técnicas paralelas, haciendo uso de entornos de programación como OpenMP y MPI, que tratan de combinar las propiedades de varias metaheurísticas en una única aplicación. Los resultados obtenidos son estudiados en detalle a través de la aplicación de numerosos test estadísticos, y las predicciones son comparadas con las descubiertas por un total de trece herramientas biológicas bien conocidas en la literatura. Las conclusiones obtenidas demuestran que la utilización de la optimización multiobjetivo en técnicas metaheurísticas favorece el descubrimiento de soluciones de calidad y que el paralelismo es útil para combinar las propiedades evolutivas de diferentes algoritmos.The resolution of complex problems by using evolutionary algorithms is one of the most researched issues in Computer Science. The main goal of this thesis is directly related with the development of new algorithms that can solve this kind of problems with the least possible computational time, improving the results achieved by the existing methods. To this end, we combine three important concepts: metaheuristics, multiobjective optimization, and parallelism. For doing this, we first look for a significant optimization problem that had not been solved in an efficient way and we find the Motif Discovery Problem (MDP). MDP aims to discover over-represented short patterns (motifs) in a set of DNA sequences that may have some biological significance. To address it, we defined a multiobjective formulation adjusted to the real-world biological requirements, we implemented a total of ten algorithms of different nature (population, trajectory, collective intelligence...), analyzing aspects such as the ability to scale and converge. Finally, we designed parallel techniques, by using parallel and distributed programming environments as OpenMP and MPI, which try to combine the properties of several metaheuristics in a single application. The obtained results are discussed in detail through numerous statistical tests, and the achieved predictions are compared with those discovered by a total of thirteen well-known biological tools. The drawn conclusions demonstrate that using multiobjective optimization in metaheuristic techniques favors the discovery of quality solutions, and that parallelism is useful for combining the properties of different evolutionary algorithms.
URI: http://hdl.handle.net/10662/522
Fecha: 2013-06-17


Ficheros en el ítem

Ficheros Tamaño Formato Ver
TDUEX_2013_Gonzalez_Alvarez.pdf 4.870Mb PDF Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro completo del ítem

Creative Commons Attribution- NonCommercial-NoDerivs 3.0 License Excepto si se señala otra cosa, la licencia del ítem se describe como Creative Commons Attribution- NonCommercial-NoDerivs 3.0 License

Buscar en Mi Dehesa


Listar

Mi cuenta

Estadísticas

Ayuda

Redes sociales