Identificador persistente para citar o vincular este elemento:
http://hdl.handle.net/10662/19077
Registro completo de Metadatos
Campo DC | Valor | idioma |
---|---|---|
dc.contributor.author | González Sánchez, Belén | - |
dc.contributor.author | Vega Rodríguez, Miguel Ángel | - |
dc.contributor.author | Santander Jiménez, Sergio | - |
dc.date.accessioned | 2024-01-02T11:54:48Z | - |
dc.date.available | 2024-01-02T11:54:48Z | - |
dc.date.issued | 2023 | - |
dc.identifier.issn | 1568-4946 | - |
dc.identifier.uri | http://hdl.handle.net/10662/19077 | - |
dc.description.abstract | La integración de múltiples genes para maximizar los niveles de expresión de las proteínas representa un desafío importante en la biología sintética. Esta tarea se basa en la definición de múltiples secuencias codificadoras de proteínas, que deben ser lo más diferentes posible para evitar la pérdida de información. Las proteínas se pueden codificar de diferentes maneras, utilizando codones sinónimos que se traducen en el mismo aminoácido. Algunos codones se adaptan mejor al organismo que otros, siendo preferible el uso de los más adaptados. Sin embargo, usar sólo los codones más adaptados conduciría a secuencias codificantes muy similares. Un criterio adicional viene dado por el hecho de que las secuencias diseñadas deben contener una proporción adecuada de guanina-citosina (GC) de acuerdo con las características del organismo. Por tanto, esta tarea biológica requiere la optimización simultánea de varios objetivos conflictivos. Este trabajo propone un nuevo enfoque multiobjetivo para la codificación de proteínas, que aborda el problema según una nueva formulación basada en tres funciones objetivo: índice de adaptación de codones, distancia de Hamming entre secuencias y contenido de GC. Nuestro trabajo extiende el reciente algoritmo de optimización de mariposas a contextos multiobjetivo, integrando operadores específicos del problema para aumentar la calidad de la solución al cubrir los diferentes aspectos necesarios para una codificación precisa de proteínas. Se definen dos estructuras clave, una lista tabú y una lista de mejores soluciones, para realizar búsquedas mejoradas atendiendo a las mejoras potenciales que cada solución en la población puede promover. Los experimentos realizados con nueve proteínas del mundo real revelan la consecución de soluciones relevantes desde diferentes perspectivas de evaluación, mostrando mejoras significativas con respecto a otros métodos mono-objetivo y multiobjetivo de la literatura. | es_ES |
dc.description.abstract | The integration of multiple genes to maximize protein expression levels represents an important challenge in synthetic biology. This task relies on the definition of multiple protein-coding sequences, which must be as different as possible to avoid information loss. Proteins can be encoded in different ways, using synonymous codons that translate into the same amino acid. Some codons are better suited to the host than others, thus being preferable the use of the most fitting ones. However, adopting only the most highly adapted codons would lead to very similar coding sequences. An additional criterion is given by the fact that the designed sequences must contain a suitable guanine–cytosine (GC) ratio in accordance with the characteristics of the host organism. Therefore, this biological task requires the simultaneous optimization of several, conflicting objectives. This work proposes a novel multi-objective approach for protein encoding, which tackles the problem according to a new formulation based on three objective functions: codon adaptation index, Hamming distance between sequences, and GC content. Our work extends the recent Butterfly Optimization Algorithm to multi-objective contexts, integrating problem-specific operators to boost solution quality by covering the different aspects required for accurate protein encoding. Two key structures, a taboo list and a best solution list, are defined to conduct improved searches attending to the potential improvements that each solution in the population can promote. Experiments conducted on nine real-world proteins reveal the attainment of relevant solutions from different evaluation perspectives, showing significant improvements over other single and multi-objective methods from the literature. | es_ES |
dc.description.sponsorship | • Ministerio de Ciencia, Innovación y Universidades, Agencia Estatal de Investigación y Fondo Europeo de Desarrollo Regional. Contrato PID2019-107299GB-I00/AEI/10.13039/501100011033 (proyecto Multi-HPC-Bio) (I+D+i) • Junta de Extremadura y Fondo Europeo de Desarrollo Regional. Contrato IB20047 (proyecto iARN) (I+D+i). | es_ES |
dc.format.extent | 14 p. | es_ES |
dc.format.mimetype | application/pdf | en_US |
dc.language.iso | eng | es_ES |
dc.publisher | Elsevier | es_ES |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Optimización multiobjetivo | es_ES |
dc.subject | Algoritmo de optimización de mariposas | es_ES |
dc.subject | Codificación de proteínas | es_ES |
dc.subject | Bioinformática | es_ES |
dc.subject | Diseño de mútiples genes | es_ES |
dc.subject | Multi-objective optimization | es_ES |
dc.subject | Butterfly optimization algorithm | es_ES |
dc.subject | Protein encoding | es_ES |
dc.subject | Bioinformatics | es_ES |
dc.subject | Design of multiple genes | es_ES |
dc.title | A multi-objective butterfly optimization algorithm for protein encoding | es_ES |
dc.type | article | es_ES |
dc.description.version | peerReviewed | es_ES |
europeana.type | TEXT | en_US |
dc.rights.accessRights | openAccess | es_ES |
dc.subject.unesco | 1203.17 Informática | es_ES |
dc.subject.unesco | 1203.08 Código y Sistemas de Codificación | es_ES |
dc.subject.unesco | 2404 Biomatemáticas | es_ES |
dc.subject.unesco | 2409 Genética | es_ES |
europeana.dataProvider | Universidad de Extremadura. España | es_ES |
dc.identifier.bibliographicCitation | Gonzalez-Sanchez, B.; Vega-Rodríguez, M.A.; Santander-Jiménez, S. (2023). A multi-objective butterfly optimization algorithm for protein encoding. Applied Soft Computing, 139, 110269. https://dx.doi.org/10.1016/j.asoc.2023.110269 | es_ES |
dc.type.version | publishedVersion | es_ES |
dc.contributor.affiliation | Universidad de Extremadura. Departamento de Tecnología de los Computadores y de las Comunicaciones | es_ES |
dc.relation.publisherversion | https://www.sciencedirect.com/science/article/pii/S1568494623002879?via%3Dihub | es_ES |
dc.identifier.doi | 10.1016/j.asoc.2023.110269 | - |
dc.identifier.publicationtitle | Applied Soft Computing | es_ES |
dc.identifier.publicationfirstpage | 110269-1 | es_ES |
dc.identifier.publicationlastpage | 110269-14 | es_ES |
dc.identifier.publicationvolume | 139 | es_ES |
dc.identifier.orcid | 0000-0002-2133-0151 | es_ES |
dc.identifier.orcid | 0000-0002-3003-758X | es_ES |
dc.identifier.orcid | 0000-0002-2862-2026 | es_ES |
Colección: | DTCYC - Artículos |
Archivos
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
j_asoc_2023_110269.pdf | 900,41 kB | Adobe PDF | Descargar |
Este elemento está sujeto a una licencia Licencia Creative Commons