Identificador persistente para citar o vincular este elemento: http://hdl.handle.net/10662/19077
Registro completo de Metadatos
Campo DCValoridioma
dc.contributor.authorGonzález Sánchez, Belén-
dc.contributor.authorVega Rodríguez, Miguel Ángel-
dc.contributor.authorSantander Jiménez, Sergio-
dc.date.accessioned2024-01-02T11:54:48Z-
dc.date.available2024-01-02T11:54:48Z-
dc.date.issued2023-
dc.identifier.issn1568-4946-
dc.identifier.urihttp://hdl.handle.net/10662/19077-
dc.description.abstractLa integración de múltiples genes para maximizar los niveles de expresión de las proteínas representa un desafío importante en la biología sintética. Esta tarea se basa en la definición de múltiples secuencias codificadoras de proteínas, que deben ser lo más diferentes posible para evitar la pérdida de información. Las proteínas se pueden codificar de diferentes maneras, utilizando codones sinónimos que se traducen en el mismo aminoácido. Algunos codones se adaptan mejor al organismo que otros, siendo preferible el uso de los más adaptados. Sin embargo, usar sólo los codones más adaptados conduciría a secuencias codificantes muy similares. Un criterio adicional viene dado por el hecho de que las secuencias diseñadas deben contener una proporción adecuada de guanina-citosina (GC) de acuerdo con las características del organismo. Por tanto, esta tarea biológica requiere la optimización simultánea de varios objetivos conflictivos. Este trabajo propone un nuevo enfoque multiobjetivo para la codificación de proteínas, que aborda el problema según una nueva formulación basada en tres funciones objetivo: índice de adaptación de codones, distancia de Hamming entre secuencias y contenido de GC. Nuestro trabajo extiende el reciente algoritmo de optimización de mariposas a contextos multiobjetivo, integrando operadores específicos del problema para aumentar la calidad de la solución al cubrir los diferentes aspectos necesarios para una codificación precisa de proteínas. Se definen dos estructuras clave, una lista tabú y una lista de mejores soluciones, para realizar búsquedas mejoradas atendiendo a las mejoras potenciales que cada solución en la población puede promover. Los experimentos realizados con nueve proteínas del mundo real revelan la consecución de soluciones relevantes desde diferentes perspectivas de evaluación, mostrando mejoras significativas con respecto a otros métodos mono-objetivo y multiobjetivo de la literatura.es_ES
dc.description.abstractThe integration of multiple genes to maximize protein expression levels represents an important challenge in synthetic biology. This task relies on the definition of multiple protein-coding sequences, which must be as different as possible to avoid information loss. Proteins can be encoded in different ways, using synonymous codons that translate into the same amino acid. Some codons are better suited to the host than others, thus being preferable the use of the most fitting ones. However, adopting only the most highly adapted codons would lead to very similar coding sequences. An additional criterion is given by the fact that the designed sequences must contain a suitable guanine–cytosine (GC) ratio in accordance with the characteristics of the host organism. Therefore, this biological task requires the simultaneous optimization of several, conflicting objectives. This work proposes a novel multi-objective approach for protein encoding, which tackles the problem according to a new formulation based on three objective functions: codon adaptation index, Hamming distance between sequences, and GC content. Our work extends the recent Butterfly Optimization Algorithm to multi-objective contexts, integrating problem-specific operators to boost solution quality by covering the different aspects required for accurate protein encoding. Two key structures, a taboo list and a best solution list, are defined to conduct improved searches attending to the potential improvements that each solution in the population can promote. Experiments conducted on nine real-world proteins reveal the attainment of relevant solutions from different evaluation perspectives, showing significant improvements over other single and multi-objective methods from the literature.es_ES
dc.description.sponsorship• Ministerio de Ciencia, Innovación y Universidades, Agencia Estatal de Investigación y Fondo Europeo de Desarrollo Regional. Contrato PID2019-107299GB-I00/AEI/10.13039/501100011033 (proyecto Multi-HPC-Bio) (I+D+i) • Junta de Extremadura y Fondo Europeo de Desarrollo Regional. Contrato IB20047 (proyecto iARN) (I+D+i).es_ES
dc.format.extent14 p.es_ES
dc.format.mimetypeapplication/pdfen_US
dc.language.isoenges_ES
dc.publisherElsevieres_ES
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectOptimización multiobjetivoes_ES
dc.subjectAlgoritmo de optimización de mariposases_ES
dc.subjectCodificación de proteínases_ES
dc.subjectBioinformáticaes_ES
dc.subjectDiseño de mútiples geneses_ES
dc.subjectMulti-objective optimizationes_ES
dc.subjectButterfly optimization algorithmes_ES
dc.subjectProtein encodinges_ES
dc.subjectBioinformaticses_ES
dc.subjectDesign of multiple geneses_ES
dc.titleA multi-objective butterfly optimization algorithm for protein encodinges_ES
dc.typearticlees_ES
dc.description.versionpeerReviewedes_ES
europeana.typeTEXTen_US
dc.rights.accessRightsopenAccesses_ES
dc.subject.unesco1203.17 Informáticaes_ES
dc.subject.unesco1203.08 Código y Sistemas de Codificaciónes_ES
dc.subject.unesco2404 Biomatemáticases_ES
dc.subject.unesco2409 Genéticaes_ES
europeana.dataProviderUniversidad de Extremadura. Españaes_ES
dc.identifier.bibliographicCitationGonzalez-Sanchez, B.; Vega-Rodríguez, M.A.; Santander-Jiménez, S. (2023). A multi-objective butterfly optimization algorithm for protein encoding. Applied Soft Computing, 139, 110269. https://dx.doi.org/10.1016/j.asoc.2023.110269es_ES
dc.type.versionpublishedVersiones_ES
dc.contributor.affiliationUniversidad de Extremadura. Departamento de Tecnología de los Computadores y de las Comunicacioneses_ES
dc.relation.publisherversionhttps://www.sciencedirect.com/science/article/pii/S1568494623002879?via%3Dihubes_ES
dc.identifier.doi10.1016/j.asoc.2023.110269-
dc.identifier.publicationtitleApplied Soft Computinges_ES
dc.identifier.publicationfirstpage110269-1es_ES
dc.identifier.publicationlastpage110269-14es_ES
dc.identifier.publicationvolume139es_ES
dc.identifier.orcid0000-0002-2133-0151es_ES
dc.identifier.orcid0000-0002-3003-758Xes_ES
dc.identifier.orcid0000-0002-2862-2026es_ES
Colección:DTCYC - Artículos

Archivos
Archivo Descripción TamañoFormato 
j_asoc_2023_110269.pdf900,41 kBAdobe PDFDescargar


Este elemento está sujeto a una licencia Licencia Creative Commons Creative Commons