Please use this identifier to cite or link to this item: http://hdl.handle.net/10662/17185
Title: A multi-objective memetic algorithm for query-oriented text summarization: Medicine texts as a case study
Authors: Sánchez Gómez, Jesús Manuel
Vega Rodríguez, Miguel Ángel
Pérez Sánchez, Carlos Javier
Keywords: Resumen orientado a consultas;Textos de medicina;Optimización multiobjetivo;Evaluación;Algoritmo memético;Query-oriented summarization;Multi-objective optimization;Medicine texts;Evaluation;Memetic algorithm;Recall-oriented understudy for gisting
Issue Date: 2022
Publisher: Elsevier
Abstract: Automatic text summarization is a topic of great interest in many fields of knowledge. Particularly, query-oriented extractive multi-document text summarization methods have increased their importance recently, since they can automatically generate a summary according to a query given by the user. One way to address this problem is by multi-objective optimization approaches. In this paper, a memetic algorithm, specifically a Multi-Objective Shuffled Frog-Leaping Algorithm (MOSFLA) has been developed, implemented, and applied to solve the query-oriented extractive multi-document text summarization problem. Experiments have been conducted with datasets from Text Analysis Conference (TAC), and the obtained results have been evaluated with Recall-Oriented Understudy for Gisting Evaluation (ROUGE) metrics. The results have shown that the proposed approach has achieved important improvements with respect to the works of scientific literature. Specifically, 25.41%, 7.13%, and 30.22% of percentage improvements in ROUGE-1, ROUGE-2, and ROUGE-SU4 scores have been respectively reached. In addition, MOSFLA has been applied to medicine texts from the Topically Diverse Query Focus Summarization (TD-QFS) dataset as a case study.
El resumen automático de textos es un tema de gran interés en muchos campos del conocimiento. En particular, los métodos de resumen de texto de múltiples documentos extractivos orientados a consultas han aumentado su importancia recientemente, ya que pueden generar automáticamente un resumen de acuerdo con una consulta realizada por el usuario. Una forma de abordar este problema es mediante enfoques de optimización multiobjetivo. En este artículo, se ha desarrollado, implementado y aplicado un algoritmo memético, específicamente un algoritmo de salto de rana aleatorio multiobjetivo (MOSFLA), para resolver el problema de resumen de texto de múltiples documentos extractivo orientado a consultas. Se han realizado experimentos con conjuntos de datos de Text Analysis Conference (TAC), y los resultados obtenidos se han evaluado con métricas de Recall-Oriented Understudy for Gisting Evaluation (ROUGE). Los resultados han mostrado que el enfoque propuesto ha logrado mejoras importantes con respecto a los trabajos de la literatura científica. En concreto, se han alcanzado un 25,41 %, un 7,13 % y un 30,22 % de porcentaje de mejora en las puntuaciones de ROUGE-1, ROUGE-2 y ROUGE-SU4, respectivamente. Además, MOSFLA se ha aplicado a textos de medicina del conjunto de datos Topically Diverse Query Focus Summarization (TD-QFS) como estudio de caso.
Description: Financiación de acceso abierto gracias al acuerdo CRUE-CSIC con Elsevier.
URI: http://hdl.handle.net/10662/17185
ISSN: 0957-4174
DOI: 10.1016/j.eswa.2022.116769
Appears in Collections:DMATE - Artículos
DTCYC - Artículos

Files in This Item:
File Description SizeFormat 
j_eswa_2022_116769.pdf911,82 kBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons