Identificador persistente para citar o vincular este elemento:
http://hdl.handle.net/10662/17185
Títulos: | A multi-objective memetic algorithm for query-oriented text summarization: Medicine texts as a case study |
Autores/as: | Sánchez Gómez, Jesús Manuel Vega Rodríguez, Miguel Ángel Pérez Sánchez, Carlos Javier |
Palabras clave: | Resumen orientado a consultas;Textos de medicina;Optimización multiobjetivo;Evaluación;Algoritmo memético;Query-oriented summarization;Multi-objective optimization;Medicine texts;Evaluation;Memetic algorithm;Recall-oriented understudy for gisting |
Fecha de publicación: | 2022 |
Editor/a: | Elsevier |
Resumen: | Automatic text summarization is a topic of great interest in many fields of knowledge. Particularly, query-oriented extractive multi-document text summarization methods have increased their importance recently, since they can automatically generate a summary according to a query given by the user. One way to address this problem is by multi-objective optimization approaches. In this paper, a memetic algorithm, specifically a Multi-Objective Shuffled Frog-Leaping Algorithm (MOSFLA) has been developed, implemented, and applied to solve the query-oriented extractive multi-document text summarization problem. Experiments have been conducted with datasets from Text Analysis Conference (TAC), and the obtained results have been evaluated with Recall-Oriented Understudy for Gisting Evaluation (ROUGE) metrics. The results have shown that the proposed approach has achieved important improvements with respect to the works of scientific literature. Specifically, 25.41%, 7.13%, and 30.22% of percentage improvements in ROUGE-1, ROUGE-2, and ROUGE-SU4 scores have been respectively reached. In addition, MOSFLA has been applied to medicine texts from the Topically Diverse Query Focus Summarization (TD-QFS) dataset as a case study. El resumen automático de textos es un tema de gran interés en muchos campos del conocimiento. En particular, los métodos de resumen de texto de múltiples documentos extractivos orientados a consultas han aumentado su importancia recientemente, ya que pueden generar automáticamente un resumen de acuerdo con una consulta realizada por el usuario. Una forma de abordar este problema es mediante enfoques de optimización multiobjetivo. En este artículo, se ha desarrollado, implementado y aplicado un algoritmo memético, específicamente un algoritmo de salto de rana aleatorio multiobjetivo (MOSFLA), para resolver el problema de resumen de texto de múltiples documentos extractivo orientado a consultas. Se han realizado experimentos con conjuntos de datos de Text Analysis Conference (TAC), y los resultados obtenidos se han evaluado con métricas de Recall-Oriented Understudy for Gisting Evaluation (ROUGE). Los resultados han mostrado que el enfoque propuesto ha logrado mejoras importantes con respecto a los trabajos de la literatura científica. En concreto, se han alcanzado un 25,41 %, un 7,13 % y un 30,22 % de porcentaje de mejora en las puntuaciones de ROUGE-1, ROUGE-2 y ROUGE-SU4, respectivamente. Además, MOSFLA se ha aplicado a textos de medicina del conjunto de datos Topically Diverse Query Focus Summarization (TD-QFS) como estudio de caso. |
Descripción: | Financiación de acceso abierto gracias al acuerdo CRUE-CSIC con Elsevier. |
URI: | http://hdl.handle.net/10662/17185 |
ISSN: | 0957-4174 |
DOI: | 10.1016/j.eswa.2022.116769 |
Colección: | DMATE - Artículos DTCYC - Artículos |
Archivos
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
j_eswa_2022_116769.pdf | 911,82 kB | Adobe PDF | Descargar |
Este elemento está sujeto a una licencia Licencia Creative Commons