Please use this identifier to cite or link to this item: http://hdl.handle.net/10662/19088
Title: Automatic update summarization by a multiobjective number-one-selection genetic approach
Authors: Sánchez Gómez, Jesús Manuel
Vega Rodríguez, Miguel Ángel
Pérez Sánchez, Carlos Javier
Keywords: Algoritmo genético;Algoritmo genético multiobjetivo con selección número-uno (MONOGA);Optimización multiobjetivo;Selección número-uno;Conferencia de análisis de texto (TAC);Resumen de actualización;Genetic algorithm;Multiobjective number-one-selection genetic algorithm (MONOGA);Multiobjective optimization;Number-one selection;Text analysis conference (TAC);Update summarization
Issue Date: 2023
Abstract: Actualmente, el explosivo crecimiento de la información disponible en Internet hace que los sistemas automáticos de resumen de textos sean cada vez más importantes. Un desafío particularmente relevante es la tarea de resumen de actualización. El resumen de actualización se diferencia del resumen tradicional en su naturaleza dinámica. Mientras que el resumen tradicional es estático, es decir, las colecciones de documentos sobre un tema específico permanecen sin cambios, el resumen de actualización aborda colecciones de documentos dinámicas basadas en un tema específico. Por tanto, el resumen de actualización consiste en resumir la nueva colección de documentos bajo el supuesto de que el usuario ya ha leído un resumen anterior y sólo la nueva información es interesante. El algoritmo genético multiobjetivo con selección número-uno (MONOGA) ha sido diseñado e implementado para abordar este problema. El algoritmo propuesto produce un resumen que es relevante para la consulta realizada por el usuario y también contiene información actualizada. Los experimentos se realizaron en conjuntos de datos de la Conferencia de análisis de texto (TAC) y se consideraron las métricas de Estudio orientado a la recuperación para la evaluación de la esencia (ROUGE) para evaluar el rendimiento del modelo. Los resultados obtenidos por el enfoque propuesto superan a los de los enfoques existentes en la literatura científica, obteniendo mejoras porcentuales promedio entre 12,74% y 55,03% en las puntuaciones ROUGE.
Currently, the explosive growth of the information available on the Internet makes automatic text summarization systems increasingly important. A particularly relevant challenge is the update summarization task. Update summarization differs from traditional summarization in its dynamic nature. While traditional summarization is static, that is, the document collections about a specific topic remain unchanged, update summarization addresses dynamic document collections based on a specific topic. Therefore, update summarization consists of summarizing the new document collection under the assumption that the user has already read a previous summarization and only the new information is interesting. The multiobjective number-one-selection genetic algorithm (MONOGA) has been designed and implemented to address this problem. The proposed algorithm produces a summary that is relevant to the user’s given query, and it also contains updates information. Experiments were conducted on Text Analysis Conference (TAC) datasets, and Recall-Oriented Understudy for Gisting Evaluation (ROUGE) metrics were considered to assess the model performance. The results obtained by the proposed approach outperform those from the existing approaches in the scientific literature, obtaining average percentage improvements between 12.74% and 55.03% in the ROUGE scores.
URI: http://hdl.handle.net/10662/19088
ISSN: 2168-2267
DOI: 10.1109/TCYB.2022.3223163
Appears in Collections:DMATE - Artículos
DTCYC - Artículos

Files in This Item:
File Description SizeFormat 
TCYB_2022_3223163.pdf1,12 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons