Identificador persistente para citar o vincular este elemento: http://hdl.handle.net/10662/20095
Títulos: Analyzing the Performance of Feature Selection on Regression Problems: a Case Study on Older Adults’ Functional Profile
Autores/as: Rojo Martin, Francisco Javier
Pinho, Lara Guedes de
Fonseca, Cesar
Lopes, Manuel Jose
Helal, Sumi
Hernández Núñez, Juan
García Alonso, José Manuel
Murillo Rodríguez, Juan Manuel
Palabras clave: Feature Selection;Regression;Machine Learning;Aging Informatics;Healthcare Data Analytics;eHealth;Selección de funciones;Análisis de datos sanitarios;Informática del envejecimiento
Fecha de publicación: 2022
Editor/a: IEEE
Resumen: Los sistemas sanitarios son capaces de recoger un número considerable de parámetros relacionados con la salud de los pacientes. Analizarlos para encontrar las causas que provocan una determinada enfermedad es todo un reto. Para abordar este problema se han utilizado técnicas de selección de características, que reducen estos parámetros a un conjunto más reducido con la información más "determinante". Sin embargo, las propuestas existentes suelen centrarse en problemas de clasificación, destinados a detectar si una persona padece o no una enfermedad o un conjunto finito de enfermedades. Sin embargo, hay muchas situaciones en las que los profesionales de la salud necesitan una evaluación numérica para cuantificar la gravedad de una enfermedad, por lo que se enfrentan a un problema de regresión. Las propuestas que utilizan la selección de características en este caso son muy limitadas. Este artículo examina varias técnicas de selección de características para medir su aplicabilidad a los problemas de tipo regresión, comparando estas técnicas mediante su aplicación a un escenario de la vida real sobre los perfiles funcionales de los adultos mayores. En este estudio se utilizaron datos de 829 evaluaciones de perfiles funcionales en 49 residencias. El número de características se redujo de 31 a 25 -con una correlación entre entradas y salidas de 0,99 según la puntuación R2 y un Error Cuadrático Medio (ECM) de 0,11- o a 14 características -con una correlación de 0,98 y un ECM de 5,73-.
Healthcare systems are capable of collecting a significant number of patient health-related parameters. Analyzing them to find the reasons that cause a given disease is challenging. Feature Selection techniques have been used to address this issue—reducing these parameters to a smaller set with the most ”determinant” information. However, existing proposals usually focus on classification problems—aimed to detect whether a person is or is not suffering from an illness or from a finite set of illnesses. However, there are many situations in which health professionals need a numerical assessment to quantify the severity of an illness, thus dealing with a regression problem instead. Proposals using Feature Selection here are very limited. This paper examines several Feature Selection techniques to gauge their applicability to the regression-type problems, comparing these techniques by applying them to a real-life scenario on the functional profiles of older adults. Data from 829 functional profiles assessments in 49 residential homes were used in this study. The number of features was reduced from 31 to 25—with a correlation between inputs and outputs of 0.99 according to the R2 score and a Mean Square Error (MSE) of 0.11—or to 14 features—with a correlation of 0.98 and MSE of 5.73.
URI: http://hdl.handle.net/10662/20095
DOI: 10.1109/TETC.2022.3181679
Colección:DISIT - Artículos

Archivos
Archivo Descripción TamañoFormato 
TETC_2022_3181679.pdf
???org.dspace.app.webui.jsptag.ItemTag.accessRestricted???
3,04 MBAdobe PDFDescargar    Pide una copia


Este elemento está sujeto a una licencia Licencia Creative Commons Creative Commons