Identificador persistente para citar o vincular este elemento:
http://hdl.handle.net/10662/20095
Títulos: | Analyzing the Performance of Feature Selection on Regression Problems: a Case Study on Older Adults’ Functional Profile |
Autores/as: | Rojo Martin, Francisco Javier Pinho, Lara Guedes de Fonseca, Cesar Lopes, Manuel Jose Helal, Sumi Hernández Núñez, Juan García Alonso, José Manuel Murillo Rodríguez, Juan Manuel |
Palabras clave: | Feature Selection;Regression;Machine Learning;Aging Informatics;Healthcare Data Analytics;eHealth;Selección de funciones;Análisis de datos sanitarios;Informática del envejecimiento |
Fecha de publicación: | 2022 |
Editor/a: | IEEE |
Resumen: | Los sistemas sanitarios son capaces de recoger un número considerable de parámetros relacionados con la salud de los pacientes. Analizarlos para encontrar las causas que provocan una determinada enfermedad es todo un reto. Para abordar este problema se han utilizado técnicas de selección de características, que reducen estos parámetros a un conjunto más reducido con la información más "determinante". Sin embargo, las propuestas existentes suelen centrarse en problemas de clasificación, destinados a detectar si una persona padece o no una enfermedad o un conjunto finito de enfermedades. Sin embargo, hay muchas situaciones en las que los profesionales de la salud necesitan una evaluación numérica para cuantificar la gravedad de una enfermedad, por lo que se enfrentan a un problema de regresión. Las propuestas que utilizan la selección de características en este caso son muy limitadas. Este artículo examina varias técnicas de selección de características para medir su aplicabilidad a los problemas de tipo regresión, comparando estas técnicas mediante su aplicación a un escenario de la vida real sobre los perfiles funcionales de los adultos mayores. En este estudio se utilizaron datos de 829 evaluaciones de perfiles funcionales en 49 residencias. El número de características se redujo de 31 a 25 -con una correlación entre entradas y salidas de 0,99 según la puntuación R2 y un Error Cuadrático Medio (ECM) de 0,11- o a 14 características -con una correlación de 0,98 y un ECM de 5,73-. Healthcare systems are capable of collecting a significant number of patient health-related parameters. Analyzing them to find the reasons that cause a given disease is challenging. Feature Selection techniques have been used to address this issue—reducing these parameters to a smaller set with the most ”determinant” information. However, existing proposals usually focus on classification problems—aimed to detect whether a person is or is not suffering from an illness or from a finite set of illnesses. However, there are many situations in which health professionals need a numerical assessment to quantify the severity of an illness, thus dealing with a regression problem instead. Proposals using Feature Selection here are very limited. This paper examines several Feature Selection techniques to gauge their applicability to the regression-type problems, comparing these techniques by applying them to a real-life scenario on the functional profiles of older adults. Data from 829 functional profiles assessments in 49 residential homes were used in this study. The number of features was reduced from 31 to 25—with a correlation between inputs and outputs of 0.99 according to the R2 score and a Mean Square Error (MSE) of 0.11—or to 14 features—with a correlation of 0.98 and MSE of 5.73. |
URI: | http://hdl.handle.net/10662/20095 |
DOI: | 10.1109/TETC.2022.3181679 |
Colección: | DISIT - Artículos |
Archivos
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
TETC_2022_3181679.pdf ???org.dspace.app.webui.jsptag.ItemTag.accessRestricted??? | 3,04 MB | Adobe PDF | Descargar Pide una copia |
Este elemento está sujeto a una licencia Licencia Creative Commons