Identificador persistente para citar o vincular este elemento: http://hdl.handle.net/10662/19512
Títulos: Multicondition Training for Noise-Robust Detection of Benign Vocal Fold Lesions From Recorded Speech
Otros títulos: Entrenamiento multicondicional para resistencia al ruido. Detección de lesiones benignas de las cuerdas vocales del discurso grabado
Autores/as: Madruga Escalona, Mario
Campos Roca, Yolanda
Pérez Sánchez, Carlos Javier
Palabras clave: Características acústicas;Diagnóstico asistido por ordenador (CAD);Aprendizaje automático;Entrenamiento multicondicional (MCT);Nódulos;Pólipos;Edema de Reinke;Acoustic features;Computer aided diagnosis (CAD);Machine learning;Multicondition training (MCT);Nodules;Polyps;Reinke's edema
Fecha de publicación: 2021-01-05
Editor/a: IEEE Access
Resumen: Este estudio evalúa los efectos del entrenamiento multicondición (MCT) en sistemas de diagnóstico asistido por computadora para la evaluación de la calidad de la voz asociada a lesiones exudativas del espacio de Reinke. Esta técnica añade diversas condiciones de ruido a las grabaciones de voz para recrear entornos acústicos realistas. Se utilizan cuatro bases de datos diferentes (Massachussets Eye and Ear In_rmary, UEX-Voice, Saarbrücken y Hospital Universitario Príncipe de Asturias) registradas en entornos acústicos muy diferentes. Comparamos los resultados de modelos de clasificación forestal aleatorios que comprenden selección de características, ajuste de hiperparámetros y validación cruzada siguiendo el esquema MCT específico utilizado para separar sujetos sanos de patológicos para tres enfermedades (nódulos, pólipos y edema de Reinke). Además de la línea de base del caso limpio, se consideran escenarios MCT basados en ruido asimétricos (la grabación de un sujeto se ve afectada solo por una grabación de ruido) y dos simétricos (la grabación de un sujeto se ve afectada por todas las grabaciones de ruido). Estos escenarios se crean añadiendo ruido acústico realista de diferentes tipos a las grabaciones de vocales sostenidas /a/. Los enfoques simétricos se ven afectados por preocupaciones metodológicas y se prueban con un propósito comparativo, para enfatizar estas cuestiones. Los resultados experimentales resaltan los inconvenientes de los MCT simétricos y excluyen estas técnicas como una opción viable. Por el contrario, se ha demostrado que el MCT asimétrico es un enfoque resistente al ruido adecuado para construir un sistema de diagnóstico para lesiones exudativas del espacio de Reinke, ya que el rendimiento obtenido con los clasificadores resultantes no está lejos del rendimiento obtenido con el entrenamiento limpio.
This study evaluates the effects of Multicondition Training (MCT) on computer aided diagnosis systems for voice quality assessment associated to exudative lesions of Reinke's space. This technique adds various noise conditions to the speech recordings in order to recreate realistic acoustic environments. Four different databases (Massachussets Eye and Ear In_rmary, UEX-Voice, Saarbrücken, and Hospital Universitario Príncipe de Asturias) recorded in very different acoustic environments are used. We compare the outcomes of random forest classi_er models comprising feature selection, hyperparameter tuning, and cross-validation attending the speci_c MCT schema used to separate healthy from pathological subjects for three diseases (nodules, polyps, and Reinke's edema). Apart from the clean case baseline, an asymmetric (one subject recording is affected only by one noise recording) and two symmetric (one subject recording is affected by all the noise recordings) noise-based MCT scenarios are considered. These scenarios are created by adding realistic acoustic noise of different types to the sustained /a/ vowel recordings. The symmetric approaches are affected by methodological concerns and are tested with a comparative purpose, to emphasize these issues. Experimental results highlight the drawbacks of symmetric MCTs and exclude these techniques as a viable option. In contrast, asymmetric MCT is proven to be a suitable noise-robust approach to build a diagnosis system for exudative lesions of Reinke's space, as performance obtained with the resulting classi_ers is not far from the performance obtained for clean training.
URI: http://hdl.handle.net/10662/19512
DOI: 10.1109/ACCESS.2020.3046873
Colección:DMATE - Artículos

Archivos
Archivo Descripción TamañoFormato 
ACCESS.2020.3046873.pdf1,65 MBAdobe PDFDescargar


Este elemento está sujeto a una licencia Licencia Creative Commons Creative Commons