Identificador persistente para citar o vincular este elemento: http://hdl.handle.net/10662/21119
Títulos: Optimizing Latent Factors and Collaborative Filtering for Students’ Performance Prediction
Autores/as: Gómez Pulido, Juan Antonio
Durán Domínguez, Arturo
Pajuelo Holguera, Francisco
Palabras clave: Sistemas de recomendación;Recommender systems;Filtrado colaborativo;Collaborative filtering;Fatorización matricial;Matrix factorization
Fecha de publicación: 2020
Editor/a: MDPI
Resumen: El problema de la predicción del rendimiento de los estudiantes se ha abordado recientemente mediante la factorización matricial, un método popular aplicado a los sistemas de recomendación basados en el filtrado colaborativo. Este problema consiste en predecir el rendimiento o puntuación desconocida de un alumno para una tarea que no ha completado, en función de las puntuaciones de las tareas que sí ha completado y de las puntuaciones de los compañeros que completaron la tarea. El método de resolución considera la factorización matricial y el gradiente en descenso para construir un modelo que minimice el error en la predicción de los datos de prueba. Sin embargo, identificamos dos aspectos que influyen en la precisión de la predicción. Por un lado, el modelo involucra la tasa de aprendizaje y el factor de regularización, para los que no existen valores fijos. Por otro lado, los conjuntos de datos se extraen de aulas virtuales y tienen factores latentes implícitos difíciles de determinar, pues dependen de la naturaleza de los datos. Este artículo propone enfoques para mejorar la precisión de la predicción optimizando los factores latentes, la tasa de aprendizaje y el factor de regularización, aplicando algoritmos de optimización. Los resultados experimentales obtenidos a partir de conjuntos de datos del mundo real mejoraron la predicción.
The problem of predicting students’ performance has been recently tackled by using matrix factorization, a popular method applied for collaborative filtering based recommender systems. This problem consists of predicting the unknown performance or score of a particular student for a task s/he did not complete or did not attend, according to the scores of the tasks s/he did complete and the scores of the colleagues who completed the task in question. The solving method considers matrix factorization and a gradient descent algorithm in order to build a prediction model that minimizes the error in the prediction of test data. However, we identified two key aspects that influence the accuracy of the prediction. On the one hand, the model involves a pair of important parameters: the learning rate and the regularization factor, for which there are no fixed values for any experimental case. On the other hand, the datasets are extracted from virtual classrooms on online campuses and have a number of implicit latent factors. The right figures are difficult to ascertain, as they depend on the nature of the dataset: subject, size, type of learning, academic environment, etc. This paper proposes some approaches to improve the prediction accuracy by optimizing the values of the latent factors, learning rate, and regularization factor. To this end, we apply optimization algorithms that cover a wide search space. The experimental results obtained from real-world datasets improved the prediction accuracy in the context of a thorough search for predefined values. Obtaining optimized values of these parameters allows us to apply them to further predictions for similar datasets.
URI: http://hdl.handle.net/10662/21119
ISSN: 2076-3417
DOI: 10.3390/app10165601
Colección:DTCYC - Artículos

Archivos
Archivo Descripción TamañoFormato 
applsci-10-05601-v2.pdf1,59 MBAdobe PDFDescargar


Este elemento está sujeto a una licencia Licencia Creative Commons Creative Commons