Identification of Relevant Phytochemical Constituents for Characterization and Authentication of Tomatoes by General Linear Model Linked to Automatic Interaction Detection (GLM-AID) and Artificial Neural Network Models (ANNs)

Hernández Suárez, Marcos; Astray Dopazo, Gonzalo; Larios López, Dina; Espinosa Borreguero, Francisco

Listar por

Estadísticas

Visualiza las estadísticas

Ayuda

Ayuda

Identificador persistente para citar o vincular este elemento: http://hdl.handle.net/10662/5487

0 0

Títulos:	Identification of Relevant Phytochemical Constituents for Characterization and Authentication of Tomatoes by General Linear Model Linked to Automatic Interaction Detection (GLM-AID) and Artificial Neural Network Models (ANNs)
Autores/as:	Hernández Suárez, Marcos Astray Dopazo, Gonzalo Larios López, Dina Espinosa Borreguero, Francisco
Palabras clave:	Tomates;Cultivo de tomates;Redes Neuronales Artificiales (ANNs);Modelo lineal general vinculado a la interacción automática de detección (GLM-AID);Tenerife;Tomato;Tomato cultivars;Artificial Neural Network Models (ANNs);General Linear Model Linked to Automatic Interaction Detection (GLM-AID)
Fecha de publicación:	2015
Editor/a:	PLOS/One
Resumen:	Hay un gran número de cultivos de tomate con una amplia gama de características morfológicas, químicas, nutricionales y sensoriales. Son muchos los factores conocidos que influyen en el contenido de nutrientes de cultivos de tomate. Un completo estudio de los efectos de estos factores requeriría un exhaustivo diseño experimental, un enfoque científico multidisciplinario y un método estadístico adecuado. Algunas técnicas de análisis multivariante como análisis de componentes principales (PCA) o el análisis factorial (FA) han sido ampliamente aplicados para buscar patrones en el comportamiento y reducir la dimensión de un conjunto de datos por un nuevo conjunto de variables latentes no correlacionados. Sin embargo, en algunos casos no es útil para sustituir las variables originales con estas variables latentes. En este estudio, la interacción automática (ayuda) del algoritmo de detección y los modelos de una red neuronal artificial (RNA) se aplican como alternativa a la PCA, AF y otras técnicas de análisis multivariante para identificar los componentes fitoquímicos relevantes para la caracterización y la autenticación de los tomates. Para demostrar la viabilidad de la ayuda del algoritmo y del modelo Ann para lograr el propósito de este estudio, ambos métodos se aplican sobre un conjunto de datos con veinticinco parámetros químicos analizados en 167 muestras de tomate de Tenerife (España). Cada muestra de tomate fue definida por tres factores: cultivo, prácticas agrícolas y fecha de cosecha. El modelo lineal general (GLM ligada a la ayuda-AID) de estructura de árbol se organiza en 3 niveles de acuerdo con el número de factores. El ácido p-Coumaric era el compuesto permitido para distinguir las muestras de tomate según el día de la cosecha. Era necesario más de un parámetro químico para distinguir entre las diferentes prácticas agrícolas y entre los cultivos de tomate. Fueron desarrollados varios modelos de ANN, con 25 y 10 variables de entrada, para la predicción de cultivo, prácticas agrícolas y fecha de cosecha. Por último, los modelos con 10 variables de entrada fueron elegidos por situarse entre el 44 y el 100%. El menor encaje recayó en los cultivos y la clasificación, de modo que debe emplearse otro tipo de parámetro químico para identificar los cultivos de tomate. There are a large number of tomato cultivars with a wide range of morphological, chemical, nutritional and sensorial characteristics. Many factors are known to affect the nutrient content of tomato cultivars. A complete understanding of the effect of these factors would require an exhaustive experimental design, multidisciplinary scientific approach and a suitable statistical method. Some multivariate analytical techniques such as Principal Component Analysis (PCA) or Factor Analysis (FA) have been widely applied in order to search for patterns in the behaviour and reduce the dimensionality of a data set by a new set of uncorrelated latent variables. However, in some cases it is not useful to replace the original variables with these latent variables. In this study, Automatic Interaction Detection (AID) algorithm and Artificial Neural Network (ANN) models were applied as alternative to the PCA, AF and other multivariate analytical techniques in order to identify the relevant phytochemical constituents for characterization and authentication of tomatoes. To prove the feasibility of AID algorithm and ANN models to achieve the purpose of this study, both methods were applied on a data set with twenty five chemical parameters analysed on 167 tomato samples from Tenerife (Spain). Each tomato sample was defined by three factors: cultivar, agricultural practice and harvest date. General Linear Model linked to AID (GLM-AID) tree structured was organized into 3 levels according to the number of factors. p-Coumaric acid was the compound the allowed to distinguish the tomato samples according to the day of harvest. More than one chemical parameter was necessary to distinguish among different agricultural practices and among the tomato cultivars. Several ANN models, with 25 and 10 input variables, for the prediction of cultivar, agricultural practice and harvest date, were developed. Finally, the models with 10 input variables were chosen with fit’s goodness between 44 and 100%. The lowest fits were for the cultivar classification, this low percentage suggests that other kind of chemical parameter should be used to identify tomato cultivars.
URI:	http://hdl.handle.net/10662/5487
ISSN:	1932-6203
DOI:	10.1371/journal.pone.0128566
Colección:	DBVET - Artículos

Archivos

Archivo	Descripción	Tamaño	Formato
journal_pone_0128566.PDF		2,53 MB	Adobe PDF	Descargar

Vista completa

Este elemento está sujeto a una licencia Licencia Creative Commons