Identificador persistente para citar o vincular este elemento: http://hdl.handle.net/10662/1683
Títulos: Análisis bayesiano de datos con respuesta categórica
Otros títulos: Bayesian analysis of categorical response data
Autores/as: Naranjo Albarrán, Lizbeth
Director/a: Pérez Sánchez, Carlos Javier
Martín Jiménez, Jacinto
Palabras clave: Regresión bayesiano;Datos categóricos;Clasificación incorrecta;Distribución potencial-exponencial simétrica/asimétrica;Bayesian regression;Categorical data;Misclassification;Symmetric/Asymmetric exponential power distribution
Fecha de publicación: 2014-07-15
Resumen: Esta tesis tiene como objetivo estudiar dos temas importantes en Estadística. El primero es el desarrollo de modelos robustos de regresión utilizando funciones de enlace flexibles y, el segundo es la extensión de modelos de datos categóricos para abordar la clasificación incorrecta. La metodología Bayesiana se ha considerado. Las distribuciones potencial-­‐exponencial asimétricas (AEP) pueden tratar con éxito la simetría/asimetría y las colas ligeras/pesadas de forma simultánea. La familia AEP incluye la distribución potencial-­‐exponencial (EP). Se han propuesto métodos robustos de regresión que utilizan distribuciones EP y AEP en tres contextos diferentes: una exploración de la distribución a posteriori mediante el uso de la distribución AEP para el modelo de verosimilitud, un modelo de regresión lineal donde la distribución AEP se utiliza para la variable de error, y dos modelos de regresión binaria donde la inversa de la función de distribución acumulativa EP/AEP se utiliza como la función de enlace. Las aproximaciones anteriores consideran datos libres de error. Sin embargo, muchas veces los procesos de generación de datos no están exentos de error cuando se recogen en situaciones reales. Se han considerado modelos lineales generalizados para describir la dependencia de los datos sobre las variables explicativas cuando las respuestas categóricas están sujetas a errores de clasificación. Se han propuesto modelos de regresión con funciones de enlace probit y t para datos binarios mal clasificados, y se han aplicado en el contexto de la pérdida auditiva causada por la exposición al ruido durante la jornada laboral. Esta aproximación se ha extendido a datos con respuestas politómicas mal clasificadas, con especial énfasis en el caso ordinal. Por último, motivado por un estudio longitudinal de salud oral, se ha desarrollado un tipo diferente de modelo ordinal que considera la clasificación incorrecta. Este modelo explota la estructura multinivel de los datos.
This thesis aims at studying two important topics in Statistics. The first one is the development of robust regression models by using flexible link functions and, the second one is the extension of categorical data models to address misclassification. Bayesian methodology has been considered. The asymmetrical exponential power (AEP) distributions can successfully handle both symmetry/asymmetry and light/heavy tails in a simultaneous way. The AEP family includes the exponential power (EP). Robust regression approaches that use EP and AEP distributions have been proposed in three different contexts: a posterior distribution exploration by using the AEP distribution for the likelihood model, a linear regression model where the AEP distribution is used for the error variable, and binary regression models where the inverse of the EP/AEP cumulative distribution function is used as the link function. All previous approaches consider error-­‐free data. However, many times data-­‐generating processes are not error-­‐free when data are collected in real situations. Generalized linear models have been considered to describe the dependence of data on explanatory variables when the categorical outcome is subject to misclassification. Probit and t-­‐link regression models for misclassified binary data have been proposed, and they have been applied in the context of hearing loss caused by exposure to occupational noise. This approach has been extended to misclassified polychotomous response data, with special emphasis in the ordinal case. Finally, motivated by a longitudinal oral health study, a different type of ordinal model considering misclassification has been developed. This model exploits the multilevel structure of the data.
Descripción: Tesis doctoral con la Mención de "Doctor Internacional"
URI: http://hdl.handle.net/10662/1683
Colección:DMATE - Tesis doctorales
Tesis doctorales

Archivos
Archivo Descripción TamañoFormato 
TDUEX_2014_Naranjo_Albarran.pdf2,94 MBAdobe PDFDescargar


Este elemento está sujeto a una licencia Licencia Creative Commons Creative Commons