Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/364128
Type: TESE DIGITAL
Degree Level: Doutorado
Title: Bayesian inference for multidimensional item response models under heavy tail skewed latent trait distributions and link functions : Inferência Bayesiana para modelos de resposta ao item multidimensionais sob distribuições para os traços latentes e funções de ligação assimétricas de caudas pesadas
Title Alternative: Inferência Bayesiana para modelos de resposta ao item multidimensionais sob distribuições para os traços latentes e funções de ligação assimétricas de caudas pesadas
Author: Padilla Gómez, Juan Leonardo, 1989-
Advisor: Azevedo, Caio Lucidius Naberezny, 1979-
Abstract: Resumo: O presente trabalho é composto por quatro partes principais, que consistem em contribuições relativas à Teoria de Resposta ao Item (TRI), no que concerne a: modelagem da função de resposta ao item, modelagem da distribuição dos traços latentes, verificação da qualidade de ajuste do modelo e seleção de modelos. Na primeira parte propomos uma nova versão centralizada da distribuição t de Student assimétrica, tanto uni quanto multivariada, estudando diversas de suas propriedades, as quais foram denominadas de t de Student assimétrica centrada (TAC). As distribuições propostas generalizam os trabalhos de Azzalini (1985) e Padilla (2014) e consistem em alternativas interessantes ao trabalho de Arellano-Valle and Azzalini (2013). Com base na versão univariada da distribuição TAC foi proposto um modelo de regressão linear em que os erros seguem tal distribuição. Além disso, definimos uma nova função de ligação para dados binários, com base na distribuição proposta. Desenvolvemos métodos de estimação, validação da qualidade do ajuste e comparação de modelos sob uma perspectiva totalmente bayesiana, através de algoritmos de Monte Carlo via Cadeias de Markov (MCMC). Apresentamos estudos de simulação para verificar o desempenho das abordagens propostas, bem como análises de dados reais. Os resultados indicam que as metodologias propostas apresentam resultados bastante satisfatórios. Na segunda parte estendemos as classes de modelos propostas em Padilla (2014), Santos et al. (2013) e Bazán et al. (2006), considerando estruturas de um único e vários grupos, submetido(s) à um único ou vários testes unidimensional(nais) ou multidimensional(nais) (que mensuram mais de um traço latente) com itens dicotômicos (ou dicotomizados). A modelagem consiste em usar a distribuição TAC (versões uni e multivariada) para definir a Função de Resposta do Item (FRI) e a(s) distribuição(ões) dos traços latentes. Desenvolvemos métodos de estimação, validação da qualidade do ajuste e comparação de modelos, com base em uma abordagem totalmente bayesiana, através de algoritmos MCMC com verossimilhanças aumentadas (dados aumentados). Realizamos estudos de simulação para avaliar o desempenho dos modelos / algoritmos propostos sob diferentes cenários de interesse prático. Os resultados indicam que as metodologias propostas apresentam resultados bastante satisfatórios. Também são apresentadas aplicações em conjuntos de dados reais. Na terceira parte, estendemos os modelos da TRI, previamente desenvolvidos, permitindo a utilização de informações adicionais disponíveis (covariáveis ou fatores associados), como sexo ou curso de interesse no vestibular, como acontece nos exames de admissão de algumas universidades. Estudos de simulação e aplicações em conjuntos de dados reais são apresentados, nos quais constatamos o comportamento bastante satisfatório das metodologias apresentadas. Finalmente, na quarta parte, apresentamos algumas contribuições relativas a mecanismos de verificação da qualidade de ajuste do modelo e comparação de modelos, através de análises de resíduos, checagem preditiva a posteriori e algoritmos RJMCMC (MCMC de saltos reversíveis). Tais ferramentas também foram avaliadas através de estudos de simulação apropriados e aplicações em dados reais. Os resultados indicam que as metodologias propostas apresentam resultados bastante satisfatórios

Abstract: This work consists of four major parts, which correspond to contributions related to Item Response Theory (IRT), regarding item response function modeling, latent traits distribution modeling, model fit assessment and model selection. In the first part, we propose new versions of the univariate and multivariate centered skew-t distributions, which are named Centered Skew-t (CSt) distributions. They extend the works of Azzalini (1985) and Padilla (2014) and represent interesting alternatives to the work of Arellano-Valle and Azzalini (2013). Based on the univariate version of the Cst distribution, a linear regression model with errors following such distribution was proposed. Also, we define a new link function for binary data analysis based on the proposed distribution. We develop estimation methods under a fully Bayesian perspective and present simulation studies in order to verify the performance of the proposed approaches, as well as real data analyses. The results indicate that the developed methodologies perform quite well. In the second part we extend the model classes proposed in Padilla (2014), Santos et al. (2013) and Bazán et al. (2006), considering situations in which the subjects belong to different groups and they are submitted to different unidimensional or multidimensional (that measures more than one latent trait) tests with dichotomous (or dichotomized) items. The approach consists of using the CSt distribution to define the Item Response Function (IRF) and to model the distribution of the latent traits. We develop estimation methods, model fit assessment and model comparison tools, based on a fully Bayesian approach, through Markov Chain Monte Carlo (MCMC) algorithms using augmented likelihoods (augmented data). We carry out simulation studies to assess the performance of the proposed models/algorithms under different scenarios of practical interest. The results indicate that the proposed methodologies provide satisfactory results. Applications on real data sets are also presented. In the third part, we extend the IRT models previously developed, to allow them to use available collateral information (Associated Factors), as gender or desired course, as it happens on the admissions exams of some universities. Simulation studies and applications on real data sets are presented, where we verified the satisfactory behavior of the proposed methodologies. Finally, we present some contributions related to mechanisms of model fit assessment and comparison, through techniques based on residual analysis, posterior predictive model checking and RJMCMC (Reversible Jump MCMC) algorithms. These tools were also evaluated through appropriate simulation studies
Subject: Teoria da resposta ao item
Métodos MCMC (Estatística)
Distribuição normal assimétrica
Language: Inglês
Editor: [s.n.]
Citation: PADILLA GÓMEZ, Juan Leonardo. Bayesian inference for multidimensional item response models under heavy tail skewed latent trait distributions and link functions: Inferência Bayesiana para modelos de resposta ao item multidimensionais sob distribuições para os traços latentes e funções de ligação assimétricas de caudas pesadas . 2018. 1 recurso online (230 p.) Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica, Campinas, SP.
Date Issue: 2018
Appears in Collections:IMECC - Tese e Dissertação

Files in This Item:
File SizeFormat 
PadillaGomez_JuanLeonardo_D.pdf7.87 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.