Modeling sequential data from multiple sources using variable length Markov chains and exogenous covariates
Marília Gabriela Rocha
DISSERTAÇÃO
Inglês
T/UNICAMP R582m
[Modelagem de dados sequenciais de múltiplas fontes com cadeias de Markov de alcance variável e covariáveis exógenas]
Campinas, SP : [s.n.], 2024.
1 recurso online ( p.) : il., digital, arquivo PDF.
Orientador: Nancy Lopes Garcia
Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica
Resumo: As Cadeias de Markov de Alcance Variável com Covariáveis Exógenas são modelos estocásticos inseridos no contexto das Cadeias de Markov de Alcance Variável. Estes modelos empregam Modelos Lineares Generalizados para calcular as probabilidades de transição, considerando tanto o histórico de...
Ver mais
Resumo: As Cadeias de Markov de Alcance Variável com Covariáveis Exógenas são modelos estocásticos inseridos no contexto das Cadeias de Markov de Alcance Variável. Estes modelos empregam Modelos Lineares Generalizados para calcular as probabilidades de transição, considerando tanto o histórico de estados quanto as covariáveis exógenas dependentes do tempo. O algoritmo beta-contexto é utilizado para selecionar um sufixo finito relevante, ou contexto, para prever o próximo símbolo. Este algoritmo estima modelos flexíveis em forma de árvore, agregando estados irrelevantes no histórico do processo e permitindo que o modelo incorpore covariáveis exógenas ao longo do tempo. Nossa pesquisa amplia o algoritmo beta-contexto com alcance variável para incorporar tanto covariáveis exógenas dependentes quanto invariantes no tempo, utilizando dados de múltiplas fontes. Dentro dessa abordagem, temos uma cadeia de Markov distinta para cada fonte de dados, o que possibilita uma compreensão do comportamento do processo em diversas situações, como diferentes localizações geográficas. Apesar do uso de dados provenientes de diferentes fontes, pressupomos que todas as fontes são independentes e compartilham parâmetros idênticos - exploramos os contextos dentro de cada fonte de dados e os combinamos para calcular as probabilidades de transição, resultando em uma árvore unificada. Essa abordagem elimina a necessidade de considerações relacionadas à dependência espacial dentro do modelo. Além disso, também incorporamos modificações no procedimento de estimação para lidar com contextos que ocorrem com baixa frequência. Nossa motivação foi investigar o impacto das taxas anteriores de dengue, condições climáticas e fatores socioeconômicos nas taxas subsequentes da doença em diversos municípios do Brasil, fornecendo percepções sobre a dinâmica de transmissão da doença
Ver menos
Abstract: Variable Length Markov Chains with Exogenous Covariates (VLMCX) are stochastic models in the framework of Variable Length Markov Chains (VLMC) that use Generalized Linear Models (GLM) to compute transition probabilities, taking into account the state history and time-dependent exogenous...
Ver mais
Abstract: Variable Length Markov Chains with Exogenous Covariates (VLMCX) are stochastic models in the framework of Variable Length Markov Chains (VLMC) that use Generalized Linear Models (GLM) to compute transition probabilities, taking into account the state history and time-dependent exogenous covariates. The beta-context algorithm is used to select a relevant finite suffix, or context, for predicting the next symbol. This algorithm estimates flexible tree-structured models by aggregating irrelevant states in the process history and enables the model to incorporate exogenous covariates over time. Our research extends the beta-context model with variable length to incorporate both time-dependent and time-invariant exogenous covariates, using data from multiple sources. Within this approach, we have a distinct Markov chain for every data source, allowing for a comprehensive understanding of the process behavior across multiple situations, such as different geographic locations. Despite the use of data from different sources, we assume that all sources are independent and share identical parameters - we explore contexts within each data source and combine them to compute transition probabilities, deriving a unified tree. This approach eliminates the necessity for spatial-dependent structural considerations within the model. Furthermore, we incorporate modifications in the estimation procedure to address contexts that appear with low frequency. Our motivation was to investigate the impact of previous dengue rates, weather conditions, and socioeconomic factors on subsequent dengue rates across various municipalities in Brazil, providing insights into dengue transmission dynamics
Ver menos
Requisitos do sistema: Software para leitura de arquivo em PDF
Aberto
Modeling sequential data from multiple sources using variable length Markov chains and exogenous covariates
Marília Gabriela Rocha
Modeling sequential data from multiple sources using variable length Markov chains and exogenous covariates
Marília Gabriela Rocha