Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/332089
Type: DISSERTAÇÃO DIGITAL
Degree Level: Mestrado
Title: Dynamic ensemble mechanisms to improve particulate matter forecasting : Mecanismos para ensemble dinâmicos aplicados para a previsão de material particulado
Title Alternative: Mecanismos para ensemble dinâmicos aplicados para a previsão de material particulado
Author: Bueno Barajas, Jorge Andrés, 1991-
Advisor: Coelho, Guilherme Palermo, 1980-
Abstract: Resumo: Partículas sólidas e gotículas microscópicas suspensas no ar, conhecidas como material particulado (MP), podem afetar significativamente não só a saúde humana, mas também os sistemas urbanos, naturais e agrícolas. Portanto, é imperativo manter os níveis de concentração destes poluentes abaixo de limiares nocivos. Para isso, os mecanismos de previsão são particularmente relevantes, pois podem ajudar os órgãos públicos e agências ambientais a definir estratégias para controlar a concentração de MP na atmosfera. As ferramentas de previsão baseadas em Aprendizagem de Máquinas têm sido usadas para estimar a concentração de MP e outros poluentes na atmosfera, devido à sua capacidade de aprender com exemplos e identificar relações nos dados, sem serem explicitamente programadas para isto. No entanto, a maioria destas técnicas foi desenvolvida para aprender à partir de dados com distribuições de probabilidade estacionárias e, como é provável que as distribuições dos dados de concentração de MP mudem ao longo do tempo, o que é conhecido como concept drift, tais técnicas podem oferecer acurácia limitada. O objetivo geral deste trabalho é avaliar se algoritmos online de aprendizado de máquina, combinados a técnicas de detecção de concept drift tais como ensembles e janelas deslizantes, podem melhorar a acurácia da estimativa de valores futuros de MP. Neste trabalho, foram comparados algoritmos online e offline baseados em Extreme Learning Machines (ELM), a fim de avaliar seu desempenho quando são aplicados para prever as concentrações diárias de MP, especificamente partículas com diâmetro aerodinâmico inferior a 10 ?m (conhecidas como MP10). Experimentos foram realizados utilizando conjuntos de dados reais de concentração de MP10 de diferentes cidades do Estado de São Paulo, Brasil. Os resultados obtidos indicaram que os dados de concentração de MP evoluem lentamente com o passar do tempo, o que levou à proposição de novos mecanismos que permitem manter a informação de conceitos anteriores nos ensembles. Tais mecanismos têm mostrado bom desempenho em ensembles dinâmicos

Abstract: Microscopically small solid particles and liquid droplets suspended in the air, known as particulate matter (PM), may significantly affect not only human health, but also urban, natural and agricultural systems. Therefore, it is imperative to keep the concentration levels of these pollutants below harmful thresholds. To do so, forecasting mechanisms are particularly relevant, as they may help public offices and environmental agencies define strategies to control PM concentration in the atmosphere. Forecasting tools based on Machine Learning have been used to estimate the concentration of PM and other pollutants in the atmosphere, as they are capable of learning from examples and identifying hidden insights in the data without being explicitly programmed. Nevertheless, most of these techniques were developed to learn from data with stationary probability distributions and, considering that PM data are uninterruptedly collected, thus producing a stream of data whose distribution may evolve over time, which is known as concept drift, such traditional machine learning techniques may offer limited accuracy. The overall goal of this work is to evaluate whether online sequential learning, combined with mechanisms and techniques to handle concept drift such as ensemble learning and sliding windows, can improve the estimation accuracy of PM forecasting. Online and offline algorithms based on Extreme Learning Machines (ELM) were compared, in order to evaluate their performance when applied to forecast daily concentrations of PM, specifically particles with aerodynamic diameter smaller than 10 ?m (known as PM10). The experiments were performed using real world datasets of PM10 concentration from different cities of the State of São Paulo, Brazil. The obtained results indicate that PM data distributions slowly evolve over time, so new mechanisms were proposed to keep information of past concepts into ensembles, so they can adapt to new concepts. These new mechanisms have shown good performance in dynamic ensembles
Subject: Mineração de dados (Computação)
Aprendizado de máquina
Language: Inglês
Editor: [s.n.]
Citation: BUENO BARAJAS, Jorge Andrés. Dynamic ensemble mechanisms to improve particulate matter forecasting: Mecanismos para ensemble dinâmicos aplicados para a previsão de material particulado. 2018. 1 recurso online (91 p.). Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Tecnologia, Limeira, SP.
Date Issue: 2018
Appears in Collections:FT - Tese e Dissertação

Files in This Item:
File SizeFormat 
Barajas_JorgeAndresBueno_M.pdf3.25 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.