Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/322802
Type: TESE DIGITAL
Title: Modelos de estimativa do teor de açúcar como ferramentas para tomada de decisão e para descoberta de conhecimento no setor sucroenergético
Title Alternative: Sugar content estimate models as decision making and knowledge discovery tools for the sugarcane sector
Author: Oliveira, Monique Pires Gravina de, 1988-
Advisor: Rodrigues, Luiz Henrique Antunes, 1959-
Abstract: Resumo: Ferramentas para geração de estimativas do teor de açúcar nos colmos da cana-de-açúcar durante a safra podem auxiliar o tomador de decisão do setor sucroenergético tanto no planejamento da produção quanto no planejamento comercial. Atualmente, são utilizadas com esta finalidade curvas de maturação ou médias históricas, desprezando a variabilidade do clima e o impacto do manejo da produção. Modelos de crescimento são alternativas a essas estratégias, mas os modelos já desenvolvidos, em geral, ou utilizam técnicas inadequadas ou não contemplam algumas das variáveis que interferem nos processos de acúmulo de açúcar nos colmos. Sendo assim, foram desenvolvidos modelos para predição da pol da cana-de-açúcar utilizando técnicas de aprendizado de máquina e os dados disponíveis no banco de dados da própria usina, dispensando coleta de dados adicionais. Observou-se que os erros obtidos pelos modelos são inferiores aos erros obtidos frente ao uso de médias históricas. Também foi observado como a variabilidade meteorológica interfere no desempenho do modelo, e como a presença de um ano atípico pode comprometer as estimativas obtidas. Quando a estratégia de avaliação promoveu maior variabilidade no conjunto de treino, o erro da melhor técnica utilizada ¿ Random Forest ¿ atingiu 0,58% de pol da cana, enquanto o erro da referência foi de 1,01 %. Este erro, porém, atingiu 1,19 % para a Random Forest e 1,27 % para a referência, quando o modelo foi avaliado em um ano atípico. Foi constatado, por meio da identificação feita pelo algoritmo RReliefF das variáveis que mais impactam o atributo meta, como mais variáveis, além das comumente utilizadas na modelagem, interferem na pol da cana. Além disso, a inclusão de informações do manejo realizado nos primeiros 30 dias do ciclo da cultura levou a modelos com desempenho próximo ao dos modelos em que foi incluído o manejo realizado em todo o ciclo. Isso implica modelos que demandam somente uma estimativa do manejo inicial a ser realizado na cultura e que, ao serem treinados em dados de safras em que ocorreu alta variabilidade climática, levam a modelos com melhores estimativas do que as atualmente disponíveis, sem a necessidade de coleta de dados adicionais

Abstract: Tools devised to estimate the sugar content in sugarcane stalks during the harvesting season may help the decision maker in the sugarcane industry both during production planning and commercial strategies planning. Currently, variety-specific maturity curves and historical averages are used with this aim, ignoring climate variability and the impacts of agricultural practices in the production. Crop growth models are alternatives to these strategies, but the models already developed often either use techniques that are inappropriate or do not account for all the variables that interfere in the processes that govern sucrose storage in the stalks. For that reason, models for sugar content prediction were developed using machine learning techniques and data already available in the sugarcane mill databases, dismissing further data collection. Mean absolute errors obtained by the models are lower than those obtained by historical averages. It was observed how weather variability interferes in model performance and how one atypical year may compromise the obtained estimates. When the evaluation strategy promoted larger variability in the dataset, the error of the technique that performed best ¿ Random Forest ¿ reached 0.58 % (in sugar content), while the reference reached 1.01 %. The error, however, reached 1.19 % for Random Forest and 1.27 % for the reference when the model was evaluated in one atypical year. It was also possible to determine, through the selection made by the algorithm RReliefF, which variables were the most influent in the sucrose accumulation process and how more variables than the ones usually included in the models interfere in the process. Furthermore, including agricultural practices performed in the first 30 days of the cycle leads to models that performed almost as well as the models in which the practices for the whole cycle were included. This means that models that demand estimates for the practices that take place only in the beginning of the cycle and that were developed with data of seasons in which occurred high weather variability lead to models with better estimates than the ones currently available without the need for additional data gathering
Subject: Aprendizado de máquina
Cana-de-açúcar
Mineração de Dados
Editor: [s.n.]
Date Issue: 2017
Appears in Collections:FEAGRI - Dissertação e Tese

Files in This Item:
File SizeFormat 
Oliveira_MoniquePiresGravinaDe_M.pdf4.77 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.