Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/335418
Type: TESE DIGITAL
Degree Level: Doutorado
Title: Uso de séries temporais de imagens landsat para mapeamento e estimativa da produtividade de cana-de-açúcar a partir do algoritmo random forest
Title Alternative: Landsat time series for sugarcane mapping and yield estimation using the random forest algorithm
Author: Luciano, Ana Claudia dos Santos, 1989-
Advisor: Rocha, Jansle Vieira, 1961-
Abstract: Resumo: O monitoramento da dinâmica espaço-temporal da cultura de cana-de-açúcar, tais como área plantada, área colhida, regiões de expansão e produção é essencial nas tomadas de decisões gerenciais do setor sucroenergético brasileiro. Neste estudo, foram criados modelos para mapeamento e estimativa da produtividade da cana-de-açúcar, a partir de série temporal de imagens do satélite Landsat. As imagens foram obtidas e processadas na plataforma Google Earth Engine (GEE). Foram calculados seis índices de vegetação (NDVI, NDMI, EVI, SAVI, NDWI1, NDWI2) e, em seguida foi feita uma composição mensal destes índices com as bandas do vermelho (Red), infravermelho próximo (NIR) e infravermelho de ondas curtas (SWIR1 e SWIR2). Os modelos de mapeamento e predição da produtividade foram feitos a partir do algoritmo de aprendizado de máquina Random Forest (RF). O mapeamento das áreas de cana-de-açúcar consistiu em uma classificação orientada a objetos (OBIA), com generalização temporal e espacial, aplicada em regiões produtoras de cana-de-açúcar no estado de São Paulo. A generalização temporal foi feita a partir de mapas de referência de 8 anos (2009-2016), para as seguintes condições: a) treinamento e validação inter-anual (M1); b) treinamento com vários anos e validação em ano independente (M2); c) atualização de mapas a partir da detecção de mudanças com treinamento de vários anos (M3). Os modelos de generalização espacial consideraram, além da generalização temporal (M2), o uso de dados de treinamento em vários locais do estado de São Paulo e validação em anos e locais independentes. Os modelos de classificação M1 e M2 apresentaram Dice coefficient (DC) médio de 0,84 e 0,91, respectivamente. O modelo de classificação com generalização espacial apresentou DC médio de 0,89. O modelo empírico de estimativa da produtividade utilizou as imagens de satélite, dados agronômicos e climáticos. Os dados agronômicos, obtidos em nível talhão no oeste do estado de São Paulo, foram tipo de solos, variedade, estágio de corte, produtividade, entre outros. Já para os dados climáticos, foram utilizados dados históricos de estações meteorológicas (p.e., precipitação, temperatura, radiação solar) e dados de precipitação do ECMWF para o cálculo do índice SPI. Foram criados modelos de produtividade utilizando: a) dados do satélite Landsat e dados meteorológicos (RF1); b) dados agronômicos e dados meteorológicos (RF2); c) combinação de dados Landsat, agronômicos e meteorológicos (RF3). Para os modelos RF2 e RF3 foi testado a inclusão da data de colheita como variável preditora (RF4 e RF5). O modelo RF3 apresentou os melhores ajustes em comparação aos modelos RF1 e RF2 (R²=0,74 e RMSE= 9,7 ton ha-¹). Com a inclusão da data de colheita (RF5), o R² foi de 0,76. As principais variáveis espectrais tanto para o mapeamento como para estimativa de produtividade da cana-de-açúcar foram os índices e as bandas relacionados às regiões espectrais do SWIR e do NIR (p.e., NDMI, EVI). A classificação com generalização espacial e temporal consiste em uma ferramenta de baixo custo e recurso para mapear cana-de-açúcar em grandes áreas. Já os modelos de produtividade se mostram promissores para estimativa de produtividade de cana-de-açúcar em escala local. As séries temporais de imagens de satélite representam um grande ganho para o monitoramento e planejamento da produção de cana-de-açúcar

Abstract: The monitoring of spatial-temporal dynamics of sugarcane areas, such as planted and harvested area, expansion and production regions is essential to decision making of Brazilian sugar-energy sector. In this study, it were created models to map sugarcane areas and to forecast sugarcane yield, using Landsat satellite time series. The images were obtained and processed on Google Earth Engine (GEE). Six vegetation indices (NDVI, NDMI, EVI, SAVI, NDWI1, NDWI2) were calculated, followed by a mensal composition of these indices with the red (Red), near infrared (NIR) and short wave infrared (SWIR1 e SWIR2) spectral bands. The models of mapping and prediction of yield were done based on Random Forest (RF) machine learning algorithm. The mapping of sugarcane areas consisted on objected based image classification (OBIA), associated with temporal and spatial generalization, applied on sugarcane areas of Sao Paulo state. The time generalization was done using reference maps from 8 years (2009-2016), for the following conditions: a) training and testing using inter-annual data (M1); b) training with several years and testing on independent years (M2); c) change detection using a map updating with several years of training (M3). The model with spatial generalization used the time generalization (M2) and training data from several sites around the Sao Paulo state, and the validation process was done on independent sites. The M1 and M2 models showed Dice coefficient (DC) average of 0.84 and 0.91, respectively. The classification model with spatial generalization showed DC average of 0.89. The empirical model for forecasting sugarcane yield used satellite, agronomic and climatic data. The agronomic data from sugarcane fields of sugarcane areas from west of Sao Paulo state, were associated with soil type, variety, harvests number, yield, among others. For the meteorological data, historical data from meteorological stations (e.g., precipitation, temperature, solar radiation) and precipitation from ECMWF for the SPI index calculation were used. We created sugarcane yield models, using: a) satellite and meteorological data (RF1); b) agronomic and meteorological data (RF2); c) combination of satellite, agronomic and meteorological data (RF3). For the RF2 and RF3 models were tested the inclusion of harvest date as a predictor variable was tested (RF4 e RF5). The RF3 model showed the best adjustments when compared to RF1 e RF2 models (R²=0.74 and RMSE= 9.7 ton ha-¹). After the inclusion of harvest date (RF5), the R² was 0.76. The most important spectral variables for sugarcane mapping and forecasting sugarcane yield were indices and bands related to spectral regions of SWIR and NIR (e.g., NDMI and EVI). The spatial and temporal generalization classification of sugarcane areas consist on a tool of low cost and resource to map sugarcane over large areas. The yield models are promising to forecast sugarcane yield at local scale. The satellite images time series represent a major gain for sugarcane production monitoring and planning
Subject: Agricultura - Sensoriamento remoto
Classificação
Agricultura - Previsão
Mineração de Dados
Aprendizado de máquina
Language: Multilíngua
Editor: [s.n.]
Citation: LUCIANO, Ana Claudia dos Santos. Uso de séries temporais de imagens landsat para mapeamento e estimativa da produtividade de cana-de-açúcar a partir do algoritmo random forest. 2019. 1 recurso online (90 p.). Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Agrícola, Campinas, SP.
Date Issue: 2019
Appears in Collections:FEAGRI - Tese e Dissertação

Files in This Item:
File SizeFormat 
Luciano_AnaClaudiaDosSantos_D.pdf16.37 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.