Inferring geographical location of images [recurso eletrônico] = Inferência de localização geográfica de imagens
Thiago Resek Fabri dos Anjos
DISSERTAÇÃO
Inglês
T/UNICAMP R311i
[Inferência de localização geográfica de imagens]
Campinas, SP : [s.n.], 2022.
1 recurso online (70 p.) : il., digital, arquivo PDF.
Orientador: Anderson de Rezende Rocha
Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação
Resumo: Ser capaz de associar uma imagem com a localização geográfica onde ela foi obtida, sem o uso de informação adicional além da própria imagem, é um problema de interesse para várias áreas como jornalismo e ciência forense digital. Atualmente, dada a disponibilidade praticamente global de...
Ver mais
Resumo: Ser capaz de associar uma imagem com a localização geográfica onde ela foi obtida, sem o uso de informação adicional além da própria imagem, é um problema de interesse para várias áreas como jornalismo e ciência forense digital. Atualmente, dada a disponibilidade praticamente global de imagens de satélite com informações de localização, inferir a localização geográfica de uma imagem pode ser reduzido a um problema de casamento de imagens de diferentes pontos de vista (imagens de solo e imagens de satélite). Neste trabalho, apresentamos e estudamos os primeiros passos para o desenvolvimento de um algoritmo não-supervisionado para o problema de casamento de imagens de solo e de satélite. Exploramos e estudamos as relações de adjacências entre pontos de referência visíveis em ambas as imagens, e como tais relações podem se manter mesmo com a mudança de ponto de vista. Apresentamos um algoritmo baseado em comparação de grafos que visa localizar o ponto de vista de uma imagem a nível de solo (um panorama em 360 graus) dentro de uma imagem aérea mais ampla da mesma região. Tal algoritmo recebe como entrada um conjunto de pontos de referência, inicialmente extraídos de forma manual, e funciona por meio do casamento de grafos de pontos de referência de ambos os pontos de vista, de acordo com um modelo de probabilidade especificamente desenvolvido para o problema. Em sequência, foi desenvolvido um processo automático para extração de tais pontos de referência, baseado em segmentação semântica de imagens, processo que incluiu a obtenção de um novo conjunto de dados e o treinamento de uma rede neural específicos para o problema de segmentação de imagens de satélite. Isto permite a criação de um procedimento totalmente automatizado para a localização de imagens baseada em casamento de grafos. Por fim, apresentamos um estudo detalhado do funcionamento do algoritmo proposto, inclusive a adaptação de alguns parâmetros, e também possíveis extensões como, por exemplo, o uso de aprendizagem profunda (deep learning) para pósprocessamentos nos grafos, mitigando possíveis erros gerados em etapas anteriores
Ver menos
Abstract: Associating an image to its geographical location, without the use of data besides the image itself, is a significant concern in journalism and digital forensics. Given the availability of geo-tagged satellite imagery for most of the Earth’s surface, retrieving the location of a generic...
Ver mais
Abstract: Associating an image to its geographical location, without the use of data besides the image itself, is a significant concern in journalism and digital forensics. Given the availability of geo-tagged satellite imagery for most of the Earth’s surface, retrieving the location of a generic picture can be addressed as a cross-view image matching between aerial and ground views. In this work, we propose initial steps toward a fully-unsupervised algorithm for ground to aerial image matching, exploiting and focusing on the view-invariant adjacency relationships between landmarks appearing in both views. We introduce a graph-based strategy that, given a set of (initially manually annotated) landmarks, localizes the viewpoint of a ground-level 360-degree image within a broad aerial view of the same area, by matching the respective landmark graphs according to a specifically designed likelihood model. We further develop a process to automatically extract landmarks, based on semantic segmentation, including the collection of a new dataset and the training of a convolutional neural network for aerial image semantic segmentation. We develop a fully-automated pipeline for localization based on graph matching. We also present an in-depth study of how this algorithm works, in terms of parameter-tuning, and potential extensions, such as applying a Deep Learning approach to post-process the generated graph and mitigate mistakes from previous steps, among others
Ver menos
Requisitos do sistema: Software para leitura de arquivo em PDF
Inferring geographical location of images [recurso eletrônico] = Inferência de localização geográfica de imagens
Thiago Resek Fabri dos Anjos
Inferring geographical location of images [recurso eletrônico] = Inferência de localização geográfica de imagens
Thiago Resek Fabri dos Anjos