Leveraging self-supervised learning for scene recognition in child sexual abuse imagery = Aprendizado auto-supervisionado para reconhecimento de cenas em imagens de abuso sexual infantil
Pedro Henrique Vaz Valois
DISSERTAÇÃO
Inglês
T/UNICAMP V247L
[Aprendizado auto-supervisionado para reconhecimento de cenas em imagens de abuso sexual infantil]
Campinas, SP : [s.n.], 2022.
1 recurso online (97 p.) : il., digital, arquivo PDF.
Orientadores: Sandra Eliza Fontes de Avila, Jefersson Alex dos Santos
Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação
Resumo: O crime no século 21 é dividido em dois mundos. O mundo virtual se transformou em uma ameaça global para o bem-estar e a segurança das pessoas em várias nações do mundo. Os desafios que apresenta devem ser enfrentados com uma cooperação global unificada e devem contar mais do que nunca em...
Ver mais
Resumo: O crime no século 21 é dividido em dois mundos. O mundo virtual se transformou em uma ameaça global para o bem-estar e a segurança das pessoas em várias nações do mundo. Os desafios que apresenta devem ser enfrentados com uma cooperação global unificada e devem contar mais do que nunca em ferramentas automatizadas, porém confiáveis, se quisermos combater a crescente dos crimes online. Mais de 10 milhões de denúncias de abuso sexual infantil são enviadas ao Centro Nacional para Crianças Desaparecidas & Exploradas todos os anos, com mais de 80% dessas de natureza primariamente virtual. Centros de investigação e instituições de acolhimento são, portanto, incapazes de processar e investigar manualmente todas as imagens com a precisão necessária. Diante disso, há a necessidade de ferramentas automatizadas confiáveis que possam trabalhar esse tipo de material com segurança e eficiência é primordial. Particularmente, o reconhecimento de cenas é a tarefa de entender os contextos do ambiente a partir de qualquer tipo de imagem. Essa tarefa é considerada útil para agrupar e classificar dados de abuso sem usar modelos treinados nela. A escassez e as limitações envolvidas no trabalho com imagens de abuso sexual infantil levam ao uso do aprendizado autossupervisionado, uma nova metodologia de aprendizado de máquina que aproveita dados não rotulados para produzir representações robustas capazes de ser mais facilmente transferidas para tarefas de destino. Esta dissertação de Mestrado desenvolveu modelos de aprendizado profundo autossupervisionados pré-treinados em dados focados em cenas com 71,6% de acurácia balanceada em nossa tarefa de classificação de cenas de ambientes internos e, em média, 2,2 pontos percentuais de desempenho melhor do que uma versão totalmente supervisionada. Cooperamos com especialistas da Polícia Federal para avaliar nosso modelo em material de abuso sexual infantil e encontramos 36,7% de acurácia balanceada na classificação de cenas, mostrando que há uma lacuna entre a maneira como os ambientes são representados no conjuntos mais populares de classificação de ambientes e em material sensível
Ver menos
Abstract: Crime in the 21st century is split into two worlds. The virtual world has become a global menace to people's well-being and security in several nations. The challenges it presents must be faced with unified global cooperation and must rely more than ever on automated yet trustworthy tools...
Ver mais
Abstract: Crime in the 21st century is split into two worlds. The virtual world has become a global menace to people's well-being and security in several nations. The challenges it presents must be faced with unified global cooperation and must rely more than ever on automated yet trustworthy tools if we wish to combat the ever-growing nature of online offenses. Over 10 million child sexual abuse reports are submitted to National Center for Missing & Exploited Children every year, with more than 80\% from online sources. Therefore, investigation centers and clearinghouses cannot process and correctly investigate all imagery manually. In light of that, reliable automated tools that can securely and efficiently work this kind of material is paramount. Mainly, scene recognition is the task of understanding environment contexts from any kind of image. This task is helpful in grouping and classifying child sexual abuse data without using trained models. The scarcity and limitations involved in working with child sexual abuse images lead to self-supervised learning, a novel machine learning methodology that leverages unlabeled data to produce powerful representations that can be more easily transferred to target tasks. This Master's thesis shows that self-supervised deep learning models pretrained on scene-centric data can reach 71.6% balanced accuracy on our indoor scene classification task, and on average 2.2 percentage points better performance than a full supervised version. We cooperate with Brazilian Federal Police experts to evaluate our indoor classification model on actual children abuse material and find 36.7% balanced accuracy on scene classification, showing a gap between the features on popular scene datasets and those depicted on sensitive material
Ver menos
Requisitos do sistema: Software para leitura de arquivo em PDF
Aberto
Avila, Sandra Eliza Fontes de, 1982-
Orientador
Santos, Jefersson Alex dos, 1984-
Coorientador
Moreira, Daniel Henriques, 1983-
Avaliador
Medeiros, Claudia Maria Bauzer, 1954-
Avaliador
Leveraging self-supervised learning for scene recognition in child sexual abuse imagery = Aprendizado auto-supervisionado para reconhecimento de cenas em imagens de abuso sexual infantil
Pedro Henrique Vaz Valois
Leveraging self-supervised learning for scene recognition in child sexual abuse imagery = Aprendizado auto-supervisionado para reconhecimento de cenas em imagens de abuso sexual infantil
Pedro Henrique Vaz Valois