Please use this identifier to cite or link to this item: http://repositorio.unicamp.br/jspui/handle/REPOSIP/359075
Type: DISSERTAÇÃO DIGITAL
Degree Level: Mestrado
Title: Using optimization models to achieve solutions in classification and clustering techniques : Utilização de modelos de optimização para obter soluções em técnicas de classificação e agrupamento
Title Alternative: Utilização de modelos de optimização para obter soluções em técnicas de classificação e agrupamento
Author: Inga Quezada, Alejandra Jimena, 1994-
Advisor: Oliveira, Washington Alves de, 1977-
Abstract: Resumo: Esta dissertação tem como objetivo estudar algumas abordagens de manipulação de bancos de dados em larga escala com o objetivo de extrair informações representativas a partir do uso de programação matemática. Os padrões estruturais dos dados fornecem informações que podem ser usadas para classificá-los e agrupá-los por meio da solução ótima de problemas específicos de otimização. As técnicas utilizadas podem ser confrontadas com abordagens de aprendizado de máquina para fornecer novas possibilidades numéricas de resolução. Testes computacionais conduzidos em dois estudos de caso (dados oriundos de experimentos práticos) validam esta pesquisa. As análises são conduzidas sobre um conjunto de dados relacionados com a identificação de tumores de câncer de mama, com diagnóstico maligno ou benigno, e um banco de dados de animais bovinos que fornecem características físicas e de raça de cada animal, porém sem um padrão previamente conhecido. Uma classificação binária com base em um modelo matemático de programação de metas é usado para o primeiro estudo de caso. No estudo conduzido sobre as características dos animais bovinos, o interesse é identificar padrões entre os diversos animais ao agrupá-los por meio da análise das soluções de um modelo de otimização linear com variáveis inteiras. Os resultados computacionais são estudados a partir de um conjunto de procedimentos estatístico descritivo para validar o estudo proposto

Abstract: This dissertation aims to study some techniques for handling large scale datasets to extract representative information from the use of mathematical programming. The structural patterns of data provide pieces of information that can be used to classify and cluster them through the optimal solution of specific optimization problems. The techniques used could be confronted with machine learning approaches to supply new numerical possibilities of resolution. Computational tests conducted on two case studies with real data (practical experiments) validate this research. The analyzes are done for the well-known database on the identification of breast cancer tumors, which either have a malignant or have a benign diagnosis, and also for a bovine animal database containing physical and breed characteristics of each animal but with unknown patterns. A binary classification based on a goal programming formulation is suggested for the first case study. In the study conducted on the characteristics of bovine animals, the interest is to identify patterns among the different animals by grouping them from the solutions of an integer linear optimization model. The computational results are studied from a set of descriptive statistical procedures to validate this research
Subject: Análise por agrupamento
Classificação
Programação matemática
Aprendizado de máquina
Language: Inglês
Editor: [s.n.]
Citation: INGA QUEZADA, Alejandra Jimena. Using optimization models to achieve solutions in classification and clustering techniques: Utilização de modelos de optimização para obter soluções em técnicas de classificação e agrupamento. 2020. 1 recurso online (104 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Ciências Aplicadas, Campinas, SP.
Date Issue: 2020
Appears in Collections:FCA - Tese e Dissertação

Files in This Item:
File SizeFormat 
IngaQuezada_AlejandraJimena_M.pdf3.38 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.