Automações não-supervisionadas na abordagem de seleção dinâmica de atributos baseada na fronteira de pareto

dc.contributor.advisorCanuto, Anne Magaly de Paula
dc.contributor.advisor-co1Araújo, Daniel Sabino Amorim de
dc.contributor.advisor-co1IDhttps://orcid.org/0000-0001-5572-0505pt_BR
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/4744754780165354pt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/1357887401899097pt_BR
dc.contributor.authorJesus, Jhoseph Kelvin Lopes de
dc.contributor.authorLatteshttp://lattes.cnpq.br/8707612770138733pt_BR
dc.contributor.referees1Fontes, Aluisio Igor Rego
dc.contributor.referees2Santos, Araken de Medeiros
dc.contributor.referees3Carvalho, Bruno Motta de
dc.date.accessioned2024-05-15T14:09:22Z
dc.date.available2024-05-15T14:09:22Z
dc.date.issued2023-08-25
dc.description.abstractMany feature selection strategies have been developed in the past decades, using different criteria to select the most relevant features. The use of dynamic feature selection, however, has shown that using multiple criteria simultaneously to determine the best subset of features for similar instances can provide encouraging results. Although the use of dynamic selection has alleviated some of the limitations found in traditional selection methods, the exclusive use of supervised evaluation criteria and the manual definition of the amount of groups to be used, lead to limitations of complex problem analysis in unsupervised settings. In this context, this thesis proposes three strands of the dynamic feature selection approach based on the pareto frontier, in the preprocessing context and one strand in the classification context. The first is related to the inclusion of unsupervised criteria in the base version of PF-DFS/M. The second (PF-DFS/P) and third (PF-DFS/A) strands are variations of the base version, where they include, respectively, partial and full automation of the definition of the number of groups to be used in the preprocessing process through the use of an internal validation index committee. The automation of the hyperparameter concerning the number of groups allows, instead of arbitrary choice, mechanisms to be used that can help researchers deal with unlabeled databases, or even constitute an analysis under labeled databases. The last strand proposes the use of a dynamic clustering weighting mechanism to allow that instead of considering only one group of features to train classifiers and test instances, each instance can select a portion of features based on the proportion of similarity to all feature groups. Both real and artificial datasets were used in the investigative analyses. The results found in the empirical analyses employed in this thesis are promising, demonstrating that PF-DFS, with partial and complete automation of the definition of the number of groups to be used and the use of dynamic clustering weighting strategies, can obtain superior results to the feature selection methods used as a comparative basis, as well as when compared to the original dataset.pt_BR
dc.description.resumoMuitas estratégias de seleção de atributos foram desenvolvidas nas últimas décadas, usando diferentes critérios para selecionar as características mais relevantes. O uso da seleção dinâmica de atributos, entretanto, mostrou que o uso de múltiplos critérios simultaneamente para determinar o melhor subconjunto de atributos para instâncias similares pode fornecer resultados encorajadores. Embora o uso da seleção dinâmica tenha atenuado parte das limitações encontradas em métodos de seleção tradicionais, a utilização exclusiva de critério de avaliação supervisionados e a definição manual da quantidade de grupos a serem utilizados, conduzem a limitações de análises de problemas complexos em cenários não-supervisionados. Neste contexto, esta tese propõe três vertentes da abordagem de seleção dinâmica de atributos baseada na fronteira de pareto, no contexto de pré-processamento e uma vertente no contexto de classificação. A primeira está relacionada com a inclusão de critérios não-supervisionados na versão base do PF-DFS/M. A segunda (PF-DFS/P) e terceira (PF-DFS/A) vertentes são variações da versão base, onde incluem, respectivamente, a automatização parcial e total da definição da quantidade de grupos a serem utilizados no processo de pré-processamento através do uso de um comitê de índices de validação interno. A automatização do hiperparâmetro referente a quantidade de grupos permite que, ao invés da escolha arbitrária, sejam utilizados mecanismos que possam auxiliar pesquisadores a lidar com bases de dados não-rotuladas, ou até mesmo a constituir uma análise sob bases rotuladas. A última vertente propõe a utilização de uma mecanismo de ponderação por agrupamento dinâmico para permitir que ao invés de considerar apenas um grupo de atributos para treinar classificadores e testar instâncias, cada instância possa selecionar uma porção de atributos baseada na proporção da similaridade com todos os grupos de atributos. Nas análises investigativas foram utilizados conjuntos de dados reais e artificiais. Os resultados encontrados nas análises empíricas empregadas nesta tese são promissores, demonstrando que o PF-DFS, com a automatização parcial e total da definição da quantidade de grupos a serem utilizados e a utilização da estratégias de ponderação por agrupamento dinâmico, são capazes de obter resultados superiores aos métodos de seleção de atributos utilizados como base comparativa, bem como quando comparado ao conjunto original de dados.pt_BR
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESpt_BR
dc.identifier.citationJESUS, Jhoseph Kelvin Lopes de. Automações não-supervisionadas na abordagem de seleção dinâmica de atributos baseada na fronteira de pareto. Orientador: Dra. Anne Magály de Paula Canuto. 2023. 110f. Tese (Doutorado em Ciência da Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2023.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/58337
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃOpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectComputaçãopt_BR
dc.subjectPré-processamentopt_BR
dc.subjectSeleção de atributospt_BR
dc.subjectAnálise de dadospt_BR
dc.subjectAlgoritmos de agrupamentopt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOpt_BR
dc.titleAutomações não-supervisionadas na abordagem de seleção dinâmica de atributos baseada na fronteira de paretopt_BR
dc.title.alternativeUnsupervised automations for a pareto-front-based dynamic feature selectionpt_BR
dc.typedoctoralThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
Automacoesnaosupervisionadas_Jesus_2023.pdf
Tamanho:
2.2 MB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar