Automações não-supervisionadas na abordagem de seleção dinâmica de atributos baseada na fronteira de pareto
dc.contributor.advisor | Canuto, Anne Magaly de Paula | |
dc.contributor.advisor-co1 | Araújo, Daniel Sabino Amorim de | |
dc.contributor.advisor-co1ID | https://orcid.org/0000-0001-5572-0505 | pt_BR |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/4744754780165354 | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/1357887401899097 | pt_BR |
dc.contributor.author | Jesus, Jhoseph Kelvin Lopes de | |
dc.contributor.authorLattes | http://lattes.cnpq.br/8707612770138733 | pt_BR |
dc.contributor.referees1 | Fontes, Aluisio Igor Rego | |
dc.contributor.referees2 | Santos, Araken de Medeiros | |
dc.contributor.referees3 | Carvalho, Bruno Motta de | |
dc.date.accessioned | 2024-05-15T14:09:22Z | |
dc.date.available | 2024-05-15T14:09:22Z | |
dc.date.issued | 2023-08-25 | |
dc.description.abstract | Many feature selection strategies have been developed in the past decades, using different criteria to select the most relevant features. The use of dynamic feature selection, however, has shown that using multiple criteria simultaneously to determine the best subset of features for similar instances can provide encouraging results. Although the use of dynamic selection has alleviated some of the limitations found in traditional selection methods, the exclusive use of supervised evaluation criteria and the manual definition of the amount of groups to be used, lead to limitations of complex problem analysis in unsupervised settings. In this context, this thesis proposes three strands of the dynamic feature selection approach based on the pareto frontier, in the preprocessing context and one strand in the classification context. The first is related to the inclusion of unsupervised criteria in the base version of PF-DFS/M. The second (PF-DFS/P) and third (PF-DFS/A) strands are variations of the base version, where they include, respectively, partial and full automation of the definition of the number of groups to be used in the preprocessing process through the use of an internal validation index committee. The automation of the hyperparameter concerning the number of groups allows, instead of arbitrary choice, mechanisms to be used that can help researchers deal with unlabeled databases, or even constitute an analysis under labeled databases. The last strand proposes the use of a dynamic clustering weighting mechanism to allow that instead of considering only one group of features to train classifiers and test instances, each instance can select a portion of features based on the proportion of similarity to all feature groups. Both real and artificial datasets were used in the investigative analyses. The results found in the empirical analyses employed in this thesis are promising, demonstrating that PF-DFS, with partial and complete automation of the definition of the number of groups to be used and the use of dynamic clustering weighting strategies, can obtain superior results to the feature selection methods used as a comparative basis, as well as when compared to the original dataset. | pt_BR |
dc.description.resumo | Muitas estratégias de seleção de atributos foram desenvolvidas nas últimas décadas, usando diferentes critérios para selecionar as características mais relevantes. O uso da seleção dinâmica de atributos, entretanto, mostrou que o uso de múltiplos critérios simultaneamente para determinar o melhor subconjunto de atributos para instâncias similares pode fornecer resultados encorajadores. Embora o uso da seleção dinâmica tenha atenuado parte das limitações encontradas em métodos de seleção tradicionais, a utilização exclusiva de critério de avaliação supervisionados e a definição manual da quantidade de grupos a serem utilizados, conduzem a limitações de análises de problemas complexos em cenários não-supervisionados. Neste contexto, esta tese propõe três vertentes da abordagem de seleção dinâmica de atributos baseada na fronteira de pareto, no contexto de pré-processamento e uma vertente no contexto de classificação. A primeira está relacionada com a inclusão de critérios não-supervisionados na versão base do PF-DFS/M. A segunda (PF-DFS/P) e terceira (PF-DFS/A) vertentes são variações da versão base, onde incluem, respectivamente, a automatização parcial e total da definição da quantidade de grupos a serem utilizados no processo de pré-processamento através do uso de um comitê de índices de validação interno. A automatização do hiperparâmetro referente a quantidade de grupos permite que, ao invés da escolha arbitrária, sejam utilizados mecanismos que possam auxiliar pesquisadores a lidar com bases de dados não-rotuladas, ou até mesmo a constituir uma análise sob bases rotuladas. A última vertente propõe a utilização de uma mecanismo de ponderação por agrupamento dinâmico para permitir que ao invés de considerar apenas um grupo de atributos para treinar classificadores e testar instâncias, cada instância possa selecionar uma porção de atributos baseada na proporção da similaridade com todos os grupos de atributos. Nas análises investigativas foram utilizados conjuntos de dados reais e artificiais. Os resultados encontrados nas análises empíricas empregadas nesta tese são promissores, demonstrando que o PF-DFS, com a automatização parcial e total da definição da quantidade de grupos a serem utilizados e a utilização da estratégias de ponderação por agrupamento dinâmico, são capazes de obter resultados superiores aos métodos de seleção de atributos utilizados como base comparativa, bem como quando comparado ao conjunto original de dados. | pt_BR |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES | pt_BR |
dc.identifier.citation | JESUS, Jhoseph Kelvin Lopes de. Automações não-supervisionadas na abordagem de seleção dinâmica de atributos baseada na fronteira de pareto. Orientador: Dra. Anne Magály de Paula Canuto. 2023. 110f. Tese (Doutorado em Ciência da Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2023. | pt_BR |
dc.identifier.uri | https://repositorio.ufrn.br/handle/123456789/58337 | |
dc.language | pt_BR | pt_BR |
dc.publisher | Universidade Federal do Rio Grande do Norte | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.initials | UFRN | pt_BR |
dc.publisher.program | PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Computação | pt_BR |
dc.subject | Pré-processamento | pt_BR |
dc.subject | Seleção de atributos | pt_BR |
dc.subject | Análise de dados | pt_BR |
dc.subject | Algoritmos de agrupamento | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO | pt_BR |
dc.title | Automações não-supervisionadas na abordagem de seleção dinâmica de atributos baseada na fronteira de pareto | pt_BR |
dc.title.alternative | Unsupervised automations for a pareto-front-based dynamic feature selection | pt_BR |
dc.type | doctoralThesis | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- Automacoesnaosupervisionadas_Jesus_2023.pdf
- Tamanho:
- 2.2 MB
- Formato:
- Adobe Portable Document Format
Nenhuma Miniatura disponível