CERES - TCC - Sistemas de Informação
URI Permanente para esta coleçãohttps://repositorio.ufrn.br/handle/123456789/33179
Navegar
Navegando CERES - TCC - Sistemas de Informação por Autor "0000−0001−9845−8156"
Agora exibindo 1 - 1 de 1
- Resultados por página
- Opções de Ordenação
TCC FlexCon-CE: a semi-supervised method with an ensemble-based adaptive confidence(Universidade Federal do Rio Grande do Norte, 2023-08-22) Medeiros, Arthur dos Santos; Vale, Karliane Medeiros Ovidio; Gorgônio, Flavius da Luz e; 0000−0002−4926−3990; 0000−0001−9845−8156; 0009-0003-3716-3022; Guerra, Fabrício Vale de Azevedo; http://lattes.cnpq.br/7860769003807018; Gorgônio, Arthur Costa; 0000−0002−1824−9600O aprendizado semissupervisionado é caracterizado por um baixo número de instâncias rotuladas e um alto número de instâncias não rotuladas. O FlexCon-C (Flexible Confidence Classifier) é um conhecido método semi-supervisionado que utiliza o algoritmo de aprendizado de autotreinamento como base para gerar modelos de predição. A principal diferença entre o autotreinamento e o FlexCon-C é que o primeiro usa um limite fixo para selecionar as instâncias não rotuladas, enquanto o último tem uma confiança ajustada dinamicamente. O FlexCon-C aplica uma equação de ajuste de confiança com base no desempenho do classificador. Nesse sentido, o desempenho do classificador é usado para selecionar e rotular instâncias não rotuladas. Em Machine Learning, é bem conhecido que o desempenho do classificador pode ser melhorado ainda mais através do uso de ensembles de classificadores. Portanto, este estudo propõe o uso de ensembles de classificadores na equação de ajuste de confiança FlexCon-C, visando fornecer uma medida mais eficiente para selecionar e rotular instâncias não rotuladas. Para avaliar a viabilidade do método proposto (FlexCon-CE), será realizada uma análise empírica, usando 20 conjuntos de dados, três diferentes algoritmos de classificação e cinco diferentes configurações de dados inicialmente não rotulados. Os resultados indicam que o método proposto superou o método tradicional, mostrando-se promissor para a tarefa de seleção e rotulagem automática de dados no contexto semi-supervisionado.