Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados

dc.contributor.advisorOliveira, Luiz Affonso Henderson Guedes de
dc.contributor.advisorLatteshttp://lattes.cnpq.br/7987212907837941pt_BR
dc.contributor.authorBezerra, Clauber Gomes
dc.contributor.referees1Martins, Allan de Medeiros
dc.contributor.referees1Lattesttp://lattes.cnpq.br/4402694969508077pt_BR
dc.contributor.referees1Latteshttp://lattes.cnpq.br/1125827309642732pt_BR
dc.contributor.referees2Silva, Diego Rodrigo Cabral
dc.contributor.referees3Lemos, André Paim
dc.contributor.referees3Latteshttp://lattes.cnpq.br/2426104312592166pt_BR
dc.contributor.referees4Costa, Bruno Sielly Jales
dc.contributor.referees4Latteshttp://lattes.cnpq.br/2486327435960311pt_BR
dc.date.accessioned2017-11-23T23:24:44Z
dc.date.available2017-11-23T23:24:44Z
dc.date.issued2017-05-24
dc.description.abstractIn this thesis we propose a new approach to unsupervised data clustering and classification. The proposed approach is based on typicality and eccentricity concepts. This concepts are used by recently introduced TEDA algorithm for outlier detection. To perform data clustering and classification, it is proposed a new statistical algorithm, called Auto-Cloud. The data samples analyzed by Auto-Cloud are grouped in the form of unities called data clouds, which are structures without pre-defined shape or boundaries. Auto-Cloud allows each data sample to belong to multiple data clouds simultaneously. Auto-Cloud is an autonomous and evolving algorithm, which does not requires previous training or any prior knowledge about the data set. Auto-Cloud is able to create and merge data clouds autonomously, as data samples are obtained, without any human interference. The algorithm is suitable for data clustering and classification of online data streams and application that require real-time response. Auto-Cloud is also recursive, which makes it fast and with little computational effort. The data classification process works like a fuzzy classifier using the degree of membership between the analyzed data sample to each data cloud created in clustering process. The class to which each data sample belongs is determined by the cloud with the highest activation with respect to that sample. To validate the proposed method, we apply it to several existing datasets for data clustering and classification. Moreover, the method was also used in a fault detection in industrial processes application. In this case, we use real data obtained from a real world industrial plant.pt_BR
dc.description.resumoNesta tese apresentamos uma nova abordagem para realizar o agrupamento e a classificação de um conjunto de dados de forma não supervisionada. A abordagem proposta utiliza os conceitos de tipicidade e excentricidade usados pelo algoritmo TEDA na detecção de outliers. Para realizar o agrupamento e a classificação é proposto um algoritmo estatístico chamado Auto-Cloud. As amostras analisadas pelo Auto-Cloud são agrupadas em unidades chamadas de data clouds, que são estruturas que não possuem formato ou limites definidos. O Auto-Cloud permite que cada amostra analisada possa pertencer simultaneamente a várias data clouds. O Auto-Cloud é um algoritmo autônomo e evolutivo, que não necessita de treinamento ou qualquer conhecimento prévios sobre o conjunto de dados analisado. Ele permite a criação e a fusão das data clouds de forma autônoma, à medida que as amostras são lidas, sem qualquer intervenção humana. As características do algoritmo fazem com que ele seja indicado para o agrupamento e classificação de streams de dados e para aplicações que requerem respostas em tempo-real. O Auto- Cloud também é um algoritmo recursivo, o que o torna rápido e exige pouca quantidade de memória. Já no processo de classificação dos dados, o Auto-Cloud trabalha como um classificador fuzzy, calculando o grau de pertinência entre a amostra analisada e cada data cloud criada no processo de agrupamento. A classe a que pertence cada amostra é determinada pela data cloud com maior grau de pertinência com relação a amostra. Para validar o método proposto, aplicamos o mesmo em vários conjuntos de dados existentes na literatura sobre o assunto. Além disso, o método também foi validado numa aplicação de detecção e classificação de falhas em processos industriais, onde foram utilizados dados reais, obtidos de uma planta industrial.pt_BR
dc.identifier.citationBEZERRA, Clauber Gomes. Uma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dados. 2017. 108f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2017.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/jspui/handle/123456789/24360
dc.languageporpt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectDetecção de outlierspt_BR
dc.subjectAgrupamento de dadospt_BR
dc.subjectClassificação de dadospt_BR
dc.subjectStream de dadospt_BR
dc.subjectTEDApt_BR
dc.subjectTipicidadept_BR
dc.subjectExcentricidadept_BR
dc.subjectData cloudpt_BR
dc.subjectAuto-Cloudpt_BR
dc.subject.cnpqCNPQ::ENGENHARIAS::ENGENHARIA ELETRICA E DE COMPUTAÇÃOpt_BR
dc.titleUma abordagem baseada em tipicidade e excentricidade para agrupamento e classificação de streams de dadospt_BR
dc.typedoctoralThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
ClauberGomesBezerra_TESE.pdf
Tamanho:
7.43 MB
Formato:
Adobe Portable Document Format
Carregando...
Imagem de Miniatura
Baixar