Um estudo de caso de coleta e pré-processamento de dados na aplicação de processamento de linguagem natural

dc.contributor.advisorLins, Hertz Wilton de Castro
dc.contributor.advisorIDhttps://orcid.org/0000-0003-1138-4276pt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/7712686175574736pt_BR
dc.contributor.authorMedeiros, Gabriel Santos de
dc.contributor.authorLatteshttp://lattes.cnpq.br/0962179514513083pt_BR
dc.contributor.referees1D'Assunção, Adaildo Gomes
dc.contributor.referees1Latteshttp://lattes.cnpq.br/4159638862269940pt_BR
dc.contributor.referees2Arrais Júnior, Ernano
dc.contributor.referees2Latteshttp://lattes.cnpq.br/4024477389642547pt_BR
dc.date.accessioned2022-08-09T11:26:08Z
dc.date.available2022-08-09T11:26:08Z
dc.date.issued2022-07-14
dc.description.abstractThe present work is part of the text mining area, a field with a wide range of applications in several areas and a great potential to keep growing due to the technologies constantly being developed to allow better natural language processing in an automated way. In the area of telecommunications, however, not much effort was seen in these studies. With this in mind, the present work aims to show how the collection and pre-processing of data for Natural Language Processing (NLP) applications is carried out, as well as to make an introductory analysis of the information obtained from one selected newspaper. To this end, a case study was made detailing the generation of the database through web crawling of the chosen scientific journal, and the data treatments that are necessary to prepare this information for text mining, all implemented in the language python. As a result, this processing generated data that allowed a preliminary analysis of the articles of the International Journal of Interactive Mobile Technologies (iJIM), which showed even more possibilities for text mining.pt_BR
dc.description.resumoO presente trabalho se insere na área de mineração de texto, que é um campo com uma ampla gama de aplicações que já foi estudado em diversas áreas e tem um grande potencial de crescimento devido às tecnologias que estão em constante desenvolvimento para permitir um melhor processamento da linguagem natural de forma automatizada. Na área de telecomunicações, porém, não se foi visto muito afinco nesses estudos. Tendo isso em mente, o presente trabalho objetiva mostrar como é feita a coleta e pré-processamento dos dados para aplicações de Processamento de Linguagem Natural (PLN), bem como fazer uma análise introdutória das informações obtidas de um jornal científico. Para tal, foi feito um estudo de caso detalhando a formação do banco de dados por meio do web crawling da revista científica escolhida, e os tratamentos dos dados que são necessários fazer para preparar essas informações para a mineração de texto, tudo isso implementado na linguagem python. Como resultados, esse processamento gerou dados que permitiram uma análise preliminar sobre os artigos da revista International Journal of Interactive Mobile Technologies (iJIM), que mostrou ainda mais possibilidades para a mineração de texto.pt_BR
dc.identifier.citationMEDEIROS, Gabriel Santos de. Um estudo de caso de coleta e pré-processamento de dados na aplicação de processamento de linguagem natural. 2022. 41f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Telecomunicações) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2022pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/49109
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentEngenharia de Comunicaçõespt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programEngenharia de Telecomunicaçõespt_BR
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/*
dc.subjectMineração de textopt_BR
dc.subjectWeb crawlingpt_BR
dc.subjectPythonpt_BR
dc.subjectProcessamento de linguagem naturalpt_BR
dc.subjectInteligência artificialpt_BR
dc.subjectAprendizado de máquinapt_BR
dc.subjectText miningpt_BR
dc.subjectWeb crawlingpt_BR
dc.subjectPythonpt_BR
dc.subjectData pre-processingpt_BR
dc.subjectNatural language processingpt_BR
dc.subjectArtificial intelligencept_BR
dc.subjectMachine learningpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAOpt_BR
dc.titleUm estudo de caso de coleta e pré-processamento de dados na aplicação de processamento de linguagem naturalpt_BR
dc.title.alternativeA case study of data collection and pre-processing for natural language processing applicationpt_BR
dc.typebachelorThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
UmEstudodeCaso_Medeiros_2022.pdf
Tamanho:
862.68 KB
Formato:
Adobe Portable Document Format
Descrição:
TCC Gabriel S Medeiros
Nenhuma Miniatura disponível
Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.45 KB
Formato:
Item-specific license agreed upon to submission
Nenhuma Miniatura disponível
Baixar