Um estudo de caso de coleta e pré-processamento de dados na aplicação de processamento de linguagem natural

Medeiros, Gabriel Santos de

Um estudo de caso de coleta e pré-processamento de dados na aplicação de processamento de linguagem natural

Página do item simplificado Estatísticas

dc.contributor.advisor	Lins, Hertz Wilton de Castro
dc.contributor.advisorID	https://orcid.org/0000-0003-1138-4276	pt_BR
dc.contributor.advisorLattes	http://lattes.cnpq.br/7712686175574736	pt_BR
dc.contributor.author	Medeiros, Gabriel Santos de
dc.contributor.authorLattes	http://lattes.cnpq.br/0962179514513083	pt_BR
dc.contributor.referees1	D'Assunção, Adaildo Gomes
dc.contributor.referees1Lattes	http://lattes.cnpq.br/4159638862269940	pt_BR
dc.contributor.referees2	Arrais Júnior, Ernano
dc.contributor.referees2Lattes	http://lattes.cnpq.br/4024477389642547	pt_BR
dc.date.accessioned	2022-08-09T11:26:08Z
dc.date.available	2022-08-09T11:26:08Z
dc.date.issued	2022-07-14
dc.description.abstract	The present work is part of the text mining area, a field with a wide range of applications in several areas and a great potential to keep growing due to the technologies constantly being developed to allow better natural language processing in an automated way. In the area of telecommunications, however, not much effort was seen in these studies. With this in mind, the present work aims to show how the collection and pre-processing of data for Natural Language Processing (NLP) applications is carried out, as well as to make an introductory analysis of the information obtained from one selected newspaper. To this end, a case study was made detailing the generation of the database through web crawling of the chosen scientific journal, and the data treatments that are necessary to prepare this information for text mining, all implemented in the language python. As a result, this processing generated data that allowed a preliminary analysis of the articles of the International Journal of Interactive Mobile Technologies (iJIM), which showed even more possibilities for text mining.	pt_BR
dc.description.resumo	O presente trabalho se insere na área de mineração de texto, que é um campo com uma ampla gama de aplicações que já foi estudado em diversas áreas e tem um grande potencial de crescimento devido às tecnologias que estão em constante desenvolvimento para permitir um melhor processamento da linguagem natural de forma automatizada. Na área de telecomunicações, porém, não se foi visto muito afinco nesses estudos. Tendo isso em mente, o presente trabalho objetiva mostrar como é feita a coleta e pré-processamento dos dados para aplicações de Processamento de Linguagem Natural (PLN), bem como fazer uma análise introdutória das informações obtidas de um jornal científico. Para tal, foi feito um estudo de caso detalhando a formação do banco de dados por meio do web crawling da revista científica escolhida, e os tratamentos dos dados que são necessários fazer para preparar essas informações para a mineração de texto, tudo isso implementado na linguagem python. Como resultados, esse processamento gerou dados que permitiram uma análise preliminar sobre os artigos da revista International Journal of Interactive Mobile Technologies (iJIM), que mostrou ainda mais possibilidades para a mineração de texto.	pt_BR
dc.identifier.citation	MEDEIROS, Gabriel Santos de. Um estudo de caso de coleta e pré-processamento de dados na aplicação de processamento de linguagem natural. 2022. 41f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Telecomunicações) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2022	pt_BR
dc.identifier.uri	https://repositorio.ufrn.br/handle/123456789/49109
dc.language	pt_BR	pt_BR
dc.publisher	Universidade Federal do Rio Grande do Norte	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.department	Engenharia de Comunicações	pt_BR
dc.publisher.initials	UFRN	pt_BR
dc.publisher.program	Engenharia de Telecomunicações	pt_BR
dc.rights	Attribution-NonCommercial-NoDerivs 3.0 Brazil	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/br/	*
dc.subject	Mineração de texto	pt_BR
dc.subject	Web crawling	pt_BR
dc.subject	Python	pt_BR
dc.subject	Processamento de linguagem natural	pt_BR
dc.subject	Inteligência artificial	pt_BR
dc.subject	Aprendizado de máquina	pt_BR
dc.subject	Text mining	pt_BR
dc.subject	Web crawling	pt_BR
dc.subject	Python	pt_BR
dc.subject	Data pre-processing	pt_BR
dc.subject	Natural language processing	pt_BR
dc.subject	Artificial intelligence	pt_BR
dc.subject	Machine learning	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAO	pt_BR
dc.title	Um estudo de caso de coleta e pré-processamento de dados na aplicação de processamento de linguagem natural	pt_BR
dc.title.alternative	A case study of data collection and pre-processing for natural language processing application	pt_BR
dc.type	bachelorThesis	pt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: UmEstudodeCaso_Medeiros_2022.pdf
Tamanho:: 862.68 KB
Formato:: Adobe Portable Document Format
Descrição:: TCC Gabriel S Medeiros

Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 1.45 KB
Formato:: Item-specific license agreed upon to submission

Baixar

Coleções

CT - TCC - Engenharia de Telecomunicações

SIGAA

Um estudo de caso de coleta e pré-processamento de dados na aplicação de processamento de linguagem natural

Arquivos

Pacote Original

Licença do Pacote

Coleções