Um estudo de caso de coleta e pré-processamento de dados na aplicação de processamento de linguagem natural
dc.contributor.advisor | Lins, Hertz Wilton de Castro | |
dc.contributor.advisorID | https://orcid.org/0000-0003-1138-4276 | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/7712686175574736 | pt_BR |
dc.contributor.author | Medeiros, Gabriel Santos de | |
dc.contributor.authorLattes | http://lattes.cnpq.br/0962179514513083 | pt_BR |
dc.contributor.referees1 | D'Assunção, Adaildo Gomes | |
dc.contributor.referees1Lattes | http://lattes.cnpq.br/4159638862269940 | pt_BR |
dc.contributor.referees2 | Arrais Júnior, Ernano | |
dc.contributor.referees2Lattes | http://lattes.cnpq.br/4024477389642547 | pt_BR |
dc.date.accessioned | 2022-08-09T11:26:08Z | |
dc.date.available | 2022-08-09T11:26:08Z | |
dc.date.issued | 2022-07-14 | |
dc.description.abstract | The present work is part of the text mining area, a field with a wide range of applications in several areas and a great potential to keep growing due to the technologies constantly being developed to allow better natural language processing in an automated way. In the area of telecommunications, however, not much effort was seen in these studies. With this in mind, the present work aims to show how the collection and pre-processing of data for Natural Language Processing (NLP) applications is carried out, as well as to make an introductory analysis of the information obtained from one selected newspaper. To this end, a case study was made detailing the generation of the database through web crawling of the chosen scientific journal, and the data treatments that are necessary to prepare this information for text mining, all implemented in the language python. As a result, this processing generated data that allowed a preliminary analysis of the articles of the International Journal of Interactive Mobile Technologies (iJIM), which showed even more possibilities for text mining. | pt_BR |
dc.description.resumo | O presente trabalho se insere na área de mineração de texto, que é um campo com uma ampla gama de aplicações que já foi estudado em diversas áreas e tem um grande potencial de crescimento devido às tecnologias que estão em constante desenvolvimento para permitir um melhor processamento da linguagem natural de forma automatizada. Na área de telecomunicações, porém, não se foi visto muito afinco nesses estudos. Tendo isso em mente, o presente trabalho objetiva mostrar como é feita a coleta e pré-processamento dos dados para aplicações de Processamento de Linguagem Natural (PLN), bem como fazer uma análise introdutória das informações obtidas de um jornal científico. Para tal, foi feito um estudo de caso detalhando a formação do banco de dados por meio do web crawling da revista científica escolhida, e os tratamentos dos dados que são necessários fazer para preparar essas informações para a mineração de texto, tudo isso implementado na linguagem python. Como resultados, esse processamento gerou dados que permitiram uma análise preliminar sobre os artigos da revista International Journal of Interactive Mobile Technologies (iJIM), que mostrou ainda mais possibilidades para a mineração de texto. | pt_BR |
dc.identifier.citation | MEDEIROS, Gabriel Santos de. Um estudo de caso de coleta e pré-processamento de dados na aplicação de processamento de linguagem natural. 2022. 41f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Telecomunicações) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2022 | pt_BR |
dc.identifier.uri | https://repositorio.ufrn.br/handle/123456789/49109 | |
dc.language | pt_BR | pt_BR |
dc.publisher | Universidade Federal do Rio Grande do Norte | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Engenharia de Comunicações | pt_BR |
dc.publisher.initials | UFRN | pt_BR |
dc.publisher.program | Engenharia de Telecomunicações | pt_BR |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | * |
dc.subject | Mineração de texto | pt_BR |
dc.subject | Web crawling | pt_BR |
dc.subject | Python | pt_BR |
dc.subject | Processamento de linguagem natural | pt_BR |
dc.subject | Inteligência artificial | pt_BR |
dc.subject | Aprendizado de máquina | pt_BR |
dc.subject | Text mining | pt_BR |
dc.subject | Web crawling | pt_BR |
dc.subject | Python | pt_BR |
dc.subject | Data pre-processing | pt_BR |
dc.subject | Natural language processing | pt_BR |
dc.subject | Artificial intelligence | pt_BR |
dc.subject | Machine learning | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAO | pt_BR |
dc.title | Um estudo de caso de coleta e pré-processamento de dados na aplicação de processamento de linguagem natural | pt_BR |
dc.title.alternative | A case study of data collection and pre-processing for natural language processing application | pt_BR |
dc.type | bachelorThesis | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- UmEstudodeCaso_Medeiros_2022.pdf
- Tamanho:
- 862.68 KB
- Formato:
- Adobe Portable Document Format
- Descrição:
- TCC Gabriel S Medeiros
Nenhuma Miniatura disponível
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.45 KB
- Formato:
- Item-specific license agreed upon to submission
Nenhuma Miniatura disponível