Identificação automática de medicamentos em textos da justiça federal do Rio Grande do Norte com base em técnicas de processamento de linguagem natural
dc.contributor.advisor | Menezes Neto, Elias Jacob de | |
dc.contributor.advisor-co1 | Magalhães, Ismenia Blavatsky de | |
dc.contributor.author | Araujo, Patricia Sayonara Goes de | |
dc.contributor.referees1 | Bezerra, Leonardo César Teonacio | |
dc.contributor.referees2 | Gurgel, Andre Morais | |
dc.date.accessioned | 2023-11-20T16:46:12Z | |
dc.date.available | 2023-11-20T16:46:12Z | |
dc.date.issued | 2023-10-30 | |
dc.description.abstract | This work aims to automatically identify and quantify requests for medications in legal cases from the Federal Small Claims Court (JEFs) in Rio Grande do Norte, Brazil, using Natural Language Processing (NLP) and Machine Learning (ML) techniques. We extracted 65,875 documents from the JEFs' CRETA system and refined them to a balanced subset between initial petitions and sentences (n=11,364). We performed data cleaning, treatment and label review. We created a weak supervision pipeline to label records regarding involvement with healthcare (n=6,196). We evaluated BioBERTpt models for named entity recognition to detect medications. We applied the best model to extract terms and associated them with ANVISA/CMED tables for standardization and pricing. Finally, we developed Qlik Sense dashboards to quantify expenses and visualize medication demands. The main challenges were computational constraints and difficulties in model evaluation due to problems with the manually labeled sample. We conclude that NLP and ML techniques have great potential to extract insights from legal cases. | pt_BR |
dc.description.resumo | Este trabalho tem como objetivo identificar e quantificar automaticamente os pedidos por medicamentos em processos dos Juizados Especiais Federais (JEFs) do Rio Grande do Norte, Brasil, utilizando técnicas de Processamento de Linguagem Natural (PLN) e Aprendizado de Máquina (AM). Foram extraídos 65.875 documentos do sistema CRETA dos JEFs, sendo refinados para um subconjunto balanceado entre petições iniciais e sentenças (n=11.364). Realizou-se limpeza, tratamento e revisão dos rótulos. Criou-se um pipeline de supervisão fraca para rotular os registros quanto ao envolvimento com a área da saúde (n=6.196). Foram avaliados modelos BioBERTpt para reconhecimento de entidades nomeadas, a fim de detectar medicamentos. O melhor modelo foi aplicado para extrair os termos e associá-los às tabelas da ANVISA/CMED para padronização e obtenção de preços. Por fim, painéis no Qlik Sense foram desenvolvidos para quantificar gastos e visualizar as demandas por medicamentos. Os principais desafios foram limitações computacionais e dificuldades na avaliação dos modelos devido a problemas na amostra rotulada manualmente. Conclui-se que técnicas de PLN e AM possuem grande potencial para extrair insights em processos jurídicos. | pt_BR |
dc.identifier.citation | ARAUJO, Patricia Sayonara Goes de. Identificação automática de medicamentos em textos da justiça federal do Rio Grande do Norte com base em técnicas de processamento de linguagem natural. 2023. 61 f. Trabalho de Conclusão de Curso (Especialização em Residência em Tecnologia da Informação) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2023. | pt_BR |
dc.identifier.uri | https://repositorio.ufrn.br/handle/123456789/55391 | |
dc.language | pt_BR | pt_BR |
dc.publisher | Universidade Federal do Rio Grande do Norte | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.initials | UFRN | pt_BR |
dc.subject | Aprendizado de Máquina | pt_BR |
dc.subject | Processamento de Linguagem Natural | pt_BR |
dc.subject | Reconhecimento de Entidade Nomeada | pt_BR |
dc.subject | Supervisão Fraca | pt_BR |
dc.subject | Qlik Sense | pt_BR |
dc.title | Identificação automática de medicamentos em textos da justiça federal do Rio Grande do Norte com base em técnicas de processamento de linguagem natural | pt_BR |
dc.type | bachelorThesis | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- TCC-Patrícia Sayonara Góes de Araújo.pdf
- Tamanho:
- 1.23 MB
- Formato:
- Adobe Portable Document Format
Nenhuma Miniatura disponível
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.45 KB
- Formato:
- Item-specific license agreed upon to submission
Nenhuma Miniatura disponível