Identificação automática de medicamentos em textos da justiça federal do Rio Grande do Norte com base em técnicas de processamento de linguagem natural

dc.contributor.advisorMenezes Neto, Elias Jacob de
dc.contributor.advisor-co1Magalhães, Ismenia Blavatsky de
dc.contributor.authorAraujo, Patricia Sayonara Goes de
dc.contributor.referees1Bezerra, Leonardo César Teonacio
dc.contributor.referees2Gurgel, Andre Morais
dc.date.accessioned2023-11-20T16:46:12Z
dc.date.available2023-11-20T16:46:12Z
dc.date.issued2023-10-30
dc.description.abstractThis work aims to automatically identify and quantify requests for medications in legal cases from the Federal Small Claims Court (JEFs) in Rio Grande do Norte, Brazil, using Natural Language Processing (NLP) and Machine Learning (ML) techniques. We extracted 65,875 documents from the JEFs' CRETA system and refined them to a balanced subset between initial petitions and sentences (n=11,364). We performed data cleaning, treatment and label review. We created a weak supervision pipeline to label records regarding involvement with healthcare (n=6,196). We evaluated BioBERTpt models for named entity recognition to detect medications. We applied the best model to extract terms and associated them with ANVISA/CMED tables for standardization and pricing. Finally, we developed Qlik Sense dashboards to quantify expenses and visualize medication demands. The main challenges were computational constraints and difficulties in model evaluation due to problems with the manually labeled sample. We conclude that NLP and ML techniques have great potential to extract insights from legal cases.pt_BR
dc.description.resumoEste trabalho tem como objetivo identificar e quantificar automaticamente os pedidos por medicamentos em processos dos Juizados Especiais Federais (JEFs) do Rio Grande do Norte, Brasil, utilizando técnicas de Processamento de Linguagem Natural (PLN) e Aprendizado de Máquina (AM). Foram extraídos 65.875 documentos do sistema CRETA dos JEFs, sendo refinados para um subconjunto balanceado entre petições iniciais e sentenças (n=11.364). Realizou-se limpeza, tratamento e revisão dos rótulos. Criou-se um pipeline de supervisão fraca para rotular os registros quanto ao envolvimento com a área da saúde (n=6.196). Foram avaliados modelos BioBERTpt para reconhecimento de entidades nomeadas, a fim de detectar medicamentos. O melhor modelo foi aplicado para extrair os termos e associá-los às tabelas da ANVISA/CMED para padronização e obtenção de preços. Por fim, painéis no Qlik Sense foram desenvolvidos para quantificar gastos e visualizar as demandas por medicamentos. Os principais desafios foram limitações computacionais e dificuldades na avaliação dos modelos devido a problemas na amostra rotulada manualmente. Conclui-se que técnicas de PLN e AM possuem grande potencial para extrair insights em processos jurídicos.pt_BR
dc.identifier.citationARAUJO, Patricia Sayonara Goes de. Identificação automática de medicamentos em textos da justiça federal do Rio Grande do Norte com base em técnicas de processamento de linguagem natural. 2023. 61 f. Trabalho de Conclusão de Curso (Especialização em Residência em Tecnologia da Informação) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2023.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/55391
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsUFRNpt_BR
dc.subjectAprendizado de Máquinapt_BR
dc.subjectProcessamento de Linguagem Naturalpt_BR
dc.subjectReconhecimento de Entidade Nomeadapt_BR
dc.subjectSupervisão Fracapt_BR
dc.subjectQlik Sensept_BR
dc.titleIdentificação automática de medicamentos em textos da justiça federal do Rio Grande do Norte com base em técnicas de processamento de linguagem naturalpt_BR
dc.typebachelorThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
TCC-Patrícia Sayonara Góes de Araújo.pdf
Tamanho:
1.23 MB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.45 KB
Formato:
Item-specific license agreed upon to submission
Nenhuma Miniatura disponível
Baixar