Identificação automática de medicamentos em textos da justiça federal do Rio Grande do Norte com base em técnicas de processamento de linguagem natural

Araujo, Patricia Sayonara Goes de

Identificação automática de medicamentos em textos da justiça federal do Rio Grande do Norte com base em técnicas de processamento de linguagem natural

Página do item simplificado Estatísticas

dc.contributor.advisor	Menezes Neto, Elias Jacob de
dc.contributor.advisor-co1	Magalhães, Ismenia Blavatsky de
dc.contributor.author	Araujo, Patricia Sayonara Goes de
dc.contributor.referees1	Bezerra, Leonardo César Teonacio
dc.contributor.referees2	Gurgel, Andre Morais
dc.date.accessioned	2023-11-20T16:46:12Z
dc.date.available	2023-11-20T16:46:12Z
dc.date.issued	2023-10-30
dc.description.abstract	This work aims to automatically identify and quantify requests for medications in legal cases from the Federal Small Claims Court (JEFs) in Rio Grande do Norte, Brazil, using Natural Language Processing (NLP) and Machine Learning (ML) techniques. We extracted 65,875 documents from the JEFs' CRETA system and refined them to a balanced subset between initial petitions and sentences (n=11,364). We performed data cleaning, treatment and label review. We created a weak supervision pipeline to label records regarding involvement with healthcare (n=6,196). We evaluated BioBERTpt models for named entity recognition to detect medications. We applied the best model to extract terms and associated them with ANVISA/CMED tables for standardization and pricing. Finally, we developed Qlik Sense dashboards to quantify expenses and visualize medication demands. The main challenges were computational constraints and difficulties in model evaluation due to problems with the manually labeled sample. We conclude that NLP and ML techniques have great potential to extract insights from legal cases.	pt_BR
dc.description.resumo	Este trabalho tem como objetivo identificar e quantificar automaticamente os pedidos por medicamentos em processos dos Juizados Especiais Federais (JEFs) do Rio Grande do Norte, Brasil, utilizando técnicas de Processamento de Linguagem Natural (PLN) e Aprendizado de Máquina (AM). Foram extraídos 65.875 documentos do sistema CRETA dos JEFs, sendo refinados para um subconjunto balanceado entre petições iniciais e sentenças (n=11.364). Realizou-se limpeza, tratamento e revisão dos rótulos. Criou-se um pipeline de supervisão fraca para rotular os registros quanto ao envolvimento com a área da saúde (n=6.196). Foram avaliados modelos BioBERTpt para reconhecimento de entidades nomeadas, a fim de detectar medicamentos. O melhor modelo foi aplicado para extrair os termos e associá-los às tabelas da ANVISA/CMED para padronização e obtenção de preços. Por fim, painéis no Qlik Sense foram desenvolvidos para quantificar gastos e visualizar as demandas por medicamentos. Os principais desafios foram limitações computacionais e dificuldades na avaliação dos modelos devido a problemas na amostra rotulada manualmente. Conclui-se que técnicas de PLN e AM possuem grande potencial para extrair insights em processos jurídicos.	pt_BR
dc.identifier.citation	ARAUJO, Patricia Sayonara Goes de. Identificação automática de medicamentos em textos da justiça federal do Rio Grande do Norte com base em técnicas de processamento de linguagem natural. 2023. 61 f. Trabalho de Conclusão de Curso (Especialização em Residência em Tecnologia da Informação) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2023.	pt_BR
dc.identifier.uri	https://repositorio.ufrn.br/handle/123456789/55391
dc.language	pt_BR	pt_BR
dc.publisher	Universidade Federal do Rio Grande do Norte	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.initials	UFRN	pt_BR
dc.subject	Aprendizado de Máquina	pt_BR
dc.subject	Processamento de Linguagem Natural	pt_BR
dc.subject	Reconhecimento de Entidade Nomeada	pt_BR
dc.subject	Supervisão Fraca	pt_BR
dc.subject	Qlik Sense	pt_BR
dc.title	Identificação automática de medicamentos em textos da justiça federal do Rio Grande do Norte com base em técnicas de processamento de linguagem natural	pt_BR
dc.type	bachelorThesis	pt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: TCC-Patrícia Sayonara Góes de Araújo.pdf
Tamanho:: 1.23 MB
Formato:: Adobe Portable Document Format

Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 1.45 KB
Formato:: Item-specific license agreed upon to submission

Baixar

Coleções

IMD - Residência em Tecnologia da Informação

SIGAA

Identificação automática de medicamentos em textos da justiça federal do Rio Grande do Norte com base em técnicas de processamento de linguagem natural

Arquivos

Pacote Original

Licença do Pacote

Coleções