Programa de Pós-Graduação em Bioinformática - IMD
URI Permanente desta comunidadehttps://repositorio.ufrn.br/handle/123456789/24561
Navegar
Navegando Programa de Pós-Graduação em Bioinformática - IMD por Assunto "Análise de variantes"
Agora exibindo 1 - 2 de 2
- Resultados por página
- Opções de Ordenação
Dissertação Implementação de funcionalidades para uma plataforma de análise de variantes e novos métodos para prover melhor acurácia na identificação de mutações patogênicas(2018-09-21) Nascimento, Priscilla Machado do; Souza, Jorge Estefano Santana de; ; ; Ferreira, Beatriz Stransky; ; Pasquali, Matheus Augusto de Bittencourt;Os atuais avanços científicos, no âmbito da genômica, têm sido proporcionados devido à crescente extração de informações significativas do DNA, em virtude do uso das novas tecnologias disponibilizadas para realização da análise dos dados genéticos. Considerando que um dos desafios atuais da medicina de precisão é identificar quais das mutações detectadas pelo processo de sequenciamento têm um papel possível na resposta a um tratamento, na tumorigênese ou no diagnóstico, propomos que através desse estudo fosse implementado um componente de melhora de um produto de software (ViVa), responsável por oferecer assistência aos dados coletados. Foi aprimorado, com o intuito de tornar as análises mais eficientes e sua visualização mais precisa. Este trabalho propõe a implementação de novas funcionalidades que agreguem valor ao produto, contribuindo diretamente na automatização e aperfeiçoamento dos processos realizados pelas ferramentas de análise de variantes disponíveis no mercado. Visando uma aplicabilidade prática do que foi desenvolvido, foi proposta uma análise dos dados públicos utilizados para anotar os variantes desse sistema. Para isso, foi realizado um estudo referente aos dados dos preditores existentes, através do qual foi identificado que a acurácia média dos preditores gira em torno de 85%. Porém, apesar desta taxa ser consideravelmente alta, também foi possível observar que existe um alto grau de discordância entre os preditores em relação a identificação do impacto mutacional e sua patogenicidade. Com o intuito melhorar essa acurácia, descrevemos a criação de uma árvore de decisão, e a discretização de características (atributos provenientes de integração das bases de dados). Nos testes realizados, quando comparamos os resultados obtidos em nossa árvore de decisão com os preditores, a nossa árvore de decisão alcançou a maior precisão em todas as variáveis testadas: verdadeiros neutros 87%, falsos neutros 6%, falsos patogênicos 13%, verdadeiros patogênicos 94%.Tese Seleção de características de sequências para resolução de perguntas biológicas ligadas à análise de variantes e ao desenvolvimento de siRNAs Anti-SARS-CoV-2(Universidade Federal do Rio Grande do Norte, 2021-09-21) Medeiros, Inácio Gomes; Souza, Jorge Estefano Santana de; Souza, Jorge Estefano Santana de; 17623795899; http://lattes.cnpq.br/8058577659019910; http://lattes.cnpq.br/8058577659019910; http://lattes.cnpq.br/8450369742588953; Santos, Araken de Medeiros; http://lattes.cnpq.br/8059198436766378; Ferreira, Beatriz Stransky; http://lattes.cnpq.br/3142264445097872; Santos, Sidney Emanuel Batista dos; http://lattes.cnpq.br/9809924843125163; Petta, Tirzah Braz; http://lattes.cnpq.br/9979644969955564A análise de variantes em um contexto clínico e o suporte ao desenvolvimento de terapias contra doenças virais são duas áreas em que diversas pesquisas têm utilizado processos de integração e análise de dados ômicos. Aferir se uma dada variante possui ou não impacto patogênico é um desafio presente na análise de variantes, inclusive quando diferentes ferramentas de predição de patogenicidade apontam resultados divergentes. Em relação ao desenvolvimento de terapias baseadas em RNA de interferência, observa-se que existe uma necessidade contínua de desenho e avaliação de eficiência de novos RNAs pequenos de interferência (siRNAs, do inglês short-interfing RNAs) a cada novo vírus que surge, como o SARS-CoV-2, responsável pela pandemia de COVID-19. Nessa direção, argumenta-se nesta tese, a partir da discussão de dois trabalhos, que processos de integração de dados e seleção de características podem trazer contribuições na resolução de questões ligadas à identificação de patogenicidade de variantes e, em um segundo momento, à disponibilização de informação e características de sequências que podem vir a servir para a formulação de terapias para a COVID-19. Em linhas gerais, o estudo objetivou (a) desenvolver métodos de integração de dados e seleção de características de variantes para aferição de patogenicidade e (b) desenvolver métodos de integração de dados visando a construção de um banco de dados de siRNAs para SARS-CoV-2. Para atingir o primeiro objetivo, foi proposto um modelo de classificação baseado em árvores de decisão para estimar a patogenicidade de variantes, construído por meio de um processo de integração de dados públicos de variantes já catalogadas com predições de patogenicidade trazidas por ferramentas baseadas em aprendizado de máquina. O modelo obtido foi capaz de apresentar uma acurácia superior ao estado da arte relativo à predição de patogenicidade de variantes, constituindo-se em uma importante ferramenta de apoio a profissionais de saúde, como nos diagnósticos de doenças genéticas. No segundo objetivo, combinou-se dados de propriedades estruturais, termodinâmicas, toxicidade, similaridade e de eficiência com o intuito de montar um catálogo global de siRNAs para o SARS-CoV-2. A integração de propriedades diversas relativas a siRNAs em uma única base de dados consolida-se como um referencial de informação que permite a realização de filtragens in silico simples e direcionadas, poupando a execução de muitos testes de bancadas em cima de moléculas candidatas para terapias contra a COVID-19. Esses estudos possuem pontos em comum com outros de integração de dados da literatura, entre eles, aspectos envolvendo diversidade dos dados, reprodutibilidade e descoberta de conhecimento. Por fim, verificou-se que estes trabalhos possuem potencial de aplicação clínica, seja para incrementar a compreensão de variantes relacionadas a comorbidades genéticas diversas, no caso do primeiro trabalho, como no apoio ao desenvolvimento de terapias contra a COVID-19, no caso do segundo trabalho.