Navegando por Autor "Cavalcante, João Vitor Ferreira"
Agora exibindo 1 - 2 de 2
- Resultados por página
- Opções de Ordenação
TCC Desenvolvimento de ferramentas para a análise de metagenomas(Universidade Federal do Rio Grande do Norte, 2022-12-09) Cavalcante, João Vitor Ferreira; Dalmolin, Rodrigo Juliani Siqueira; 0000-0002-1688-6155; http://lattes.cnpq.br/4065178015615979; 0000-0001-7513-7376; http://lattes.cnpq.br/5714602163308583; Lima, João Paulo Matos Santos; https://orcid.org/0000-0002-6113-8834; http://lattes.cnpq.br/3289758851760692; Souza, Iara Dantas de; https://orcid.org/0000-0002-2550-6150; http://lattes.cnpq.br/8983310940285796A metagenômica é uma abordagem que envolve o estudo do conteúdo genético total de uma amostra ambiental, podendo o ambiente ser desde uma amostra de solo a uma biópsia humana - em suma, qualquer fonte de microorganismos. Dados metagenômicos podem ser gerados pela metodologia chamada sequenciamento (shotgun) de genoma completo (SGC), que consiste no sequenciamento de todos os fragmentos de DNA obtidos da amostra, independente da presença ou ausência de marcadores. A análise de dados de metagenomas shotgun na bioinformática compreende várias diferentes etapas, contendo tipicamente o pré-processamento das sequências obtidas, a classificação taxonômica dessas sequências, a anotação funcional dos genes presentes e a montagem dessas sequências fragmentadas - as leituras - em sequências contíguas. Para este fim, é selecionado um conjunto de ferramentas computacionais que consigam, a partir do dado bruto, obter resultados interpretáveis e que gerem novas descobertas biológicas. No entanto, a escolha do ferramental ainda é um desafio visto que é um fator de alto impacto na acurácia, na formatação e no tipo de identificador obtido no resultado final - que, consequentemente, influenciará na busca de uma resposta biológica. No trabalho atual, propomos o MEDUSA, um fluxo de trabalho modular abrangendo uma série de ferramentas, capaz de executar o pré-processamento das sequências, a classificação taxonômica, o alinhamento contra um banco de dados referência, a montagem das sequências e a anotação funcional dos genes. O processo de desenvolvimento do MEDUSA envolveu a seleção de ferramentas para cada uma dessas etapas através de comparações de suas performances, ou benchmarks, e também o desenvolvimento em si de novas ferramentas, como o annotate, que realiza a anotação funcional de identificadores obtidos no alinhamento, e o MicroView, que processa resultados da classificação taxonômica, produzindo um relatório interativo com métricas de qualidade e biodiversidade. Através da seleção e do desenvolvimento desse conjunto de ferramentas, buscamos fornecer à metagenômica uma metodologia customizável de fácil configuração e execução que se equipare ou supere as alternativas atuais.Dissertação EURYALE: fluxos de trabalho e reprodutibilidade em metagenômica(Universidade Federal do Rio Grande do Norte, 2024-12-06) Cavalcante, João Vitor Ferreira; Dalmolin, Rodrigo Juliani Siqueira; https://orcid.org/0000-0002-1688-6155; http://lattes.cnpq.br/4065178015615979; https://orcid.org/0000-0001-7513-7376; http://lattes.cnpq.br/5714602163308583; Lanza, Daniel Carlos Ferreira; Moioli, Renan Cipriano; Dantas, Marcel da Câmara RibeiroOs últimos anos têm testemunhado avanços significativos no estudo de comunidades microbianas complexas, impulsionados pela evolução das tecnologias de sequenciamento e pela crescente adoção de métodos de sequenciamento total do genoma (whole genome shotgun) em detrimento dos métodos, antes mais tradicionais, baseados em amplicon. Com essa evolução, essas abordagens foram desenvolvidas com estratégias computacionais associadas para lidar com os dados que geram. No entanto, esses métodos computacionais geralmente não foram acompanhados por estratégias de design cuidadosas que priorizam o suporte a longo prazo, com baixa necessidade de manutenção, alta acessibilidade de dados e automação de ponta a ponta. Neste trabalho, elaboramos sobre o cenário computacional em metagenômica e como os métodos atuais negligenciam princípios fundamentais de desenvolvimento de software, que poderia os orientar para uma maior reprodutibilidade, tais como isolamento de dependências, alta parametrização, geração automática de relatórios com figuras interativas que facilitam a exploração de dados e, por fim, documentação descritiva e prática. Em seguida, abordamos as limitações atuais no processamento de dados metagenômicos ao implementar um novo fluxo de trabalho de análise de dados, o EURYALE, baseado em uma metodologia anterior, o MEDUSA, que selecionou suas ferramentas por meio de rigoroso benchmarking. Esse novo fluxo de trabalho, adaptável a diferentes cenários e construído com Nextflow, utiliza boas práticas de desenvolvimento de software como princípios norteadores e visa avançar o processamento de dados metagenômicos como um todo e, adicionalmente, tornar os dados resultantes desses workflows de análise acessíveis a um público mais amplo.