Desenvolvimento de ferramentas para a análise de metagenomas

dc.contributor.advisorDalmolin, Rodrigo Juliani Siqueira
dc.contributor.advisorID0000-0002-1688-6155pt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/4065178015615979pt_BR
dc.contributor.authorCavalcante, João Vitor Ferreira
dc.contributor.authorID0000-0001-7513-7376pt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/5714602163308583pt_BR
dc.contributor.referees1Lima, João Paulo Matos Santos
dc.contributor.referees1IDhttps://orcid.org/0000-0002-6113-8834pt_BR
dc.contributor.referees1Latteshttp://lattes.cnpq.br/3289758851760692pt_BR
dc.contributor.referees2Souza, Iara Dantas de
dc.contributor.referees2IDhttps://orcid.org/0000-0002-2550-6150pt_BR
dc.contributor.referees2Latteshttp://lattes.cnpq.br/8983310940285796pt_BR
dc.date.accessioned2023-02-14T14:40:45Z
dc.date.available2023-02-14T14:40:45Z
dc.date.issued2022-12-09
dc.description.abstractMetagenomics is the study of the total genetic content of an environmental sample, the environment being any from a soil sample to a human biopsy or any source of microorganisms. Metagenomic data can be generated by the whole-genome shotgun (WGS) method, in which all DNA fragments gathered from the sample are sequenced. The process of analyzing shotgun metagenomic data in bioinformatics comprehends many diverse steps, usually consisting of sequence pre-processing, taxonomic classification, functional annotation and assembly of these fragmented sequences - called reads - into contiguous sequences - or contigs. To this end, you must first select a set of tools that can, from the raw data, generate interpretable and insightful results. However, the selection of these tools remains a challenge, especially since it’s an influencing factor in the accuracy, formatting and the type of identifiers present in the final result - which therefore influences the biological discovery itself. In this work, we propose MEDUSA, a modular workflow that comprises a variety of tools, capable of executing read pre-processing, taxonomic classification, sequence alignment against a reference database, read assembly and functional annotation of genes. MEDUSA’s development was realized through a comparison of multiple tools through performance benchmarks and also the development of new tools, those being annotate, that performs functional annotation of alignment hits, and MicroView, which processes taxonomic classification results into an interactive report, containing quality control and biodiversity metrics. Through the selection and development of these tools, we provide to the field of metagenomics a new highly customizable and easy to set up methodology, which equates to or surpasses current alternatives.pt_BR
dc.description.resumoA metagenômica é uma abordagem que envolve o estudo do conteúdo genético total de uma amostra ambiental, podendo o ambiente ser desde uma amostra de solo a uma biópsia humana - em suma, qualquer fonte de microorganismos. Dados metagenômicos podem ser gerados pela metodologia chamada sequenciamento (shotgun) de genoma completo (SGC), que consiste no sequenciamento de todos os fragmentos de DNA obtidos da amostra, independente da presença ou ausência de marcadores. A análise de dados de metagenomas shotgun na bioinformática compreende várias diferentes etapas, contendo tipicamente o pré-processamento das sequências obtidas, a classificação taxonômica dessas sequências, a anotação funcional dos genes presentes e a montagem dessas sequências fragmentadas - as leituras - em sequências contíguas. Para este fim, é selecionado um conjunto de ferramentas computacionais que consigam, a partir do dado bruto, obter resultados interpretáveis e que gerem novas descobertas biológicas. No entanto, a escolha do ferramental ainda é um desafio visto que é um fator de alto impacto na acurácia, na formatação e no tipo de identificador obtido no resultado final - que, consequentemente, influenciará na busca de uma resposta biológica. No trabalho atual, propomos o MEDUSA, um fluxo de trabalho modular abrangendo uma série de ferramentas, capaz de executar o pré-processamento das sequências, a classificação taxonômica, o alinhamento contra um banco de dados referência, a montagem das sequências e a anotação funcional dos genes. O processo de desenvolvimento do MEDUSA envolveu a seleção de ferramentas para cada uma dessas etapas através de comparações de suas performances, ou benchmarks, e também o desenvolvimento em si de novas ferramentas, como o annotate, que realiza a anotação funcional de identificadores obtidos no alinhamento, e o MicroView, que processa resultados da classificação taxonômica, produzindo um relatório interativo com métricas de qualidade e biodiversidade. Através da seleção e do desenvolvimento desse conjunto de ferramentas, buscamos fornecer à metagenômica uma metodologia customizável de fácil configuração e execução que se equipare ou supere as alternativas atuais.pt_BR
dc.identifier.citationCAVALCANTE, João Vitor Ferreira. Desenvolvimento de ferramentas para a análise de metagenomas. 2022. 60 f. Trabalho de Conclusão de Curso (Graduação em Biomedicina) – Centro de Biociências, Universidade Federal do Rio Grande do Norte, Natal, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/51278
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programBiomedicinapt_BR
dc.subjectMetagenômicapt_BR
dc.subjectSequenciamento shotgunpt_BR
dc.subjectBioinformáticapt_BR
dc.subjectFluxo de trabalhopt_BR
dc.subjectClassificação taxonômicapt_BR
dc.subjectMetagenomicspt_BR
dc.subjectShotgun sequencingpt_BR
dc.subjectBioinformaticspt_BR
dc.subjectWorkflowpt_BR
dc.subjectTaxonomic classificationpt_BR
dc.titleDesenvolvimento de ferramentas para a análise de metagenomaspt_BR
dc.typebachelorThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
DesenvolvimentodeFerramentas_Cavalcante_2022.pdf
Tamanho:
1021.5 KB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.45 KB
Formato:
Item-specific license agreed upon to submission
Nenhuma Miniatura disponível
Baixar