Medusa: um fluxo de trabalho para classificação taxonômica e anotação funcional de metagenomas

dc.contributor.advisorDalmolin, Rodrigo Juliani Siqueira
dc.contributor.advisor-co1Dalmolin, Rodrigo Juliani Siqueira
dc.contributor.advisorIDhttps://orcid.org/0000-0002-1688-6155pt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/4065178015615979pt_BR
dc.contributor.authorMorais, Diego Arthur de Azevedo
dc.contributor.authorIDhttps://orcid.org/0000-0002-7357-3446pt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/0627546477822130pt_BR
dc.contributor.referees1Souza, Jorge Estefano de Santana
dc.contributor.referees1Latteshttp://lattes.cnpq.br/8058577659019910pt_BR
dc.contributor.referees2Lima, Lucymara Fassarella Agnez
dc.contributor.referees2IDhttps://orcid.org/0000-0003-0642-3162pt_BR
dc.contributor.referees2Latteshttp://lattes.cnpq.br/1083882171718362pt_BR
dc.contributor.referees3Guizelini, Dieval
dc.contributor.referees4Moreira, Fabiano Cordeiro
dc.date.accessioned2022-06-23T19:53:39Z
dc.date.available2022-06-23T19:53:39Z
dc.date.issued2022-04-14
dc.description.abstractMetagenomics involves the study of the microbial community found in a sample extracted from a given environment. This environment may be a cave wall, a portion of ocean water, the human gut, or any source containing microorganisms of interest. Such studies unravel details about the taxonomic composition and the functions performed by microbial communities. As a complete metagenomic analysis requires different tools for different purposes, the selection and setup of these tools remain challenging. Furthermore, the chosen toolset will affect the accuracy, the formatting, and the functional identifiers reported in the results, impacting the results interpretation and the biological answer obtained. The work presented here aims to propose a pipeline to be used in taxonomic and functional metagenomic analyses. To this end, state-of-the-art tools available in the literature were surveyed, and mock datasets were created to perform benchmarks. As a result, suited tools were selected for each analysis step, and a sensitive and flexible metagenomic analysis pipeline was designed. MEDUSA, an efficient pipeline to conduct comprehensive metagenomic analyses, performs preprocessing, assembly, alignment, taxonomic classification, and functional annotation on shotgun data, supporting user-built dictionaries to transfer annotations to any functional identifier. MEDUSA includes several tools, such as Fastp, Bowtie2, DIAMOND, Kaiju, MEGAHIT, and a novel tool implemented in Python to transfer annotations to BLAST/DIAMOND alignment results. These tools are installed via Conda, and the workflow is managed by Snakemake, easing the setup and execution. Compared with MEGAN 6 Community Edition, MEDUSA correctly identifies more species, especially the less abundant, and is more suited for functional analysis using Gene Ontology identifiers.pt_BR
dc.description.resumoA metagenômica envolve o estudo da comunidade microbiana encontrada numa amostra extraída de um determinado ambiente. Este ambiente pode ser a parede de uma caverna, uma porção de água do oceano, o intestino humano, ou qualquer fonte contendo micro-organismos de interesse. Tais estudos revelam detalhes sobre a composição taxonômica e as funções exercidas por comunidades microbianas. Como uma análise metagenômica completa requer diferentes ferramentas para diferentes propósitos, a escolha e instalação destas ferramentas representa um desafio. Além disto, o conjunto de ferramentas escolhido afeta a precisão, formatação, e os identificadores funcionais informados nos resultados, impactando a interpretação dos resultados e as respostas biológicas obtidas. O presente trabalho tem como objetivo propor um fluxo de trabalho a ser usado em análises taxonômicas e funcionais de metagenomas. Para isto, foram pesquisadas ferramentas do estado da arte disponíveis na literatura, e conjuntos de dados simulados foram criados para realizar comparações. Como resultado, ferramentas adequadas para cada etapa de análise foram selecionadas, e um fluxo de trabalho sensível e flexível para análises metagenômicas foi projetado. MEDUSA, um fluxo de trabalho eficiente para execução de análises metagenômicas completas, realiza pré-processamento, montagem, alinhamento, classificação taxonômica, e anotação funcional de dados shotgun, permitindo o uso de dicionários criados pelos usuários para transferir anotações para qualquer identificador funcional. MEDUSA inclui diversas ferramentas, tais como o Fastp, Bowtie2, DIAMOND, Kaiju, MEGAHIT, e uma nova ferramenta implementada em Python para transferir anotações para resultados de alinhamento BLAST/DIAMOND. Estas ferramentas são instaladas via Conda, e o fluxo de trabalho é gerenciado pelo Snakemake, facilitando a instalação e execução. Comparado com o MEGAN 6 Community Edition, MEDUSA identifica corretamente mais espécies, especialmente as menos abundantes, e é mais adequado para análises funcionais usando identificadores do Gene Ontology.pt_BR
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESpt_BR
dc.identifier.citationMORAIS, Diego Arthur de Azevedo. Medusa: um fluxo de trabalho para classificação taxonômica e anotação funcional de metagenomas. 2022. 86f. Tese (Doutorado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/48271
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICApt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectMetagenômicapt_BR
dc.subjectBioinformáticapt_BR
dc.subjectClassificação taxonômicapt_BR
dc.subjectAnotação funcionalpt_BR
dc.subjectFluxo de trabalhopt_BR
dc.titleMedusa: um fluxo de trabalho para classificação taxonômica e anotação funcional de metagenomaspt_BR
dc.typedoctoralThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
Medusafluxotrabalho_Morais_2022.pdf
Tamanho:
3 MB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar