Identificação de sequências da subfamília Orthocoronavirinae em metagenomas e metatranscriptomas e análise da diversidade genômica do coronavírus humano NL63

dc.contributor.advisorOliveira, Riva de Paula
dc.contributor.advisor-co1Rodrigues, Thiago Bruce
dc.contributor.advisorIDhttps://orcid.org/0000-0002-6092-6142pt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/6790385939188325pt_BR
dc.contributor.authorSilva, Giovanna Melo Martins
dc.contributor.authorIDhttps://orcid.org/0000-0002-4584-6961pt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/1182271734264345pt_BR
dc.contributor.referees1Lanza, Daniel Carlos Ferreira
dc.contributor.referees1IDhttps://orcid.org/0000-0002-1341-4814pt_BR
dc.contributor.referees1Latteshttp://lattes.cnpq.br/6851351991421755pt_BR
dc.contributor.referees2Araújo, Josélio Maria Galvão de
dc.contributor.referees3Franco, Gloria Regina
dc.contributor.referees4Acácio, Stela Mirla da Silva Felipe
dc.date.accessioned2024-01-23T21:33:33Z
dc.date.available2024-01-23T21:33:33Z
dc.date.issued2023-09-29
dc.description.abstractThe development of high-throughput sequencing technologies in the last decade resulted in large repositories of raw sequencing data and metagenomic projects. Alongside, computational biology and bioinformatics became important allies and many taxonomic classification tools were created. The pandemic of COVID-19 (Coronavirus Disease 2019) has shown the importance of better investigating coronaviruses, specially human coronaviruses that impact health and public services. Among them, HCoV-NL63 is a seasonal human coronavirus that spreads worldwide, causes mild to moderate respiratory disease, and shares the same receptor for host entry as SARS-CoV and SARS-CoV-2. This study uses public databases of sequences to 1) compares two bioinformatic tools, Kaiju and Burrows-Wheeler Aligner (BWA), in identifying from Orthocoronavirinae viral sequences in human metagenomes and 2) conduct a comprehensive phylogenetic analysis of HCoV-NL63. 1169 human samples were randomly selected (from 3670), and taxonomic classification was performed with Kaiju (double-step analysis with different reference databases). 150 samples were found positive for CoVs using Kaiju, however, it was not possible to assembly any genomes. In addition, all 3670 samples were analyzed using BWA, with negative results for CoVs, except for one sample containing sequences from HCoV NL63. Our findings suggest that the investigated samples did not have coronaviruses, only conserved and similar sequences between organisms, which was overestimated by the Kaiju tool. On the other hand, BWA can be used to identify viromes in various sequencing products. In this study, we also used 173 publicly available spike genes sequences from HCoV-NL63 to perform phylogenetic analysis. Maximum likelihood analysis resulted in eight subgenotypes (A1, A2, A3, B1, B2, C1, C2, and C3), consolidating the lineage B division into B1 and B2. Subgenotypes B2 (20.1%), B1 (19.5%), and C3 (16.1%) were the most prevalent. Positive selection was found in S1 (V57, G96, N431) and S2 (V1177, E1206) residues. Seven non-synonymous substitutions were detected in the RBD region. Compared to other genotypes, genotype B has a remarkable number of amino acid substitutions in the S1 region. Our analysis also detected a high prevalence of recombination events within the S1 region (12–307 amino acids). Genotype A, which has the highest number of recombination events, shows a constricted period of emergence in both time and place, displaying a pattern of purifying selection. Our results highlight the importance of continuous epidemiologic and phylogenetic surveillance, which is strongly recommended in order to predict the evolution of future variants.pt_BR
dc.description.resumoO desenvolvimento de tecnologias de sequenciamento de alto rendimento na última década resultou em grandes repositórios de dados brutos de sequenciamento e projetos metagenômicos. Paralelamente, a biologia computacional e a bioinformática se tornaram aliadas importantes, resultando na criação de diversas ferramentas de classificação taxonômica. A pandemia da COVID-19 (Coronavirus Disease 2019) demonstrou a importância de investigar melhor os coronavírus, especialmente os coronavírus humanos que impactam a saúde e os serviços públicos. Entre eles, o HCoV-NL63 é um coronavírus sazonal que afeta os seres humanos, está distribuído globalmente, causa doenças respiratórias leves a moderadas e compartilha o mesmo receptor para entrada no hospedeiro que o SARS-CoV e o SARS-CoV-2. Este trabalho utiliza bancos de dados públicos de sequências para 1) comparar duas ferramentas de bioinformática, Kaiju e Burrows-Wheeler Aligner (BWA), na identificação de sequências virais da subfamília Orthocoronavirinae em metagenomas humanos e 2) realizar uma análise filogenética abrangente do HCoV-NL63. Foram selecionadas aleatoriamente 1169 amostras humanas (de um total de 3670) e a classificação taxonômica foi realizada com o uso do Kaiju (análise de dois passos com diferentes bancos de dados de referência). Usando o Kaiju, foram encontradas 150 amostras positivas para CoVs, no entanto, não foi possível montar nenhum genoma. Além disso, todas as 3670 amostras foram analisadas usando o BWA, com resultados negativos para CoVs, exceto uma amostra que continha sequências do HCoV NL63. Nossos resultados sugerem que as amostras investigadas não continham coronavírus, apenas sequências conservadas e similares entre organismos, o que foi superestimado pela ferramenta Kaiju. Por outro lado, o BWA pode ser utilizado para identificar viromas em diversos produtos de sequenciamento. Neste estudo, também utilizamos 173 sequências de genes de espícula disponíveis publicamente do HCoV-NL63 para realizar a análise filogenética. A análise de máxima verossimilhança resultou em oito subgenótipos (A1, A2, A3, B1, B2, C1, C2 e C3), consolidando a divisão da linhagem B em B1 e B2. Os subgenótipos B2 (20,1%), B1 (19,5%) e C3 (16,1%) foram os mais prevalentes. Foi encontrada seleção positiva nas posições S1 (V57, G96, N431) e S2 (V1177, E1206). Foram detectadas sete substituições não sinônimas na região BLR. Em comparação com outros genótipos, o genótipo B apresenta um número significativo de substituições de aminoácidos na região S1. Nossa análise também identificou uma alta prevalência de eventos de recombinação dentro da região S1 (12-307 aminoácidos). O genótipo A, que apresenta o maior número de eventos de recombinação, mostra um período restrito de surgimento tanto em termos de tempo quanto de local, exibindo um padrão de seleção purificadora. Nossos resultados destacam a importância da vigilância epidemiológica e filogenética contínua, sendo fortemente recomendada para prever a evolução de futuras variantes.pt_BR
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESpt_BR
dc.identifier.citationSILVA, Giovanna Melo Martins. Identificação de sequências da subfamília Orthocoronavirinae em metagenomas e metatranscriptomas e análise da diversidade genômica do coronavírus humano NL63. Orientadora: Dra. Riva de Paula Oliveira. 2023. 95f. Tese (Doutorado em Biotecnologia) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2023.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/57403
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM BIOTECNOLOGIApt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectCoronavíruspt_BR
dc.subjectMetagenômicapt_BR
dc.subjectTaxonomiapt_BR
dc.subjectHCoV-NL63pt_BR
dc.subjectFilogenéticapt_BR
dc.subjectRecombinaçãopt_BR
dc.subject.cnpqCNPQ::CIENCIAS BIOLOGICASpt_BR
dc.titleIdentificação de sequências da subfamília Orthocoronavirinae em metagenomas e metatranscriptomas e análise da diversidade genômica do coronavírus humano NL63pt_BR
dc.typedoctoralThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
Identificacaosequenciassubfamilia_Silva_2023.pdf
Tamanho:
3.23 MB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar