Identificação de sequências da subfamília Orthocoronavirinae em metagenomas e metatranscriptomas e análise da diversidade genômica do coronavírus humano NL63
dc.contributor.advisor | Oliveira, Riva de Paula | |
dc.contributor.advisor-co1 | Rodrigues, Thiago Bruce | |
dc.contributor.advisorID | https://orcid.org/0000-0002-6092-6142 | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/6790385939188325 | pt_BR |
dc.contributor.author | Silva, Giovanna Melo Martins | |
dc.contributor.authorID | https://orcid.org/0000-0002-4584-6961 | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/1182271734264345 | pt_BR |
dc.contributor.referees1 | Lanza, Daniel Carlos Ferreira | |
dc.contributor.referees1ID | https://orcid.org/0000-0002-1341-4814 | pt_BR |
dc.contributor.referees1Lattes | http://lattes.cnpq.br/6851351991421755 | pt_BR |
dc.contributor.referees2 | Araújo, Josélio Maria Galvão de | |
dc.contributor.referees3 | Franco, Gloria Regina | |
dc.contributor.referees4 | Acácio, Stela Mirla da Silva Felipe | |
dc.date.accessioned | 2024-01-23T21:33:33Z | |
dc.date.available | 2024-01-23T21:33:33Z | |
dc.date.issued | 2023-09-29 | |
dc.description.abstract | The development of high-throughput sequencing technologies in the last decade resulted in large repositories of raw sequencing data and metagenomic projects. Alongside, computational biology and bioinformatics became important allies and many taxonomic classification tools were created. The pandemic of COVID-19 (Coronavirus Disease 2019) has shown the importance of better investigating coronaviruses, specially human coronaviruses that impact health and public services. Among them, HCoV-NL63 is a seasonal human coronavirus that spreads worldwide, causes mild to moderate respiratory disease, and shares the same receptor for host entry as SARS-CoV and SARS-CoV-2. This study uses public databases of sequences to 1) compares two bioinformatic tools, Kaiju and Burrows-Wheeler Aligner (BWA), in identifying from Orthocoronavirinae viral sequences in human metagenomes and 2) conduct a comprehensive phylogenetic analysis of HCoV-NL63. 1169 human samples were randomly selected (from 3670), and taxonomic classification was performed with Kaiju (double-step analysis with different reference databases). 150 samples were found positive for CoVs using Kaiju, however, it was not possible to assembly any genomes. In addition, all 3670 samples were analyzed using BWA, with negative results for CoVs, except for one sample containing sequences from HCoV NL63. Our findings suggest that the investigated samples did not have coronaviruses, only conserved and similar sequences between organisms, which was overestimated by the Kaiju tool. On the other hand, BWA can be used to identify viromes in various sequencing products. In this study, we also used 173 publicly available spike genes sequences from HCoV-NL63 to perform phylogenetic analysis. Maximum likelihood analysis resulted in eight subgenotypes (A1, A2, A3, B1, B2, C1, C2, and C3), consolidating the lineage B division into B1 and B2. Subgenotypes B2 (20.1%), B1 (19.5%), and C3 (16.1%) were the most prevalent. Positive selection was found in S1 (V57, G96, N431) and S2 (V1177, E1206) residues. Seven non-synonymous substitutions were detected in the RBD region. Compared to other genotypes, genotype B has a remarkable number of amino acid substitutions in the S1 region. Our analysis also detected a high prevalence of recombination events within the S1 region (12–307 amino acids). Genotype A, which has the highest number of recombination events, shows a constricted period of emergence in both time and place, displaying a pattern of purifying selection. Our results highlight the importance of continuous epidemiologic and phylogenetic surveillance, which is strongly recommended in order to predict the evolution of future variants. | pt_BR |
dc.description.resumo | O desenvolvimento de tecnologias de sequenciamento de alto rendimento na última década resultou em grandes repositórios de dados brutos de sequenciamento e projetos metagenômicos. Paralelamente, a biologia computacional e a bioinformática se tornaram aliadas importantes, resultando na criação de diversas ferramentas de classificação taxonômica. A pandemia da COVID-19 (Coronavirus Disease 2019) demonstrou a importância de investigar melhor os coronavírus, especialmente os coronavírus humanos que impactam a saúde e os serviços públicos. Entre eles, o HCoV-NL63 é um coronavírus sazonal que afeta os seres humanos, está distribuído globalmente, causa doenças respiratórias leves a moderadas e compartilha o mesmo receptor para entrada no hospedeiro que o SARS-CoV e o SARS-CoV-2. Este trabalho utiliza bancos de dados públicos de sequências para 1) comparar duas ferramentas de bioinformática, Kaiju e Burrows-Wheeler Aligner (BWA), na identificação de sequências virais da subfamília Orthocoronavirinae em metagenomas humanos e 2) realizar uma análise filogenética abrangente do HCoV-NL63. Foram selecionadas aleatoriamente 1169 amostras humanas (de um total de 3670) e a classificação taxonômica foi realizada com o uso do Kaiju (análise de dois passos com diferentes bancos de dados de referência). Usando o Kaiju, foram encontradas 150 amostras positivas para CoVs, no entanto, não foi possível montar nenhum genoma. Além disso, todas as 3670 amostras foram analisadas usando o BWA, com resultados negativos para CoVs, exceto uma amostra que continha sequências do HCoV NL63. Nossos resultados sugerem que as amostras investigadas não continham coronavírus, apenas sequências conservadas e similares entre organismos, o que foi superestimado pela ferramenta Kaiju. Por outro lado, o BWA pode ser utilizado para identificar viromas em diversos produtos de sequenciamento. Neste estudo, também utilizamos 173 sequências de genes de espícula disponíveis publicamente do HCoV-NL63 para realizar a análise filogenética. A análise de máxima verossimilhança resultou em oito subgenótipos (A1, A2, A3, B1, B2, C1, C2 e C3), consolidando a divisão da linhagem B em B1 e B2. Os subgenótipos B2 (20,1%), B1 (19,5%) e C3 (16,1%) foram os mais prevalentes. Foi encontrada seleção positiva nas posições S1 (V57, G96, N431) e S2 (V1177, E1206). Foram detectadas sete substituições não sinônimas na região BLR. Em comparação com outros genótipos, o genótipo B apresenta um número significativo de substituições de aminoácidos na região S1. Nossa análise também identificou uma alta prevalência de eventos de recombinação dentro da região S1 (12-307 aminoácidos). O genótipo A, que apresenta o maior número de eventos de recombinação, mostra um período restrito de surgimento tanto em termos de tempo quanto de local, exibindo um padrão de seleção purificadora. Nossos resultados destacam a importância da vigilância epidemiológica e filogenética contínua, sendo fortemente recomendada para prever a evolução de futuras variantes. | pt_BR |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES | pt_BR |
dc.identifier.citation | SILVA, Giovanna Melo Martins. Identificação de sequências da subfamília Orthocoronavirinae em metagenomas e metatranscriptomas e análise da diversidade genômica do coronavírus humano NL63. Orientadora: Dra. Riva de Paula Oliveira. 2023. 95f. Tese (Doutorado em Biotecnologia) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2023. | pt_BR |
dc.identifier.uri | https://repositorio.ufrn.br/handle/123456789/57403 | |
dc.language | pt_BR | pt_BR |
dc.publisher | Universidade Federal do Rio Grande do Norte | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.initials | UFRN | pt_BR |
dc.publisher.program | PROGRAMA DE PÓS-GRADUAÇÃO EM BIOTECNOLOGIA | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Coronavírus | pt_BR |
dc.subject | Metagenômica | pt_BR |
dc.subject | Taxonomia | pt_BR |
dc.subject | HCoV-NL63 | pt_BR |
dc.subject | Filogenética | pt_BR |
dc.subject | Recombinação | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS BIOLOGICAS | pt_BR |
dc.title | Identificação de sequências da subfamília Orthocoronavirinae em metagenomas e metatranscriptomas e análise da diversidade genômica do coronavírus humano NL63 | pt_BR |
dc.type | doctoralThesis | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- Identificacaosequenciassubfamilia_Silva_2023.pdf
- Tamanho:
- 3.23 MB
- Formato:
- Adobe Portable Document Format
Nenhuma Miniatura disponível