Caracterização computacional de RNAs não codificantes longos a nível unicelular associados com o desenvolvimento do tecido cardíaco e com doenças cardiovasculares
dc.contributor.advisor | Coutinho, Vinicius Ramos Henriques Maracajá | |
dc.contributor.advisor-co1 | Rego, Thais Gaudêncio do | |
dc.contributor.advisorLattes | http://lattes.cnpq.br/5684206147354858 | pt_BR |
dc.contributor.author | Ramos, Thaís de Almeida Ratis | |
dc.contributor.authorID | https://orcid.org/0000-0002-6699-7742 | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/4296700516154626 | pt_BR |
dc.contributor.referees1 | Dalmolin, Rodrigo Juliani Siqueira | |
dc.contributor.referees1ID | https://orcid.org/0000-0002-1688-6155 | pt_BR |
dc.contributor.referees1Lattes | http://lattes.cnpq.br/4065178015615979 | pt_BR |
dc.contributor.referees2 | Araújo, Gilderlanio Santana de | |
dc.contributor.referees3 | Barbosa, Yuri de Almeida Malheiros | |
dc.date.accessioned | 2022-10-14T21:19:48Z | |
dc.date.available | 2022-10-14T21:19:48Z | |
dc.date.issued | 2022-08-02 | |
dc.description.abstract | Long non-coding RNAs (lncRNAs) comprise the most representative transcriptional units of the mammalian genome, and they’re associated with organ development that can be associated with the emergence of diseases, such as cardiovascular diseases. The World Health Organization (WHO), for example, has published that cardiovascular diseases are responsible for the death of 17.9 million people each year, corresponding to 31% of all deaths all around the world. In this work, a reference database of lncRNAs and coding transcripts was built: a combination of lncRNAs from the Gencode (M20), Ensembl (GRCm38.95) and Amaral et al. (2018) databases was used to define the set of non-redundant reference lncRNAs, i.e., lncRNAs that did not have an overlap above 50%; moreover, for the reference database of coding transcripts, the Gencode database (M20) was used. In addition, bioinformatics approaches were used (RNA-seq pipeline was adapted for single-cell data analysis), machine learning algorithms (Hierarchical, Silhouette, PCA and t-SNE) and statistical techniques to define lncRNAs involved in mammalian cardiac development in a single-cell perspective. For this, the single-cell database published by DeLaughter et al. (2016) was used, in which there were data from 4 embryonic stages (E9.5, E11.5, E14.5, E18.5) and 4 post -natals (P0, P3, P7, P21) of the mus musculus model organism. Our study identified 8 distinct cell types, novel marker transcripts (coding/lncRNAs) and also, differential expression and functional enrichment analysis revealed cardiomyocyte subpopulations associated with cardiac function; meanwhile modular co-expression analysis reveals cell-specific functional insights for lncRNAs during myocardial development, including a potential association with key genes related to disease and the “fetal gene program”. Our results evidence the role of particular lncRNAs in heart development, and highlights the usage of co-expression modular approaches in the cell-type functional definition. As future work, we intend to acquire the functional roles of these RNAs in the development of cardiac tissues and in cardiovascular diseases using experimental validation approaches. | pt_BR |
dc.description.resumo | Os RNAs longos não codificantes (lncRNAs) compreendem as unidades transcricionais mais representativas do genoma dos mamíferos e estão associados ao desenvolvimento de órgãos que podem estar associados ao surgimento de doenças, como as cardiovasculares. A Organização Mundial da Saúde (do inglês, World Health Organization (WHO)), por exemplo, publicou que as doenças cardiovasculares são responsáveis pela morte de 17,9 milhões de pessoas a cada ano, correspondendo a 31% de todas as mortes em todo o mundo. Neste trabalho, foi construída uma base de dados de referência de lncRNAs e transcritos codificantes: foi utilizado uma combinação dos lncRNAs das bases de dados Gencode (M20), Ensembl (GRCm38.95) e Amaral et al (2018) para definir o conjunto de lncRNAs de referência não redundantes, ou seja, lncRNAs que não possuíam sobreposição acima de 50%; ademais, para a base de dados de referência dos transcritos codificantes foi utilizada a base de dados Gencode (M20). Além disso, foram utilizadas abordagens de bioinformática (foi adaptado um pipeline de RNA-seq para análise de dados single-cell), algoritmos de aprendizado de máquina (Hierárquico, Silhueta, PCA e t-SNE) e técnicas estatísticas para definir lncRNAs envolvidos no desenvolvimento cardíaco de mamíferos. Para isso, foi utilizado a base dados de single-cell publicada por DeLaughter et al (2016), no qual havia dados de 4 estágios embrionários (E9.5, E11.5, E14.5, E18.5) e 4 estágios pós-natais (P0, P3, P7, P21) do organismo modelo mus musculus. Neste trabalho, identificamos 8 tipos celulares distintos e novos transcritos marcadores (codificantes e diferentes tipos de lncRNAs) com o auxílio da ferramenta M3Drop e de testes estatísticos (Qui-quadrado e teste de aderência). Além disso, a expressão diferencial e análise de enriquecimento funcional revelaram subpopulações de cardiomiócitos associadas à função cardíaca; enquanto isso, a análise de co-expressão modular revelou insights funcionais específicos de células para lncRNAs durante o desenvolvimento do miocárdio, incluindo uma potencial associação com genes-chave relacionados à doença e ao “programa de genes fetais”. Nossos resultados evidenciam o papel de lncRNAs particulares no desenvolvimento do coração e destacam o uso de abordagens modulares de co-expressão na definição funcional do tipo de célula. Como trabalho futuro, pretende-se identificar os papéis funcionais desses RNAs no desenvolvimento de tecidos cardíacos e em doenças cardiovasculares, utilizando abordagens de validação experimental. | pt_BR |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES | pt_BR |
dc.identifier.citation | RAMOS, Thaís de Almeida Ratis. Caracterização computacional de RNAs não codificantes longos a nível unicelular associados com o desenvolvimento do tecido cardíaco e com doenças cardiovasculares. Orientador: Vinicius Ramos Henriques Maracajá Coutinho. 2022. 149f. Tese (Doutorado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022. | pt_BR |
dc.identifier.uri | https://repositorio.ufrn.br/handle/123456789/49581 | |
dc.language | pt_BR | pt_BR |
dc.publisher | Universidade Federal do Rio Grande do Norte | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.initials | UFRN | pt_BR |
dc.publisher.program | PROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICA | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Single cell | pt_BR |
dc.subject | Desenvolvimento do coração | pt_BR |
dc.subject | Doenças cardiovasculares | pt_BR |
dc.subject | Aprendizagem de máquina | pt_BR |
dc.subject | Subpopulações de cardiomiócito | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS BIOLOGICAS | pt_BR |
dc.title | Caracterização computacional de RNAs não codificantes longos a nível unicelular associados com o desenvolvimento do tecido cardíaco e com doenças cardiovasculares | pt_BR |
dc.type | doctoralThesis | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- CaracterizacaocomputacionalRNAs_Ramos_2022.pdf
- Tamanho:
- 12.24 MB
- Formato:
- Adobe Portable Document Format
Nenhuma Miniatura disponível