Caracterização computacional de RNAs não codificantes longos a nível unicelular associados com o desenvolvimento do tecido cardíaco e com doenças cardiovasculares

dc.contributor.advisorCoutinho, Vinicius Ramos Henriques Maracajá
dc.contributor.advisor-co1Rego, Thais Gaudêncio do
dc.contributor.advisorLatteshttp://lattes.cnpq.br/5684206147354858pt_BR
dc.contributor.authorRamos, Thaís de Almeida Ratis
dc.contributor.authorIDhttps://orcid.org/0000-0002-6699-7742pt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/4296700516154626pt_BR
dc.contributor.referees1Dalmolin, Rodrigo Juliani Siqueira
dc.contributor.referees1IDhttps://orcid.org/0000-0002-1688-6155pt_BR
dc.contributor.referees1Latteshttp://lattes.cnpq.br/4065178015615979pt_BR
dc.contributor.referees2Araújo, Gilderlanio Santana de
dc.contributor.referees3Barbosa, Yuri de Almeida Malheiros
dc.date.accessioned2022-10-14T21:19:48Z
dc.date.available2022-10-14T21:19:48Z
dc.date.issued2022-08-02
dc.description.abstractLong non-coding RNAs (lncRNAs) comprise the most representative transcriptional units of the mammalian genome, and they’re associated with organ development that can be associated with the emergence of diseases, such as cardiovascular diseases. The World Health Organization (WHO), for example, has published that cardiovascular diseases are responsible for the death of 17.9 million people each year, corresponding to 31% of all deaths all around the world. In this work, a reference database of lncRNAs and coding transcripts was built: a combination of lncRNAs from the Gencode (M20), Ensembl (GRCm38.95) and Amaral et al. (2018) databases was used to define the set of non-redundant reference lncRNAs, i.e., lncRNAs that did not have an overlap above 50%; moreover, for the reference database of coding transcripts, the Gencode database (M20) was used. In addition, bioinformatics approaches were used (RNA-seq pipeline was adapted for single-cell data analysis), machine learning algorithms (Hierarchical, Silhouette, PCA and t-SNE) and statistical techniques to define lncRNAs involved in mammalian cardiac development in a single-cell perspective. For this, the single-cell database published by DeLaughter et al. (2016) was used, in which there were data from 4 embryonic stages (E9.5, E11.5, E14.5, E18.5) and 4 post -natals (P0, P3, P7, P21) of the mus musculus model organism. Our study identified 8 distinct cell types, novel marker transcripts (coding/lncRNAs) and also, differential expression and functional enrichment analysis revealed cardiomyocyte subpopulations associated with cardiac function; meanwhile modular co-expression analysis reveals cell-specific functional insights for lncRNAs during myocardial development, including a potential association with key genes related to disease and the “fetal gene program”. Our results evidence the role of particular lncRNAs in heart development, and highlights the usage of co-expression modular approaches in the cell-type functional definition. As future work, we intend to acquire the functional roles of these RNAs in the development of cardiac tissues and in cardiovascular diseases using experimental validation approaches.pt_BR
dc.description.resumoOs RNAs longos não codificantes (lncRNAs) compreendem as unidades transcricionais mais representativas do genoma dos mamíferos e estão associados ao desenvolvimento de órgãos que podem estar associados ao surgimento de doenças, como as cardiovasculares. A Organização Mundial da Saúde (do inglês, World Health Organization (WHO)), por exemplo, publicou que as doenças cardiovasculares são responsáveis pela morte de 17,9 milhões de pessoas a cada ano, correspondendo a 31% de todas as mortes em todo o mundo. Neste trabalho, foi construída uma base de dados de referência de lncRNAs e transcritos codificantes: foi utilizado uma combinação dos lncRNAs das bases de dados Gencode (M20), Ensembl (GRCm38.95) e Amaral et al (2018) para definir o conjunto de lncRNAs de referência não redundantes, ou seja, lncRNAs que não possuíam sobreposição acima de 50%; ademais, para a base de dados de referência dos transcritos codificantes foi utilizada a base de dados Gencode (M20). Além disso, foram utilizadas abordagens de bioinformática (foi adaptado um pipeline de RNA-seq para análise de dados single-cell), algoritmos de aprendizado de máquina (Hierárquico, Silhueta, PCA e t-SNE) e técnicas estatísticas para definir lncRNAs envolvidos no desenvolvimento cardíaco de mamíferos. Para isso, foi utilizado a base dados de single-cell publicada por DeLaughter et al (2016), no qual havia dados de 4 estágios embrionários (E9.5, E11.5, E14.5, E18.5) e 4 estágios pós-natais (P0, P3, P7, P21) do organismo modelo mus musculus. Neste trabalho, identificamos 8 tipos celulares distintos e novos transcritos marcadores (codificantes e diferentes tipos de lncRNAs) com o auxílio da ferramenta M3Drop e de testes estatísticos (Qui-quadrado e teste de aderência). Além disso, a expressão diferencial e análise de enriquecimento funcional revelaram subpopulações de cardiomiócitos associadas à função cardíaca; enquanto isso, a análise de co-expressão modular revelou insights funcionais específicos de células para lncRNAs durante o desenvolvimento do miocárdio, incluindo uma potencial associação com genes-chave relacionados à doença e ao “programa de genes fetais”. Nossos resultados evidenciam o papel de lncRNAs particulares no desenvolvimento do coração e destacam o uso de abordagens modulares de co-expressão na definição funcional do tipo de célula. Como trabalho futuro, pretende-se identificar os papéis funcionais desses RNAs no desenvolvimento de tecidos cardíacos e em doenças cardiovasculares, utilizando abordagens de validação experimental.pt_BR
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESpt_BR
dc.identifier.citationRAMOS, Thaís de Almeida Ratis. Caracterização computacional de RNAs não codificantes longos a nível unicelular associados com o desenvolvimento do tecido cardíaco e com doenças cardiovasculares. Orientador: Vinicius Ramos Henriques Maracajá Coutinho. 2022. 149f. Tese (Doutorado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/49581
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICApt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectSingle cellpt_BR
dc.subjectDesenvolvimento do coraçãopt_BR
dc.subjectDoenças cardiovascularespt_BR
dc.subjectAprendizagem de máquinapt_BR
dc.subjectSubpopulações de cardiomiócitopt_BR
dc.subject.cnpqCNPQ::CIENCIAS BIOLOGICASpt_BR
dc.titleCaracterização computacional de RNAs não codificantes longos a nível unicelular associados com o desenvolvimento do tecido cardíaco e com doenças cardiovascularespt_BR
dc.typedoctoralThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
CaracterizacaocomputacionalRNAs_Ramos_2022.pdf
Tamanho:
12.24 MB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar