Modelos lineares generalizados para análise de expressão gênica diferencial: biomarcadores sexo-específicos no Transtorno Depressivo Maior

dc.contributor.advisorAraújo, Mariana Correia de
dc.contributor.advisor-co1Dalmolin, Rodrigo Juliani Siqueira
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/4065178015615979pt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/3928569895184069pt_BR
dc.contributor.authorSouza, Iara Dantas de
dc.contributor.authorID0000-0002-2550-6150pt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/8983310940285796pt_BR
dc.contributor.referees1Silva Junior, Antônio Hermes Marques da
dc.contributor.referees1Latteshttp://lattes.cnpq.br/9570950627171584pt_BR
dc.contributor.referees2Costa, Eliardo Guimaraes da
dc.contributor.referees2Latteshttp://lattes.cnpq.br/3160805152538713pt_BR
dc.date.accessioned2023-12-12T12:54:10Z
dc.date.available2023-12-12T12:54:10Z
dc.date.issued2023-12-01
dc.description.abstractGeneralized Linear Models (GLMs) play a crucial role in statistical analysis, offering a flexible approach for modeling data from various sources. An important application of GLMs is in modeling gene expression, allowing these models to handle the diversity of data distributions associated with gene expression, such as the Poisson or Negative Binomial distributions frequently observed in RNA sequencing data. GLMs accommodate biological variability by allowing modeling of non-constant variations in relation to the mean, providing a more accurate and realistic analysis. The inclusion of replicates is facilitated by GLMs, enabling the distinction between biological and technical variations, contributing to the solidity of conclusions. Additionally, the ability to incorporate covariates in GLMs is essential for controlling confounding factors, allowing a refined analysis that considers multiple biological and experimental aspects simultaneously. Here, we demonstrate an application of GLMs for the analysis of gene expression data using the approach implemented in the R/Bioconductor package edgeR. With this approach, we aim to identify gene expression changes in samples from individuals with Major Depressive Disorder (MDD) compared to samples from healthy individuals. For this purpose, we analyzed 263 RNA sequencing samples from post-mortem brain tissue from six brain regions: orbitofrontal cortex (OFC), dorsolateral prefrontal cortex (dlPFC), ventromedial prefrontal cortex (Cg25), anterior insula (aINS), nucleus accumbens (Nac), and ventral subiculum (Sub), in both sexes. This analysis resulted in the identification of 669 genes with altered expression in samples from individuals with MDD compared to samples from healthy individuals, referred to as differentially expressed genes. The set of differentially expressed genes constitutes a profile of the observed gene expression changes in MDD. This profile proved to be specific to each sex and each brain region considered in the analysis. Systematically, it was possible to identify groups of genes that interact physically and/or functionally. The biosynthesis of proteins, an important process related to neuronal metabolism, may be one of the biological processes impacted in MDD.pt_BR
dc.description.resumoOs Modelos Lineares Generalizados (MLG) desempenham um papel crucial na análise estatística, uma vez que oferecem uma abordagem flexível para a modelagem de dados de diferentes origens. Uma importante aplicação dos MLG é a modelagem da expressão gênica, uma vez que estes modelos conseguem lidar com a diversidade de distribuições de dados associadas à expressão gênica, como as distribuições Poisson ou Binomial Negativa, frequentemente observadas em dados de sequenciamento de RNA. Os MLG acomodam a variabilidade biológica ao permitir a modelagem de variações não constantes em relação à média, proporcionando uma análise mais precisa e realista. A inclusão de replicatas é facilitada pelos MLG, permitindo distinguir variações biológicas de variações técnicas, contribuindo para a solidez das conclusões. Além disso, a capacidade de incorporar covariáveis nos MLG é fundamental para controlar fatores de confusão, permitindo uma análise refinada que considera múltiplos aspectos biológicos e experimentais simultaneamente. Aqui, mostramos uma aplicação dos MLG para análise de dados de expressão gênica, por meio da abordagem implementada no pacote edgeR do R/Bioconductor. Com esta abordagem, buscamos identificar as alterações de expressão gênica em amostras de indivíduos com Transtorno Depressivo Maior (TDM), quando comparadas com amostras de indivíduos saudáveis. Para isto, foram analisadas 263 amostras de sequenciamento de RNA de tecido cerebral \textit{post-mortem} de seis regiões cerebrais: córtex orbitofrontal (OFC), córtex pré-frontal dorsolateral (dlPFC), córtex pré-frontal ventromedial (Cg25), ínsula anterior (aINS), núcleo accumbens (Nac) e subículo ventral (Sub), em ambos os sexos. Esta análise resultou na identificação de 669 genes com alteração na expressão em amostras de indivíduos com TDM em relação às amostras de indivíduos saudáveis, chamados de genes diferencialmente expressos. O conjunto dos genes diferencialmente expressos constitui o perfil das alterações de expressão gênica observadas no TDM. Este perfil mostrou-se ser específico de cada sexo e de cada região cerebral considerada na análise. Sistemicamente, foi possível a identificação de grupos de genes que interagem fisica e/ou funcionalmente. É possível que um dos processos biológicos impactados no TDM seja a biossíntese de proteínas, um importante processo relacionado ao metabolismo neuronal.pt_BR
dc.identifier.citationSOUZA, Iara Dantas de. Modelos lineares generalizados para análise de expressão gênica diferencial: biomarcadores sexo-específicos no Transtorno Depressivo Maior. Orientadora: Mariana Correia de Araújo. 2023. 52 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Departamento de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2023.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/55774
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentDepartamento de Estatísticapt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programCurso de Graduação em Estatísticapt_BR
dc.subjectModelos Lineares Generalizadospt_BR
dc.subjectExpressão Gênicapt_BR
dc.subjectBioinformáticapt_BR
dc.subjectGeneralized Linear Modelspt_BR
dc.subjectGene Expressionpt_BR
dc.subjectBioinformaticspt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE E ESTATISTICA APLICADASpt_BR
dc.titleModelos lineares generalizados para análise de expressão gênica diferencial: biomarcadores sexo-específicos no Transtorno Depressivo Maiorpt_BR
dc.title.alternativeGeneralized linear models for differential gene expression: sex-specific biomarkers of Major Depressive Disorderpt_BR
dc.typebachelorThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
ModelosLinearesGeneralizados_Souza_2023.pdf
Tamanho:
1.97 MB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.45 KB
Formato:
Item-specific license agreed upon to submission
Nenhuma Miniatura disponível
Baixar