Modelos lineares generalizados para análise de expressão gênica diferencial: biomarcadores sexo-específicos no Transtorno Depressivo Maior
dc.contributor.advisor | Araújo, Mariana Correia de | |
dc.contributor.advisor-co1 | Dalmolin, Rodrigo Juliani Siqueira | |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/4065178015615979 | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/3928569895184069 | pt_BR |
dc.contributor.author | Souza, Iara Dantas de | |
dc.contributor.authorID | 0000-0002-2550-6150 | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/8983310940285796 | pt_BR |
dc.contributor.referees1 | Silva Junior, Antônio Hermes Marques da | |
dc.contributor.referees1Lattes | http://lattes.cnpq.br/9570950627171584 | pt_BR |
dc.contributor.referees2 | Costa, Eliardo Guimaraes da | |
dc.contributor.referees2Lattes | http://lattes.cnpq.br/3160805152538713 | pt_BR |
dc.date.accessioned | 2023-12-12T12:54:10Z | |
dc.date.available | 2023-12-12T12:54:10Z | |
dc.date.issued | 2023-12-01 | |
dc.description.abstract | Generalized Linear Models (GLMs) play a crucial role in statistical analysis, offering a flexible approach for modeling data from various sources. An important application of GLMs is in modeling gene expression, allowing these models to handle the diversity of data distributions associated with gene expression, such as the Poisson or Negative Binomial distributions frequently observed in RNA sequencing data. GLMs accommodate biological variability by allowing modeling of non-constant variations in relation to the mean, providing a more accurate and realistic analysis. The inclusion of replicates is facilitated by GLMs, enabling the distinction between biological and technical variations, contributing to the solidity of conclusions. Additionally, the ability to incorporate covariates in GLMs is essential for controlling confounding factors, allowing a refined analysis that considers multiple biological and experimental aspects simultaneously. Here, we demonstrate an application of GLMs for the analysis of gene expression data using the approach implemented in the R/Bioconductor package edgeR. With this approach, we aim to identify gene expression changes in samples from individuals with Major Depressive Disorder (MDD) compared to samples from healthy individuals. For this purpose, we analyzed 263 RNA sequencing samples from post-mortem brain tissue from six brain regions: orbitofrontal cortex (OFC), dorsolateral prefrontal cortex (dlPFC), ventromedial prefrontal cortex (Cg25), anterior insula (aINS), nucleus accumbens (Nac), and ventral subiculum (Sub), in both sexes. This analysis resulted in the identification of 669 genes with altered expression in samples from individuals with MDD compared to samples from healthy individuals, referred to as differentially expressed genes. The set of differentially expressed genes constitutes a profile of the observed gene expression changes in MDD. This profile proved to be specific to each sex and each brain region considered in the analysis. Systematically, it was possible to identify groups of genes that interact physically and/or functionally. The biosynthesis of proteins, an important process related to neuronal metabolism, may be one of the biological processes impacted in MDD. | pt_BR |
dc.description.resumo | Os Modelos Lineares Generalizados (MLG) desempenham um papel crucial na análise estatística, uma vez que oferecem uma abordagem flexível para a modelagem de dados de diferentes origens. Uma importante aplicação dos MLG é a modelagem da expressão gênica, uma vez que estes modelos conseguem lidar com a diversidade de distribuições de dados associadas à expressão gênica, como as distribuições Poisson ou Binomial Negativa, frequentemente observadas em dados de sequenciamento de RNA. Os MLG acomodam a variabilidade biológica ao permitir a modelagem de variações não constantes em relação à média, proporcionando uma análise mais precisa e realista. A inclusão de replicatas é facilitada pelos MLG, permitindo distinguir variações biológicas de variações técnicas, contribuindo para a solidez das conclusões. Além disso, a capacidade de incorporar covariáveis nos MLG é fundamental para controlar fatores de confusão, permitindo uma análise refinada que considera múltiplos aspectos biológicos e experimentais simultaneamente. Aqui, mostramos uma aplicação dos MLG para análise de dados de expressão gênica, por meio da abordagem implementada no pacote edgeR do R/Bioconductor. Com esta abordagem, buscamos identificar as alterações de expressão gênica em amostras de indivíduos com Transtorno Depressivo Maior (TDM), quando comparadas com amostras de indivíduos saudáveis. Para isto, foram analisadas 263 amostras de sequenciamento de RNA de tecido cerebral \textit{post-mortem} de seis regiões cerebrais: córtex orbitofrontal (OFC), córtex pré-frontal dorsolateral (dlPFC), córtex pré-frontal ventromedial (Cg25), ínsula anterior (aINS), núcleo accumbens (Nac) e subículo ventral (Sub), em ambos os sexos. Esta análise resultou na identificação de 669 genes com alteração na expressão em amostras de indivíduos com TDM em relação às amostras de indivíduos saudáveis, chamados de genes diferencialmente expressos. O conjunto dos genes diferencialmente expressos constitui o perfil das alterações de expressão gênica observadas no TDM. Este perfil mostrou-se ser específico de cada sexo e de cada região cerebral considerada na análise. Sistemicamente, foi possível a identificação de grupos de genes que interagem fisica e/ou funcionalmente. É possível que um dos processos biológicos impactados no TDM seja a biossíntese de proteínas, um importante processo relacionado ao metabolismo neuronal. | pt_BR |
dc.identifier.citation | SOUZA, Iara Dantas de. Modelos lineares generalizados para análise de expressão gênica diferencial: biomarcadores sexo-específicos no Transtorno Depressivo Maior. Orientadora: Mariana Correia de Araújo. 2023. 52 f. Trabalho de Conclusão de Curso (Graduação em Estatística) - Departamento de Estatística, Universidade Federal do Rio Grande do Norte, Natal, 2023. | pt_BR |
dc.identifier.uri | https://repositorio.ufrn.br/handle/123456789/55774 | |
dc.language | pt_BR | pt_BR |
dc.publisher | Universidade Federal do Rio Grande do Norte | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Departamento de Estatística | pt_BR |
dc.publisher.initials | UFRN | pt_BR |
dc.publisher.program | Curso de Graduação em Estatística | pt_BR |
dc.subject | Modelos Lineares Generalizados | pt_BR |
dc.subject | Expressão Gênica | pt_BR |
dc.subject | Bioinformática | pt_BR |
dc.subject | Generalized Linear Models | pt_BR |
dc.subject | Gene Expression | pt_BR |
dc.subject | Bioinformatics | pt_BR |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE E ESTATISTICA APLICADAS | pt_BR |
dc.title | Modelos lineares generalizados para análise de expressão gênica diferencial: biomarcadores sexo-específicos no Transtorno Depressivo Maior | pt_BR |
dc.title.alternative | Generalized linear models for differential gene expression: sex-specific biomarkers of Major Depressive Disorder | pt_BR |
dc.type | bachelorThesis | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- ModelosLinearesGeneralizados_Souza_2023.pdf
- Tamanho:
- 1.97 MB
- Formato:
- Adobe Portable Document Format
Nenhuma Miniatura disponível
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.45 KB
- Formato:
- Item-specific license agreed upon to submission
Nenhuma Miniatura disponível