Abordagens da biologia de sistemas na investigação dos pontos de articulação nas rotas metabólicas do KEGG

dc.contributor.advisorDalmolin, Rodrigo Juliani Siqueira
dc.contributor.advisorIDpt_BR
dc.contributor.authorBrandão, Igor Augusto
dc.contributor.authorIDpt_BR
dc.contributor.referees1Costa, Cesar Renno
dc.contributor.referees1IDpt_BR
dc.contributor.referees2Albanus, Ricardo D'Oliveira
dc.contributor.referees2IDpt_BR
dc.date.accessioned2020-11-27T13:38:42Z
dc.date.available2020-11-27T13:38:42Z
dc.date.issued2020-08-14
dc.description.abstractThe study of proteins essentiality through laboratory methods is expensive, time-consuming and not scalable for large amounts of proteins. Besides, it is relevantto evaluate the essentiality of several proteins of a metabolic pathway as a whole. Themetabolic pathways can be analyzed as graphs, which provide several tools to studythe topological features such as the articulation points. Nowadays, research in bioinfor-matics studies the essentiality of proteins based on betweenness and degree metrics,however, graph theory suggests that articulation points could be essential nodes in anetwork. It remains to be determined whether these articulation points are essential inmetabolic pathways and their topological impact on the network. Using network analysisvia metrics and biologic curation, we aim to verify if bottlenecks are proteins with thehighest frequencies and located in the center of KEGG metabolic pathways. For thispurpose, we identified the articulation points in different networks, evaluate the impactof each articulation point, calculate their frequency and compare them with occurrencesof non-articulation points. We consulted KEGG pathways available as KGML files. After,the data was transformed into a graph object. Two centrality parameters includingarticulation points and degree are determined and the essential proteins based onthese parameters are classified. Approximately 20% of the proteins are articulationpoints. The articulation points with high-frequency which are located in central regionsof the network were considered the most important (3.75%). In addition, the highestconcentration of articulation points occurred in the frequency range of 80-90%. A patternof non-randomness of articulation points was identified in the protein groups that havea frequency of at least 74.5%. Finally, steroid biosynthesis is the metabolic pathwaywith the highest number of articulation points with frequency higher than 80%. Besides,oxidoreductase is the articulation point class present in the highest number of metabolicpathways. Overall, the findings suggest that bottlenecks are articulation points withhighest frequencies and located in the center of the network. It remains to perform adeep analysis on the articulation points biological rolespt_BR
dc.description.resumoO estudo da essencialidade das proteínas por meio de métodos laboratoriais é caro e não escalável para grandes quantidades de proteínas, desta forma é relevante avaliar a essencialidade das várias proteínas de uma via metabólica como um todo através de ferramentas computacionais. Em geral, uma via metabólica pode ser analisada como grafos, os quais fornecem diferentes recursos para o estudo das características topológicas de redes, como os seus pontos de articulação e disposição dos nós. Atualmente, pesquisas em bioinformática estudam a essencialidade de proteínas com base nas métricas de betweenness e degree, contudo a teoria dos grafos sugere que os pontos de articulação podem ser nós importante em uma rede resta avaliar se esses pontos de articulação são de fato essenciais para as vias metabólicas e seu impacto topológico na rede. Utilizando análises baseadas em métricas de rede, o nosso objetivo é verificar se de fato esses pontos de articulação representam gargalos na rede, sendo estes caracterizados como proteínas de frequências elevadas e localizadas no centro das redes. Para tanto, identificamos os pontos de articulação em diferentes vias metabólicas do KEGG, avaliamos o impacto de cada um deles, calculamos sua frequência e comparamos suas ocorrências com as demais proteínas. Inicialmente, fizemos o levantamento das vias metabólicas do KEGG que estavam disponíveis através dos arquivos KGML associados às redes. Após a listagem das vias disponíveis, os dados estruturais de cada uma delas foram convertidos em objetos do tipo grafo. Os parâmetros ponto de articulação, betweenness e degree foram utilizados para classificar as proteínas constantes em cada via metabólica. Aproximadamente 20% das proteínas foram classificadas como pontos de articulação, das quais 3,75% foram identificadas pela alta frequência e localização em regiões centrais da rede. Além disso, a maior concentração dos pontos de articulação ocorreu na faixa de frequência dos 80 a 90%. Um padrão de não aleatoriedade na distribuição dos pontos de articulação foi identificado nos grupos com frequências acima de 74,5%. Finalmente, a biossíntese de esteroides foi a via metabólica com o maior número de pontos de articulação com frequências superiores a 80% em sua constituição. A oxidoredutase foi a classe dos pontos de articulação presente no maior número de vias metabólicas. As descobertas sugerem que os gargalos das redes avaliadas são pontos de articulação com as frequências mais altas e localizados no centro da rede. Resta realizar análises mais aprofundadas a respeito dos papéis biológicos destes pontos de articulação encontradospt_BR
dc.identifier.citationBRANDÃO, Igor Augusto. Abordagens da biologia de sistemas na investigação dos pontos de articulação nas rotas metabólicas do KEGG. 2020. 61f. Dissertação (Mestrado em Bioinformática) - Universidade Federal do Rio Grande Do Norte, Universidade Federal do Rio Grande do Norte, Natal, 2020.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/30737
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICApt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectBiologia de sistemaspt_BR
dc.subjectKEGGpt_BR
dc.subjectPonto de articulaçãopt_BR
dc.subjectVia metabólicapt_BR
dc.subjectTopologia de redespt_BR
dc.subjectVisualização de redes.pt_BR
dc.subjectSystems biologypt_BR
dc.subjectArticulation pointpt_BR
dc.subjectMetabolic pathwaypt_BR
dc.subjectNetworktopologypt_BR
dc.subjectnetwork visualizationpt_BR
dc.titleAbordagens da biologia de sistemas na investigação dos pontos de articulação nas rotas metabólicas do KEGGpt_BR
dc.typemasterThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
IgorAugustoBrandao_DISSERT.pdf
Tamanho:
14.17 MB
Formato:
Adobe Portable Document Format
Carregando...
Imagem de Miniatura
Baixar