PPGBIONF - Doutorado em Bioinformática
URI Permanente para esta coleçãohttps://repositorio.ufrn.br/handle/123456789/24563
Navegar
Navegando PPGBIONF - Doutorado em Bioinformática por Data de Publicação
Agora exibindo 1 - 20 de 30
- Resultados por página
- Opções de Ordenação
Tese Bioinformática aplicada ao desenvolvimento de estratégias de prognóstico e tratamento do câncer: estudos na prospecção de alvos terapêuticos, antígenos tumorais e na dinâmica de resposta a drogas(2018-11-01) Faustino, André Luís Fonseca; Souza, Sandro José de; ; ; Souza, Gustavo Antonio de; ; Lima, Lucymara Fassarella Agnez; ; Carraro, Dirce Maria; ; Balbino, Valdir;Essencialmente, a pesquisa do câncer é um campo que envolve vários ramos, abrangendo a compreensão da biologia do câncer, design de drogas e desenvolvimento terapêutico. De maneira geral, a pesquisa contra o câncer está concentrada no diagnóstico, prognóstico, tratamento e, finalmente, na cura do paciente. Nesse contexto, a bioinformática do câncer surge como um poderoso recurso, integrando dados públicos e, consequentemente, permitindo o avanço de aplicações clínicas. Têm-se como exemplo, o desenvolvimento de abordagens para tratamento, a descoberta de novas drogas e também, recentemente, de estratégias imunoterapêuticas. Neste trabalho, apresenta-se abordagens distintas para compreender a biologia do câncer com foco no seu tratamento e, principalmente, na predição do prognóstico. Cada capítulo mostra diferentes aplicações clínicas como, a previsão de resultados de sobrevida, oportunidades para novos tratamentos imunológicos e resistência a drogas. Nos capítulos iniciais são apresentados catálogos extensivos de genes associados a: i) marcadores de superfície de celular e ii) antígenos de câncer/testículo (CTAs). Em particular, foi demonstrado o efeito de assinaturas gênicas compostas por essas categorias, na predição do status de prognóstico em pacientes com câncer. Em um segundo momento, foi discutido o desenvolvimento de novas estratégias de imunoterapia baseadas em vacinas, combinando múltiplos CTAs. Particularmente, discute-se como as assinaturas de CTAs compostas por HEATR9, INSL3, GTSF1L e HSF5 melhoram o status de prognóstico em pacientes com melanoma. Por último, apresentamos uma metodologia com foco na regulação póstranscricional, a qual integra informação genotípica, dados de expressão e concentração de drogas para avaliar a resistência/sensibilidade do tratamento, utilizando dados de linhagem celular e de pacientes. Como conclusão, foram apresentadas três abordagens independentes para melhorar o tratamento do câncer, que podem ser usadas combinando ou não, os marcadores de prognóstico da superfície celular, o preditor de resposta a drogas e as vacinas contra o câncer. Ainda, como outros produtos importantes, são mencionados dois artigos publicados em períodos internacionais, bem como, uma patente em andamento.Tese Análise baseada em biologia de sistemas de dados transcricionais de células progenitoras neurais humanas tratadas com chumbo(2019-11-01) Reis, Clóvis Ferreira dos; Dalmolin, Rodrigo Juliani Siqueira; Almeida, Rita Maria Cunha de; ; ; ; Ferreira, Beatriz Stransky; ; Bonatto, Diego; ; Pasquali, Matheus Augusto de Bittencourt; ; Amaral, Viviane Souza do;As consequências do envenenamento por chumbo são diversas e importantes na saúde humana uma vez que este metal pesado pode interagir com muitos sistemas orgânicos, afetando principalmente o sistema nervoso, com implicações graves e irreversíveis do neurodesenvolvimento, consolidação de memória e processos de aprendizagem em crianças. Sua interação com componentes celulares dá-se de muitas formas, afetando proteínas de ligação a íons, proteínas de sinalização de transdução, canais iônicos transmembrana e fatores de transcrição. Apesar da sintomatologia da intoxicação por chumbo já ser bastante conhecida, pouco ainda se sabe sobre seus efeitos sistêmicos e sobre o seu impacto global na modulação da transcrição de células neuronais. A fim de investigar tais efeitos sob uma ótica de biologia de sistemas, aplicamos o pipeline do pacote transcriptogramer R/Bioconductor com a finalidade de avaliar o perfil transcricional de células progenitoras neurais humanas (NPCs) tratadas com acetato de chumbo 30µM por 26 dias. Dotado de um método não supervisionado, o algoritmo do transcriptogramer é projetado para identificar, em experimentos do tipo caso-controle, grupos de genes funcionalmente associados e diferencialmente expressos. Tal pipeline foi capaz de identificar onze clusteres diferencialmente expressos entre os dias 3 e 11 do tratamento com chumbo. Destes, sete apresentaram uma regulação negativa de diversos sistemas celulares envolvidos na diferenciação celular, como organização do citoesqueleto, RNA e biossíntese de proteínas, caracterizados por redes grandes e fortemente conectadas. Os quatro clusteres positivamente regulados apresentaram nós esparsos e pouco conectados, principalmente relacionados a transcrição, transporte transmembrana e transdução de sinal. Já no período subsequente, envolvendo os dias 12 a 26 de tratamento, foi possível observar uma alteração maciça do perfil de transcrição celular com interferência em todas as camadas da regulação da expressão gênica. Desta forma, nossos resultados sugerem que o chumbo induz modificações transcricionais significativas nas NPCs que podem ser correlacionadas a danos e/ou adaptações de diversos sistemas, todos decorrentes da intoxicação por este metal pesado, influenciando, assim, o resultado final da diferenciação das células ES-NP.Tese flowDiv: uma nova ferramenta computacional para análise da diversidade citométrica ambiental(2019-11-25) Wanderley, Bruno Mattos Silva; Doria Neto, Adrião Duarte; ; ; Araújo, Daniel Sabino Amorim de; ; Souza, Jorge Estefano Santana de; ; Amado, André Megali; ; Unrein, Fernando; ; Menezes, Rosemberg Fernandes de;A citometria de fluxo (CMF) é uma técnica analítica baseada na caracterização espectroscópica de partículas em suspensão. Essa técnica permite a descrição quantitativa e qualitativa de uma vasta gama de sistemas celulares em poucos segundos e a custos relativamente baixos - características que a tornam uma ferramenta bastante ubíqua em protocolos analíticos, tanto industriais quanto acadêmicos. Nesse tocante, as ciências ambientais vem lidando com obstáculos bastante notórios quanto à estruturação de protocolos de CMF: a natureza altamente heterogênea das amostras ambientais dificulta o ajuste de protocolos que equilibrem raciocínios matemáticos padronizados e os significados biológicos intrínsecos do sistema em estudo. Diversas abordagens vem sendo concebidas com vistas a corrigir essas incongruências e, dentre elas, as que exploram a ideia da diversidade citométrica - o estudo de dados de CMF com base em métodos de ecologia numérica - vem se mostrando bastante auspiciosas. Contudo, apesar da disponibilidade de soluções, muitos desafios técnicos ainda precisam ser superados. Neste trabalho, nós desenvolvemos e aplicamos uma nova ferramenta computacional, o flowDiv, especialmente projetada para a análise da diversidade citométrica de dados ambientais. Aqui, além de pormenorizarmos a lógica por trás do método e o compararmos a estratégias computacionais similares, nós o aplicamos a problemas reais, revelando como alguns fatores ecológicos importantes, como o estado nutricional, afetam a diversidade citométrica de grupos microbianos de lagos naturais da Patagônia argentina e do nordeste brasileiro. Nossos resultados sugerem que variáveis ambientais importantes - notadamente clorofila a e carbono, fósforo e nitrogênio totais - afetam a diversidade citométrica de bactérias de maneiras distintas. Essas descobertas alinham-se com a literatura vigente sobre o tema e reafirmam a validade do flowDiv para refletir, de forma consistente, alterações na composição das comunidades bacterianas decorrentes de mudanças ambientais.Tese Bioinformática aplicada na identificação de genes de câncer/testículo e sua associação com prognóstico em uma análise pan-câncer(2019-12-04) Silva, Vandeclécio Lira da; Souza, Sandro José de; Lima, Lucymara Fassarella Agnez; ; ; ; Dalmolin, Rodrigo Juliani Siqueira; ; Santos, Sidney Emanuel Batista dos; ; Lajus, Tirzah Braz Petta; ; Santos, Ândrea Kely Campos Ribeiro dos;Os genes de câncer/testículo (CT) são excelentes candidatos para o desenvolvimento de ferramentas imunoterapêuticos associadas ao câncer, devido à sua expressão restrita em tecidos normais e à capacidade de provocar uma resposta imune quando expressa em células tumorais. Neste sentido, no presente estudo realizamos uma análise em escala genômica para os genes de CT, identificando 745 putativos genes de CT. Ao compararmos com outros conjuntos de genes foram identificados novos genes de CT. Realizamos a integração de várias bases de dados de expressão gênica de tecidos normais e de tumores, para identificação desses genes. A integração de dados clínicos e de infiltração de células CD8+ no tumor, nos proporcionou a identificação de dezenas de genes de CT associados com prognóstico bom ou ruim. Para aqueles genes de CT relacionados ao bom prognóstico, mostramos em pacientes com câncer uma relação direta entre a expressão gênica do CT e um sinal de infiltração de células CD8+ para alguns tipos de tumores, especialmente melanoma. Adicionalmente, nesta tese contextualizamos a bioinformática em um cenário de big data.Tese Estudo bioquímico quântico de interações entre o receptor androgênico, RNAr e MCL-1 e Ligantes(Universidade Federal do Rio Grande do Norte, 2020-03-24) Bezerra, Katyanna Sales; Fulco, Umberto Laino; ; ; Galvão, Douglas Soares; ; Albuquerque, Eudenilson Lins de; ; Dalmolin, Rodrigo Juliani Siqueira; ; Freire, Valder Nogueira;Esta tese apresenta três pesquisas realizadas no campo da simulação ab initio, baseadas em princípios da Mecânica Quântica. O primeiro estudo retrata as particularidades das interações entre o receptor androgênico (RA) carregando uma mutação T877A, cuja qual promove promiscuidade no receptor, e dois fármacos antagonistas acetato de ciproterona e hidroxiflutamida (CPA e HFT) e um composto agonista (RLL). As energias de interação foram obtidas com base em métodos da química quântica baseados na Teoria do Funcional da Densidade (DFT) utilizando o método de Fragmentação com Capas Conjugadas (MFCC). Os resultados demonstram a relevância individual entre T877A-RA e os ligantes, apontando os principais resíduos que perfazem as interações. O segundo estudo apresenta a análise da interação entre RNA ribossômico 16S e a higromicina B (hygB) é um antibiótico aminoglicosídeo que afeta a translocação ribossômica, utilizando a estratégia MFCC à luz do DFT e parametrizações de constantes dielétricas. Os resultados apontaram que os nucleotídeos C1403, C1404, G1405, A1493, G1494, U1495, C1496 e U1498 tinham as energias de ligação mais negativas, tornando-os fortes candidatos para estabilizar o hygB em uma bolsa de ligação adequada da subunidade ribossômica 30S dos procariontes. Já o terceiro trabalho apresentado aqui investiga as interações entre a proteína anti-apoptótica MCL-1, a qual sua superexpressão tem a capacidade de bloquear a via de sinalização da apoptose permitindo o crescimento celular desordenado, e sete compostos químicos com potencial para inibir a proteína. A metodologia utilizada aqui também utiliza métodos quânticos baseados no DFT, além do MFCC. Os resultados apontaram que os resíduos Arg263, Met231, Val253 Phe270, Phe228, Phe254, Leu267 e Thr266 são de crucial importância para a ligação dos inibidores ao bolso hidrofóbico de MCL-1. Os métodos computacionais utilizados nos três estudos emergem como uma alternativa elegante e eficiente para o desenvolvimento de medicamentos.Tese Processo epidêmico mediado por vetores e processo epidêmico no modelo SIS em rede complexa: um estudo das propriedades críticas(Universidade Federal do Rio Grande do Norte, 2020-08-19) Santos, Frederico Lemos dos; Fulco, Umberto Laino; ; ; Lima, João Paulo Matos Santos; ; Macedo Filho, Antônio de; ; Almeida, Mauricio Lopes de; ; Barbosa, Paulo Henrique Ribeiro;Desde 1990 que as propagações epidêmicas têm sido alvo de muitos estudos baseados nos métodos da Física Estatística. As dinâmicas desses processos epidêmicos, tipicamente de não equilíbrio, consistem na competição pelo estado de saúde ativo (hospedeiros infectados) e inativo (hospedeiros não infectados). A transição entre estes estados ativo (epidêmico) e inativo (não epidêmico) permite a análise do ponto e dos expoentes críticos do sistema (classe de universalidade). Nesta tese investiga-se as propriedades críticas de dois sistemas epidêmicos: O primeiro composto de duas espécies de população que são a humana com hospedeiros não infectados (H) e hospedeiros infectados (Hi) e a dos vetores composta de vetores não infectados (V ) e vetores infectados (Vi), que se difundem independentemente numa rede unidimensional, com a taxa D, seguindo uma regra dinâmica de probabilidade, onde as taxas de cura dos vetores e dos indivíduos são respectivamente φ e λ. Um segundo sistema epidêmico, conhecido como suscetível infectado suscetível (SIS), em uma rede complexa com alto fator de agregação e com taxa de contaminação λ. Os dois modelos foram simulados usando-se o método de Monte Carlo para a obtenção dos dados e uma análise de escala de tamanho finito permitiu que se estimasse as propriedades críticas. Para o primeiro modelo obteve-se o ponto crítico para quinze combinações entre as taxas de cura dos vetores e hospedeiros e se enquadrou na classe de universalidade dos processos epidêmicos difusivos, expoentes z = ν = 2 e β/ν = 0, 11(2). Para o segundo modelo, o ponto crítico foi λc = 0, 068(9) e os expoentes foram: β/ν = 0, 88(4), 1/ν = 0, 25(4) e γ/ν = 0, 51. Estas informações podem contribuir com as metodologias empregadas pela epidemiologia no combate as doenças infecciosas.Tese Um sistema inteligente de baixo custo para detecção de ácidos nucleicos baseados em eletroforese no espectro visível(Universidade Federal do Rio Grande do Norte, 2020-11-20) Cunha, Eduardo Nogueira; Lima, João Paulo Matos Santos; ; http://lattes.cnpq.br/3289758851760692; ; http://lattes.cnpq.br/7628513373242513; Doria Neto, Adrião Duarte; ; http://lattes.cnpq.br/1987295209521433; Galdino, Alexsandro Sobreira; ; http://lattes.cnpq.br/6317408425320526; Lanza, Daniel Carlos Ferreira; ; http://lattes.cnpq.br/6851351991421755; Fernandes, Marcelo Augusto Costa; ; http://lattes.cnpq.br/3475337353676349; Cunha, Rodrigo Maranguape Silva da; ; http://lattes.cnpq.br/1918056067943429Com a crescente expansão da Internet of Things o desenvolvimento de produtos e serviços tem se automatizado cada vez mais, uma ampla gama de oportunidades de desenvolvimento tem se aberto em diversas áreas. O ambiente laboratorial apresenta diversos equipamentos e serviços que ainda necessitam de informatização e desenvolvimento especialmente voltado para o baixo custo, miniaturização e conectividade. Com o objetivo de ampliar a análise e diagnósticos para locais com baixo recurso. A detecção de ácidos nucleicos por eletroforese é uma técnica rápida e acessível para muitos métodos de diagnóstico, principalmente em laboratórios de pesquisa ou em unidades básicas de saúde. Protocolos padrão detectam moléculas de ácidos nucleicos através de corantes químicos específicos usando um transiluminador de UV ou sistema de fotodocumentação ultravioleta. No entanto, os custos de aquisição e a disponibilidade desses dispositivos, principalmente aqueles com capacidade de fotografia e conexão à Internet são proibitivos, principalmente nos países em desenvolvimento. Os sistemas de detecção de ácidos nucleicos por meio de eletroforese em sua maioria expõe os profissionais a vários fatores de risco pois utilizam radiação ultravioleta para detecção e também o risco de contato com as amostras e equipamentos contaminados por corantes, que em sua maioria possuem substâncias mutagênicas. Este trabalho descreve o desenvolvimento de um sistema de hardware e software de detecção de ácidos nucleicos de baixo custo, capaz de obter dados qualitativos e semiquantitativos da análise em gel. O dispositivo proposto explora a faixa de absorção de luz visível dos corantes de ácidos nucleicos comumente usados, utilizando dispositivos eletrônicos de fácil acesso e processos de fabricação rápidos e simples. Usando técnicas de rastreamento espectral o sistema cobre uma ampla gama de espectros de cores para detectar bandas de vários corantes usados comercialmente. A obtenção do ponto ótimo para excitação dentro da região do visível é possível pela análise detalhada de todo o espectro de excitação do corante e sensibilidade na obtenção dos comprimentos de onda através dos diodos emissores e luz. Usando os conceitos de conectividade da Internet of Things, usamos a comunicação sem fio, via Bluetooth, para desenvolvimento de Interface homem-máquina no smartphone para controle do dispositivo proposto, captura e compartilhamento de imagens. O desenvolvimento do projeto foi pensado para permitir a escalabilidade do processo, baixos custos de fabricação e manutenção. O uso de LEDs no espectro visível pode obter imagens muito reproduzíveis, fornecendo um alto potencial para diagnósticos rápidos e no local de atendimento, além de aplicações em vários campos, como saúde, agricultura e aquicultura.Tese Importância da análise da expressão gênica em tecidos e células-únicas no estudo das neurociências: do desenvolvimento do neocórtex ao estudo da doença de Alzheimer(Universidade Federal do Rio Grande do Norte, 2021-05-31) Coelho, Diego Marques; Costa, Marcos Romualdo; Souza, Sandro José de; ; http://lattes.cnpq.br/8479967495464590; ; http://lattes.cnpq.br/6118493598074445; ; http://lattes.cnpq.br/2074007934768692; Lourenço, Mychael Vinícius da Costa; ; http://lattes.cnpq.br/4749634096638221; Garcez, Patricia Pestana; ; http://lattes.cnpq.br/7284551536353300; Dalmolin, Rodrigo Juliani Siqueira; ; http://lattes.cnpq.br/4065178015615979; Velho, Tarciso André Ferreira; ; http://lattes.cnpq.br/8194534389725093O sequenciamento de RNA mensageiro em larga escala (RNAseq) permite avaliar a diversidade de transcritos expressos em um determinado momento de um sistema biológico. Através da bioinformática, podemos analisar os dados de sequenciamento para obter informações quantitativas sobre a expressão gênica, tais como a expressão diferencial de genes e suas isoformas (splices alternativos). Nesta tese, apresentamos dois estudos independentes que se valeram da bioinformática para obter informações relevantes sobre diferentes fenômenos biológicos. No primeiro caso, nós utilizamos dados de sequenciamento de RNAm em cérebros de pacientes com a doença de Alzheimer para estudar a expressão diferencial de genes e transcritos associadas com a progressão desta doença. Nós demonstramos que a análise de transcritos permite a identificação de alterações gênicas ignoradas em estudos anteriores avaliando apenas a expressão global dos genes. Utilizando dados de sequenciamento de RNAm em células únicas (scRNAseq), nós também mapeamos as alterações da expressão gênica no cérebro de pacientes com a doença de Alzheimer para tipos celulares específicos. Os resultados deste primeiro trabalho contribuem para uma melhor compreensão da patofisiologia da doença de Alzheimer e indicam potenciais alterações moleculares associadas com a doença em tipos celulares individuais. No segundo trabalho desenvolvido nesta tese, nós utilizamos a técnica de scRNAseq para estudar a diversidade de células progenitoras em estágios iniciais do desenvolvimento do neocórtex. Através de análises de expressão diferencial de genes e a utilização de uma abordagem utilizando redes de regulação da expressão gênica, nós identificamos o fator de transcrição Sox9 como um regulador-mestre do comportamento de diferentes subtipos de progenitores neurais. Confirmando estes achados da bioinformática, experimentos genéticos para manipular os níveis de expressão de Sox9 em progenitores neurais demonstraram a importância deste fator de transcrição na regulação da proliferação e diferenciação celular. Em conjunto, os resultados desta tese demonstram a importância da análise transcriptômica através de métodos complementares para uma melhor identificação das alterações da expressão gênica relevantes em diferentes contextos biológicos.Tese 3D-QSARpy: Combinando estratégias de seleção de atributos e técnicas de aprendizado de máquina para construir modelos QSAR 3D(Universidade Federal do Rio Grande do Norte, 2021-08-04) Silverio, Priscilla Suene de Santana Nogueira; Barbosa, Euzébio Guimarães; http://lattes.cnpq.br/3197108792266393; http://lattes.cnpq.br/4408967829407525; Oliveira, Amanda Gondim de; http://lattes.cnpq.br/3619642245221227; Canuto, Anne Magaly de Paula; http://lattes.cnpq.br/1357887401899097; Santos, Araken de Medeiros; http://lattes.cnpq.br/8059198436766378; Lima, João Paulo Matos Santos; http://lattes.cnpq.br/3289758851760692; Oliveira, Laura Emmanuella Alves dds Santos Santana deQuantitative Structure Activity Relationship (QSAR) é uma tecnologia da área da química medicinal que busca esclarecer as relações existentes entre estruturas moleculares e suas respectivas atividades biológicas. Para isso, são construídos modelos QSAR a partir dos dados estruturais (1D, 2D, 3D ou 4D) provenientes de uma série de moléculas já testadas para uma determinada atividade. Através de predições realizadas por esses modelos, objetiva-se identificar quais modificações na molécula podem influenciar, reforçando ou não a resposta biológica. Tal tecnologia permite acelerar o desenvolvimento de novos compostos, reduzindo os custos destinados ao planejamento de fármacos. Considerando o contexto brevemente exposto, o presente trabalho apresenta como objetivo geral desenvolver uma metodologia para predição de atividade biológica em moléculas bioativas. A metodologia foi validada com sucesso através da aplicação da ferramenta em dois conjuntos de dados com resultados superiores aos previamente publicados. O primeiro deles envolvendo o tratamento de diabetes, alcançando r2 pred = 0.91. O segundo conjunto referente ao tratamento de câncer, com r2 pred=0.98. Por fim, duas aplicações da ferramenta foram realizadas, contribuindo com a identificação de novas estruturas moleculares bioativas usando diferentes abordagens. Sendo a primeira delas destinada ao tratamento da doença de chagas, incluindo a construção de modelos QSAR híbridos para três séries, obtendo, r2 pred=0.8, 0.68 e 0.85. A segunda aplicação para construção de modelos QSAR-4D foi destinada ao tratamento da tuberculose com r2 pred=0.72. Todos os experimentos realizados, sejam para validação ou para identificação dessas novas moléculas demonstraram, não somente a eficiência da metodologia proposta e da ferramenta desenvolvida, como também a versatilidade de aplicações possíveis por meio dela, seja seguindo o seu pipeline geral, seja utilizando-o parcialmente de modo combinado com outras ferramentas existentes.Tese Engenharia reversa da rede regulatória da sepse pediátrica e identificação de reguladores mestres(Universidade Federal do Rio Grande do Norte, 2021-08-11) Andrade, Raffael Azevedo de Carvalho Oliveira; Dalmolin, Rodrigo Juliani Siqueira; http://lattes.cnpq.br/4065178015615979; http://lattes.cnpq.br/7034881822577095; Costa, César Renno; http://lattes.cnpq.br/9222565820639401; Lima, João Paulo Matos Santos; http://lattes.cnpq.br/3289758851760692; Klamt, Fábio; http://lattes.cnpq.br/3256932358053453; Pasquali, Matheus Augusto de Bittencourt; http://lattes.cnpq.br/2819075769518114A sepse é uma síndrome inflamatória aguda muito marcante. É responsável pela maioria dos óbitos em leitos de UTI por todo o mundo. Por se tratar de uma condição estritamente inflamatória e, por causa disso, multifatorial, existem poucos estudos relativos à regulação gênica em indivíduos sépticos, menos ainda em pacientes pediátricos. A compreensão dos mecanismos regulatórios pode auxiliar no combate à sepse por identificar pontos-chave das vias de sinalização responsáveis pela progressão. Uma estratégia para identificação dos alvos regulatórios de uma doença é a reconstrução da sua rede regulatória a partir de dados transcricionais públicos, identificando os principais fatores de transcrição como reguladores mestres. Devido à escassez de dados de sepse em pacientes pediátricos e a grande diferença de resposta entre adultos e crianças, o objetivo deste trabalho é o de reconstruir a rede regulatória da sepse e identificar seus posíveis reguladores mestres. Ao todo foram encontrados 15 fatores que são bons candidatos a regulador mestre na sepse. Especialmente o MEF2A, TRIM25 e RFX2 foram identificados sendo mais expressos em pacientes sépticos do que em indivíduos saudáveis. Cada um deles possui uma função isolada e até então não relacionadas à sepse diretamente, porém quando analisadoso em conjunto, podem agir como um tripleto, onde cada fator exerce seu papel em parceria com os outros dois. Os resultados encontrados aqui apontam os três fatores como possíveis reguladores mestres da sepse pediátrica que apresentam grande potencial como alvos terapêuticos.Tese Modelo para identificação de genes bimodais associados ao prognóstico no câncer(Universidade Federal do Rio Grande do Norte, 2021-09-16) Justino, Josivan Ribeiro; Souza, Sandro José de; Ferreira, Beatriz Stransky; 62825968668; http://lattes.cnpq.br/3142264445097872; http://lattes.cnpq.br/8479967495464590; http://lattes.cnpq.br/6470296449367089; Torrezan, Giovana; http://lattes.cnpq.br/1174527002469907; Souza, Jorge Estefano Santana de; http://lattes.cnpq.br/8058577659019910; Nunes, Marcus Alexandre; http://lattes.cnpq.br/2698100541879707; Santos, Ândrea Kely Campos Ribeiro dos; http://lattes.cnpq.br/3899534338451625Nas últimas décadas o interesse biológico em compreender a regulação gênica, tem levado a descobertas de genes tumorais com expressões diferenciadas em subgrupos de pacientes. Estes genes possuem um perfil bimodal de distribuição dos valores de expressão, o que têm despertado a atenção para investigar os padrões de desenvolvimento e de sua funcionalidade. Para melhor compreender o padrão bimodal destes genes, o objetivo principal do trabalho foi identificar grupos distintos de pacientes em determinado tipo de tumor, que apresentassem níveis baixo e alto da expressão para o mesmo gene, associados a um melhor ou pior prognóstico de sobrevida do câncer. Desenvolvemos um método que seleciona genes candidatos ao padrão de bimodalidade a partir da função densidade de probabilidade dos valores de expressão. Analisamos 25 tipos de tumor disponíveis no The Cancer Genome Atlas (TCGA), à realizamos análise de sobrevivência usando informações clínicas extraídas do cBioPortal for Cancer Genomics. Utilizamos os dados de expressão em Fragments by Exon Kilobase per Millions of Mapped Fragments (FPKM) para 24.456 genes, e encontramos nos 25 tipos de tumores 554 genes bimodais únicos, dos quais 46 apresentaram expressão bimodal em mais de um tipo de câncer, com maior prevalência no cromossomo Y. Os tumores KIRC, KIRP, LGG, SKCM, THCA e THYM apresentaram amostras consistentes quanto ao prognóstico de sobrevida com p-valor ≤ 0,01. O método mostrou-se eficiente em reduzir os níveis de variabilidade interna dos grupos, principalmente quando analisamos os dados pelo subtipo de câncer. Como contribuição apresentamos um método com o código livre, que possibilita reduzir os níveis de variabilidade interna dos grupos e que relaciona o padrão de expressão bimodal com o prognóstico de sobrevida. Assim, acreditamos que a utilização do método poderá ser útil na avaliação do padrão bimodal de expressão gênica e na descoberta de novos biomarcadores clínicos para diferentes tipos de câncer.Tese Seleção de características de sequências para resolução de perguntas biológicas ligadas à análise de variantes e ao desenvolvimento de siRNAs Anti-SARS-CoV-2(Universidade Federal do Rio Grande do Norte, 2021-09-21) Medeiros, Inácio Gomes; Souza, Jorge Estefano Santana de; Souza, Jorge Estefano Santana de; 17623795899; http://lattes.cnpq.br/8058577659019910; http://lattes.cnpq.br/8058577659019910; http://lattes.cnpq.br/8450369742588953; Santos, Araken de Medeiros; http://lattes.cnpq.br/8059198436766378; Ferreira, Beatriz Stransky; http://lattes.cnpq.br/3142264445097872; Santos, Sidney Emanuel Batista dos; http://lattes.cnpq.br/9809924843125163; Petta, Tirzah Braz; http://lattes.cnpq.br/9979644969955564A análise de variantes em um contexto clínico e o suporte ao desenvolvimento de terapias contra doenças virais são duas áreas em que diversas pesquisas têm utilizado processos de integração e análise de dados ômicos. Aferir se uma dada variante possui ou não impacto patogênico é um desafio presente na análise de variantes, inclusive quando diferentes ferramentas de predição de patogenicidade apontam resultados divergentes. Em relação ao desenvolvimento de terapias baseadas em RNA de interferência, observa-se que existe uma necessidade contínua de desenho e avaliação de eficiência de novos RNAs pequenos de interferência (siRNAs, do inglês short-interfing RNAs) a cada novo vírus que surge, como o SARS-CoV-2, responsável pela pandemia de COVID-19. Nessa direção, argumenta-se nesta tese, a partir da discussão de dois trabalhos, que processos de integração de dados e seleção de características podem trazer contribuições na resolução de questões ligadas à identificação de patogenicidade de variantes e, em um segundo momento, à disponibilização de informação e características de sequências que podem vir a servir para a formulação de terapias para a COVID-19. Em linhas gerais, o estudo objetivou (a) desenvolver métodos de integração de dados e seleção de características de variantes para aferição de patogenicidade e (b) desenvolver métodos de integração de dados visando a construção de um banco de dados de siRNAs para SARS-CoV-2. Para atingir o primeiro objetivo, foi proposto um modelo de classificação baseado em árvores de decisão para estimar a patogenicidade de variantes, construído por meio de um processo de integração de dados públicos de variantes já catalogadas com predições de patogenicidade trazidas por ferramentas baseadas em aprendizado de máquina. O modelo obtido foi capaz de apresentar uma acurácia superior ao estado da arte relativo à predição de patogenicidade de variantes, constituindo-se em uma importante ferramenta de apoio a profissionais de saúde, como nos diagnósticos de doenças genéticas. No segundo objetivo, combinou-se dados de propriedades estruturais, termodinâmicas, toxicidade, similaridade e de eficiência com o intuito de montar um catálogo global de siRNAs para o SARS-CoV-2. A integração de propriedades diversas relativas a siRNAs em uma única base de dados consolida-se como um referencial de informação que permite a realização de filtragens in silico simples e direcionadas, poupando a execução de muitos testes de bancadas em cima de moléculas candidatas para terapias contra a COVID-19. Esses estudos possuem pontos em comum com outros de integração de dados da literatura, entre eles, aspectos envolvendo diversidade dos dados, reprodutibilidade e descoberta de conhecimento. Por fim, verificou-se que estes trabalhos possuem potencial de aplicação clínica, seja para incrementar a compreensão de variantes relacionadas a comorbidades genéticas diversas, no caso do primeiro trabalho, como no apoio ao desenvolvimento de terapias contra a COVID-19, no caso do segundo trabalho.Tese Investigação in silico do mecanismo de reorganização sináptica do sono. Um algoritmo para maximizar a capacidade computacional de redes neurais esparsas(Universidade Federal do Rio Grande do Norte, 2021-11-09) Silva, Ana Cláudia Costa da; Ribeiro, Sidarta Tollendal Gomes; Costa, César Renno; 22508952877; http://lattes.cnpq.br/9222565820639401; http://lattes.cnpq.br/0649912135067700; http://lattes.cnpq.br/4555593159788385; Dalmolin, Rodrigo Juliani Siqueira; http://lattes.cnpq.br/4065178015615979; Mohan, Madras Viswanathan Gandhi; http://lattes.cnpq.br/1995273890709490; Copelli, Mauro; http://lattes.cnpq.br/9400915429521069; Vasconcelos, Nivaldo Antônio Portela de; http://lattes.cnpq.br/4110109220389767As memórias são armazenadas no cérebro pela mudança persistente da conectividade entre neurônios e o sono desempenha um papel decisivo para a persistência dessas mudanças. Pesquisas sobre a neurobiologia do sono demonstram a ativação de mecanismos de plasticidade sináptica de longa duração. Dados experimentais apontam para um duplo papel do sono, tanto no esquecimento de memórias irrelevantes quanto no reforço das lembranças mais importantes. A hipótese investigada nesta tese é de que os mecanismos de reorganização sináptica envolvidos na consolidação de memórias podem trazer vantagens na performance das redes neurais artificiais. Este trabalho visa aplicar mecanismos neurobiológicos de aprendizagem dependente de sono na aprendizagem de máquina. Para isto, foi feita uma revisão das teorias de consolidação da memória através do sono, assim como dos modelos computacionais que dão suporte a essas teorias. Com a observação de como o cérebro otimiza os recursos biológicos, a pesquisa seguiu a tendência das redes neurais artificiais onde foram aplicados conceitos presentes na aprendizagem biológica, na aprendizagem de máquina. Então foram realizadas simulações de computador para explorar a hipótese de que os mecanismos subjacentes utilizados pelo cérebro para aprendizagem biológica através do sono são capazes de otimizar o aprendizado em redes neurais artificiais. A esparsialidade sináptica pode trazer vantagens na economia de recursos sem que haja um decaimento na aprendizagem, então, usamos uma rede neural artificial esparsa para aprender diferentes conjuntos de dados e, em seguida, testar se o sono poderia reduzir ainda mais o número mínimo de sinapses que um sistema precisa para o aprendizado de padrões. As simulações foram realizadas com diferentes tamanhos de rede, diferentes níveis de esparsialidades, diversas bases de dados além de utilizar modernos frameworks e algoritmos em aprendizagem de redes neurais profundas. Os resultados corroboram a hipótese de que o sono reduz o número necessário de sinapses para que se atinja um determinado limite de aprendizagem.Tese Uma plataforma de simulação de cenários evolutivos biológicos aplicada à teoria do fitness estendido(Universidade Federal do Rio Grande do Norte, 2021-11-24) Araújo, Guilherme Fernandes de; Moioli, Renan Cipriano; 30911587802; http://lattes.cnpq.br/8479967495464590; http://lattes.cnpq.br/7637841133437229; Fujita, André; http://lattes.cnpq.br/0247990329725342; Costa, Cesar Renno; http://lattes.cnpq.br/9222565820639401; Meyer, Diogo; http://lattes.cnpq.br/5443305901170965; Lima, João Paulo Matos Santos; http://lattes.cnpq.br/3289758851760692O impacto dos fenótipos estendidos na teoria da evolução contemporânea é controverso. A teoria do fenótipo estendido diz que a expressão dos genes pode ter efeitos além do corpo do indivíduo que os possuem, afetando resultados evolutivos de outros indivíduos que convivem com o mesmo. A teoria do fitness estendido propõe que indivíduos com similaridade genética o suficiente podem utilizar os fenótipos estendidos uns dos outros, assim aumentando as chances de sobrevivência e reprodução do grupo como um todo. Este trabalho tem como objetivo modelar estas interações através de redes aleatórias livres de escala, e investigar o impacto dos fenótipos estendidos e os seus efeitos no sucesso reprodutivo de indivíduos no contexto de grupos capazes de produzi-los e compartilhá-los. As vantagens conferidas pelo uso de fenótipos estendidos disponibilizados por vizinhos semelhantes pode conferir um incentivo evolucionário a nível de grupo para construí-los e compartilhá-los, e este equilíbrio é medido em diferentes simulações de modelos de comportamento.Tese Investigação de complexos proteína-ligante por métodos de bioquímica quântica e evolução molecular(Universidade Federal do Rio Grande do Norte, 2022-02-21) Barbosa, Emmanuel Duarte; Fulco, Umberto Laino; Machado, Leonardo Dantas; https://orcid.org/0000-0003-1221-4228; http://lattes.cnpq.br/9253069541351708; https://orcid.org/0000-0002-4528-9878; http://lattes.cnpq.br/9579151361576173; https://orcid.org/0000-0001-8786-1281; http://lattes.cnpq.br/3372240387916364; Lima, João Paulo Matos Santos; https://orcid.org/0000-0003-1221-4228; http://lattes.cnpq.br/9253069541351708; Albuquerque, Eudenilson Lins de; https://orcid.org/0000-0002-1022-1048; http://lattes.cnpq.br/3594651355252245; Ribeiro Júnior, Luiz Antonio; Freire, Valder NogueiraEsta tese apresenta três frentes de pesquisa realizadas na esfera da modelagem molecular baseadas em princípios da Mecânica Quântica. Adicionalmente, métodos de evolução mo- lecular complementaram alguns resultados. O primeiro estudo retrata o desempenho dos resultados de energia e de custo computacional de 9 combinações de modelos baseados em DFT (DFT – do inglês, Density Functional Theory) em um sistema organometálico formado pelo cátion de zinco divalente e a enzima Porfobilinogênio Sintase PBGS. As energias de interação foram obtidas empregando o esquema de Fragmentação com Capas Conjugadas (MFCC). Os resultados do perfil de energia de interação total apresentaram diferenças quantitativas lineares, mas demonstraram-se qualitativamente uniformes. A de- pendência do tempo de processamento computacional mostrou-se mais associada à escolha do conjunto de base do que o funcional de troca e correlação. O segundo estudo apresenta uma descrição bioquímica a partir dos resultados de energia de interação obtidos no es- tudo anterior, analisando o perfil bioquímico dos resíduos mais relevantes de PBGS que interagem com o zinco. Além disso, foi feita uma análise filogenética e de agrupamento que avalia a conservação dos aminoácidos relevantes identificados no sistema zinco-PBGS. As interações intermoleculares mais importantes se deram pela participação dos aminoá- cidos CIS0122, CIS0124, CIS0132, ASP0169, SER0168, ARG0221, HIS0131, ASP0120, GLY0133, VAL0121, ARG0209 e ARG0174. Dentre esses resíduos, ASP0120, GLI0133, HIS0131, SER0168 e ARG0209 destacaram-se por ocorrer em todos os grupos gerados pela análise de agrupamento não supervisionada. Por outro lado, as cisteínas triplas a 2,5 Å do zinco (CIS0122, CIS0124 e CIS0132) apresentaram a maior de energia atração nos cálculos quânticos são ausentes nos táxons Viridiplantae, Sar, Rhodophyta e em alguns grupos de Bacteria. Já o terceiro trabalho apresentado aqui investiga as interações entre a toxina Lys49-PLA2 da peçonha de Bothrops moojeni, a qual causa necrose tecidual em vítimas de acidentes ofídicos, e dois compostos (varespladib, aspirina) com potencial para inibir a atividade miotóxica dessas proteínas. A partir desse estudo, foi possível predizer a relevância dos aminoácidos que compõem o sítio de ligação da toxina Lys49-PLA2, dentre eles pode-se citar LIS0069, LIS0049, LEU0005, ILE0009, CIS0029, GLI0030, HIS0048, PRO0018, ALA0019, CIS0045, TIR0052, TIR0022, PRO0125* e FEN0126* que anco- ram varespladib e os resíduos LIS0069, LIS0049, GLI0032, LEU0002, e LEU0005 para o composto aspirina.Tese Medusa: um fluxo de trabalho para classificação taxonômica e anotação funcional de metagenomas(Universidade Federal do Rio Grande do Norte, 2022-04-14) Morais, Diego Arthur de Azevedo; Dalmolin, Rodrigo Juliani Siqueira; Dalmolin, Rodrigo Juliani Siqueira; https://orcid.org/0000-0002-1688-6155; http://lattes.cnpq.br/4065178015615979; https://orcid.org/0000-0002-7357-3446; http://lattes.cnpq.br/0627546477822130; Souza, Jorge Estefano de Santana; http://lattes.cnpq.br/8058577659019910; Lima, Lucymara Fassarella Agnez; https://orcid.org/0000-0003-0642-3162; http://lattes.cnpq.br/1083882171718362; Guizelini, Dieval; Moreira, Fabiano CordeiroA metagenômica envolve o estudo da comunidade microbiana encontrada numa amostra extraída de um determinado ambiente. Este ambiente pode ser a parede de uma caverna, uma porção de água do oceano, o intestino humano, ou qualquer fonte contendo micro-organismos de interesse. Tais estudos revelam detalhes sobre a composição taxonômica e as funções exercidas por comunidades microbianas. Como uma análise metagenômica completa requer diferentes ferramentas para diferentes propósitos, a escolha e instalação destas ferramentas representa um desafio. Além disto, o conjunto de ferramentas escolhido afeta a precisão, formatação, e os identificadores funcionais informados nos resultados, impactando a interpretação dos resultados e as respostas biológicas obtidas. O presente trabalho tem como objetivo propor um fluxo de trabalho a ser usado em análises taxonômicas e funcionais de metagenomas. Para isto, foram pesquisadas ferramentas do estado da arte disponíveis na literatura, e conjuntos de dados simulados foram criados para realizar comparações. Como resultado, ferramentas adequadas para cada etapa de análise foram selecionadas, e um fluxo de trabalho sensível e flexível para análises metagenômicas foi projetado. MEDUSA, um fluxo de trabalho eficiente para execução de análises metagenômicas completas, realiza pré-processamento, montagem, alinhamento, classificação taxonômica, e anotação funcional de dados shotgun, permitindo o uso de dicionários criados pelos usuários para transferir anotações para qualquer identificador funcional. MEDUSA inclui diversas ferramentas, tais como o Fastp, Bowtie2, DIAMOND, Kaiju, MEGAHIT, e uma nova ferramenta implementada em Python para transferir anotações para resultados de alinhamento BLAST/DIAMOND. Estas ferramentas são instaladas via Conda, e o fluxo de trabalho é gerenciado pelo Snakemake, facilitando a instalação e execução. Comparado com o MEGAN 6 Community Edition, MEDUSA identifica corretamente mais espécies, especialmente as menos abundantes, e é mais adequado para análises funcionais usando identificadores do Gene Ontology.Tese Uma nova assinatura de 13 genes via aprendizagem de máquina para predição de sobrevida de pacientes com carcinoma renal de células clara(Universidade Federal do Rio Grande do Norte, 2022-05-13) Terrematte, Patrick Cesar Alves; Doria Neto, Adrião Duarte; Ferreira, Beatriz Stransky; https://orcid.org/0000-0003-4506-393X; http://lattes.cnpq.br/3142264445097872; https://orcid.org/0000-0002-5445-7327; http://lattes.cnpq.br/1987295209521433; http://lattes.cnpq.br/4283045850342312; Leite, Cicilia Raquel Maia; Araújo, Daniel Sabino Amorim de; http://lattes.cnpq.br/4744754780165354; Assumpção, Paulo Pimentel de; Sakamoto, TetsuPacientes com câncer renal têm sobrevida de 12% em 5 anos em caso de metástase, segundo dados entre 2009 e 2015 da American Cancer Society. Neste sentido, é de suma importância identificar biomarcadores em dados genômicos para ajudar a prever o avanço do carcinoma renal de células claras (ccRCC), sendo este o subtipo mais frequente. Assim, realizamos um estudo com o objetivo de avaliar assinaturas gênicas e propor uma nova assinatura com maior poder preditivo. Usando coortes ccRCC do The Cancer Genome Atlas (TCGA-KIRC) e do International Cancer Genome Consortium (ICGC-RECA), avaliamos modelos de sobrevida usando regressão de Cox comparando 14 assinaturas da literatura e seis métodos de seleção de características, e também realizamos análise funcional e de expressão diferencial. Neste estudo, apresentamos uma assinatura de 13 genes (AR, AL353637.1, DPP6, FOXJ1, GNB3, HHLA2, IL4, LIMCH1, LINC01732, OTX1, SAA1, SEMA3G, ZIC2) cujos níveis de expressão são capazes de prever risco de pacientes com ccCRC. A assinatura genética de melhor desempenho foi alcançada usando o método de comitês de Mínima Redundância e Máxima Relevância (mRMR). Essa assinatura apresenta características únicas em relação às demais, como a generalização por diferentes coortes e o enriquecimento funcional em vias relacionadas à doenças: Doença Renal Crônica, Carcinoma de células de transição, e Nefrolitíase. Dos 13 genes em nossa assinatura, oito são conhecidos na literatura por estarem correlacionados com a sobrevida de pacientes com ccRCC. Nosso modelo mostrou um desempenho de 0,82 usando a métrica Receiver Operator Characteristic (ROC) Area Under Curve (AUC). Nossos resultados revelaram dois agrupamentos de genes com alta expressão (SAA1, OTX1, ZIC2, LINC01732, GNB3 e IL4) e baixa expressão (AL353637.1, AR, HHLA2, LIMCH1, SEMA3G, e DPP6), ambos correlacionados com prognóstico desfavoráveis. Esta assinatura pode potencialmente ser desenvolvida para auxiliar tratamentos na prática clínica.Tese Análise das alterações transcricionais sexo-específicas do transtorno depressivo maior(Universidade Federal do Rio Grande do Norte, 2022-07-08) Souza, Iara Dantas de; Dalmolin, Rodrigo Juliani Siqueira; https://orcid.org/0000-0002-1688-6155; http://lattes.cnpq.br/4065178015615979; https://orcid.org/0000-0002-2550-6150; http://lattes.cnpq.br/8983310940285796; Franco, Glória Regina; Souza, Gustavo Antônio de; http://lattes.cnpq.br/1012629455821774; Lima, João Paulo Matos Santos; https://orcid.org/0000-0002-6113-8834; http://lattes.cnpq.br/3289758851760692; Pasquali, Matheus Augusto de BittencourtO transtorno depressivo maior (TDM) é um importante distúrbio neuropsiquiátrico com grande prevalência no Brasil, sendo caracterizado por persistente humor deprimido e/ou perda de prazer por pelo menos duas semanas. O TDM é uma condição incapacitante e que predispõe a outras patologias complexas, como doenças cardiovasculares, podendo até resultar em suicídio. O TDM é mais prevalente em mulheres do que em homens e observa-se diferenças anatômicas, imunológicas, neuronais e hormonais, as quais refletem diferentes prognósticos e sintomatologias entre os sexos. No entanto, não há consenso quanto às alterações transcricionais do TDM em homens e mulheres, bem como as implicações funcionais destas alterações no metabolismo celular. A maior parte dos estudos transcricionais do TDM tenta explicar a fisiopatologia do TDM buscando por alterações da expressão global dos genes. Entretanto as alterações podem ocorrer também em nível de transcrito, de modo que o processamento alternativo de transcritos pode estar alterado. O presente trabalho busca investigar as alterações transcricionais do TDM em homens e mulheres por meio da análise de expressão diferencial de genes (DGE), a análise de expressão diferencial de transcritos (DTE) e a análise do uso diferencial de isoformas (DTU) em amostras post-mortem de seis regiões cerebrais. O conjunto dos genes identificados em pelo menos uma das três abordagens foi chamado de genes transcricionalmente alterados (TAGs), os quais representam o perfil de alteração transcricional ampla do TDM. Ao todo, 1075 TAGs foram identificados principalmente nas regiões de córtex pré-frontal. Ainda, aproximadamente metade das alterações transcricionais ocorreram apenas em nível de transcrito. Verificamos uma quase ausência de sobreposição entre os genes alterados identificados em homens e mulheres, indicando que o perfil das alterações transcricionais do TDM, em nível de expressão global de genes e de transcritos, é distinto entre os sexos. Verificamos alterações nas vias de processamento e exportação de RNA mensageiro no córtex orbitofrontal de mulheres, além da alteração da expressão do gene DDX39B, um constituinte da maquinaria de processamento de RNA, em diferentes regiões cerebrais de homens e mulheres, respectivamente. Além disso, mostramos que o gene ATAT1 encontra-se alterado em múltiplas regiões cerebrais de mulheres e o gene ABR encontra-se alterado em múltiplas regiões cerebrais de homens, constituindo potenciais marcadores moleculares sexo-específicos para o TDM. Assim, nosso trabalho mostra que a perturbação na expressão gênica observada no TDM ocorre em nível de expressão global de genes e de seus transcritos.Tese Caracterização computacional de RNAs não codificantes longos a nível unicelular associados com o desenvolvimento do tecido cardíaco e com doenças cardiovasculares(Universidade Federal do Rio Grande do Norte, 2022-08-02) Ramos, Thaís de Almeida Ratis; Coutinho, Vinicius Ramos Henriques Maracajá; Rego, Thais Gaudêncio do; http://lattes.cnpq.br/5684206147354858; https://orcid.org/0000-0002-6699-7742; http://lattes.cnpq.br/4296700516154626; Dalmolin, Rodrigo Juliani Siqueira; https://orcid.org/0000-0002-1688-6155; http://lattes.cnpq.br/4065178015615979; Araújo, Gilderlanio Santana de; Barbosa, Yuri de Almeida MalheirosOs RNAs longos não codificantes (lncRNAs) compreendem as unidades transcricionais mais representativas do genoma dos mamíferos e estão associados ao desenvolvimento de órgãos que podem estar associados ao surgimento de doenças, como as cardiovasculares. A Organização Mundial da Saúde (do inglês, World Health Organization (WHO)), por exemplo, publicou que as doenças cardiovasculares são responsáveis pela morte de 17,9 milhões de pessoas a cada ano, correspondendo a 31% de todas as mortes em todo o mundo. Neste trabalho, foi construída uma base de dados de referência de lncRNAs e transcritos codificantes: foi utilizado uma combinação dos lncRNAs das bases de dados Gencode (M20), Ensembl (GRCm38.95) e Amaral et al (2018) para definir o conjunto de lncRNAs de referência não redundantes, ou seja, lncRNAs que não possuíam sobreposição acima de 50%; ademais, para a base de dados de referência dos transcritos codificantes foi utilizada a base de dados Gencode (M20). Além disso, foram utilizadas abordagens de bioinformática (foi adaptado um pipeline de RNA-seq para análise de dados single-cell), algoritmos de aprendizado de máquina (Hierárquico, Silhueta, PCA e t-SNE) e técnicas estatísticas para definir lncRNAs envolvidos no desenvolvimento cardíaco de mamíferos. Para isso, foi utilizado a base dados de single-cell publicada por DeLaughter et al (2016), no qual havia dados de 4 estágios embrionários (E9.5, E11.5, E14.5, E18.5) e 4 estágios pós-natais (P0, P3, P7, P21) do organismo modelo mus musculus. Neste trabalho, identificamos 8 tipos celulares distintos e novos transcritos marcadores (codificantes e diferentes tipos de lncRNAs) com o auxílio da ferramenta M3Drop e de testes estatísticos (Qui-quadrado e teste de aderência). Além disso, a expressão diferencial e análise de enriquecimento funcional revelaram subpopulações de cardiomiócitos associadas à função cardíaca; enquanto isso, a análise de co-expressão modular revelou insights funcionais específicos de células para lncRNAs durante o desenvolvimento do miocárdio, incluindo uma potencial associação com genes-chave relacionados à doença e ao “programa de genes fetais”. Nossos resultados evidenciam o papel de lncRNAs particulares no desenvolvimento do coração e destacam o uso de abordagens modulares de co-expressão na definição funcional do tipo de célula. Como trabalho futuro, pretende-se identificar os papéis funcionais desses RNAs no desenvolvimento de tecidos cardíacos e em doenças cardiovasculares, utilizando abordagens de validação experimental.Tese Desenvolvimento de abordagem computacional para análise e identificação de peptídeos polimórficos(Universidade Federal do Rio Grande do Norte, 2022-11-29) Cunha, Lucas Marques da; Souza, Gustavo Antônio de; Medeiros, Silvia Regina Batistuzzo de; https://orcid.org/0000-0003-2431-0479; http://lattes.cnpq.br/5882662534904226; http://lattes.cnpq.br/1012629455821774; https://orcid.org/0000-0003-1555-2505; http://lattes.cnpq.br/6545545471833974; Passetti, Fábio; Uchoa, Adriana Ferreira; Lanza, Daniel Carlos Ferreira; Carvalho, Paulo CostaA abordagem proteômica permite estudos em larga escala da expressão proteica em diferentes tecidos e fluidos corporais, tendo como objetivo identificar e quantificar o conteúdo proteico total. No processo de análise proteômica, a identificação de proteínas ainda apresenta lacunas, apesar dos grandes avanços na área. Frequentemente, um espectrômetro de massa é utilizado para gerar valores de massa/carga das amostras. Após esse processo, geralmente utiliza-se um banco de dados de proteínas referência (por exemplo, UniProt) para identificação das proteínas. Porém, utilizar uma base de referência limita as análises de identificação das proteínas, uma vez que não contém as variações que ocorrem no DNA, que podem impactar na sequência de aminoácidos, ocasionando identificação incorreta ou impossibilitando o processo. Nesse contexto, existem diversas bases de dados personalizadas que incorporam tais variações genéticas. Embora apresentem bons resultados, também se limitam devido à ausência de algumas mutações, tornando-se outro problema no processo de identificação. Portanto, essa pesquisa tem como objetivo construir m banco de dados de proteogenômica (dbPepVar) combinando informações de variação genética do dbSNP com sequências de proteínas do RefSeq do NCBI. Conjuntos de dados públicos de espectrometria de massa foram usados para realizar uma análise pan-câncer (Ovário, Colorretal, Mama e Próstata), permitindo a identificação de variações genéticas únicas. No total, 3.726 peptídeos variantes foram identificados em amostras de câncer de ovário, 2.543 em próstata, 2.661 em mama e 2.411 em câncer de cólon-retal. Uma análise de frequência mutacional mostrou genes envolvidos nos processos de progressão tumoral, sensibilidade à quimioterapia e risco de suscetibilidade ao câncer. Curiosamente, em muitas amostras, foram identificados peptídeos C-terminais de proteínas encurtadas originárias de eventos de códon de terminação prematura (PTC). Isso indica que tais proteínas escaparam do decaimento mediado por mutações Nonsense (NMD) e, não surpreendentemente, os genes da maquinaria NMD também estão mutados nas mesmas amostras. Isso sugere que o vestígio do transcrito truncado pode estar associado à ineficiência da maquinaria NMD causada por mutações genéticas. Em perspectiva, o portal web desenvolvido bem como as análises realizadas podem direcionar estudos para identificar novos alvos terapêuticos para diferentes tipos de câncer, podendo-se também utilizar nosso banco de dados para caracterização de variantes em amostras de antecedentes genéticos desconhecidos, como amostras arquivadas. O portal está disponível em: https://bioinfo.imd.ufrn.br/dbPepVar/.