Programa de Pós-Graduação em Bioinformática - IMD
URI Permanente desta comunidadehttps://repositorio.ufrn.br/handle/123456789/24561
Navegar
Navegando Programa de Pós-Graduação em Bioinformática - IMD por Título
Agora exibindo 1 - 20 de 83
- Resultados por página
- Opções de Ordenação
Tese 3D-QSARpy: Combinando estratégias de seleção de atributos e técnicas de aprendizado de máquina para construir modelos QSAR 3D(Universidade Federal do Rio Grande do Norte, 2021-08-04) Silverio, Priscilla Suene de Santana Nogueira; Barbosa, Euzébio Guimarães; http://lattes.cnpq.br/3197108792266393; http://lattes.cnpq.br/4408967829407525; Oliveira, Amanda Gondim de; http://lattes.cnpq.br/3619642245221227; Canuto, Anne Magaly de Paula; http://lattes.cnpq.br/1357887401899097; Santos, Araken de Medeiros; http://lattes.cnpq.br/8059198436766378; Lima, João Paulo Matos Santos; http://lattes.cnpq.br/3289758851760692; Oliveira, Laura Emmanuella Alves dds Santos Santana deQuantitative Structure Activity Relationship (QSAR) é uma tecnologia da área da química medicinal que busca esclarecer as relações existentes entre estruturas moleculares e suas respectivas atividades biológicas. Para isso, são construídos modelos QSAR a partir dos dados estruturais (1D, 2D, 3D ou 4D) provenientes de uma série de moléculas já testadas para uma determinada atividade. Através de predições realizadas por esses modelos, objetiva-se identificar quais modificações na molécula podem influenciar, reforçando ou não a resposta biológica. Tal tecnologia permite acelerar o desenvolvimento de novos compostos, reduzindo os custos destinados ao planejamento de fármacos. Considerando o contexto brevemente exposto, o presente trabalho apresenta como objetivo geral desenvolver uma metodologia para predição de atividade biológica em moléculas bioativas. A metodologia foi validada com sucesso através da aplicação da ferramenta em dois conjuntos de dados com resultados superiores aos previamente publicados. O primeiro deles envolvendo o tratamento de diabetes, alcançando r2 pred = 0.91. O segundo conjunto referente ao tratamento de câncer, com r2 pred=0.98. Por fim, duas aplicações da ferramenta foram realizadas, contribuindo com a identificação de novas estruturas moleculares bioativas usando diferentes abordagens. Sendo a primeira delas destinada ao tratamento da doença de chagas, incluindo a construção de modelos QSAR híbridos para três séries, obtendo, r2 pred=0.8, 0.68 e 0.85. A segunda aplicação para construção de modelos QSAR-4D foi destinada ao tratamento da tuberculose com r2 pred=0.72. Todos os experimentos realizados, sejam para validação ou para identificação dessas novas moléculas demonstraram, não somente a eficiência da metodologia proposta e da ferramenta desenvolvida, como também a versatilidade de aplicações possíveis por meio dela, seja seguindo o seu pipeline geral, seja utilizando-o parcialmente de modo combinado com outras ferramentas existentes.Dissertação Abordagens da biologia de sistemas na investigação dos pontos de articulação nas rotas metabólicas do KEGG(Universidade Federal do Rio Grande do Norte, 2020-08-14) Brandão, Igor Augusto; Dalmolin, Rodrigo Juliani Siqueira; ; ; Costa, Cesar Renno; ; Albanus, Ricardo D'Oliveira;O estudo da essencialidade das proteínas por meio de métodos laboratoriais é caro e não escalável para grandes quantidades de proteínas, desta forma é relevante avaliar a essencialidade das várias proteínas de uma via metabólica como um todo através de ferramentas computacionais. Em geral, uma via metabólica pode ser analisada como grafos, os quais fornecem diferentes recursos para o estudo das características topológicas de redes, como os seus pontos de articulação e disposição dos nós. Atualmente, pesquisas em bioinformática estudam a essencialidade de proteínas com base nas métricas de betweenness e degree, contudo a teoria dos grafos sugere que os pontos de articulação podem ser nós importante em uma rede resta avaliar se esses pontos de articulação são de fato essenciais para as vias metabólicas e seu impacto topológico na rede. Utilizando análises baseadas em métricas de rede, o nosso objetivo é verificar se de fato esses pontos de articulação representam gargalos na rede, sendo estes caracterizados como proteínas de frequências elevadas e localizadas no centro das redes. Para tanto, identificamos os pontos de articulação em diferentes vias metabólicas do KEGG, avaliamos o impacto de cada um deles, calculamos sua frequência e comparamos suas ocorrências com as demais proteínas. Inicialmente, fizemos o levantamento das vias metabólicas do KEGG que estavam disponíveis através dos arquivos KGML associados às redes. Após a listagem das vias disponíveis, os dados estruturais de cada uma delas foram convertidos em objetos do tipo grafo. Os parâmetros ponto de articulação, betweenness e degree foram utilizados para classificar as proteínas constantes em cada via metabólica. Aproximadamente 20% das proteínas foram classificadas como pontos de articulação, das quais 3,75% foram identificadas pela alta frequência e localização em regiões centrais da rede. Além disso, a maior concentração dos pontos de articulação ocorreu na faixa de frequência dos 80 a 90%. Um padrão de não aleatoriedade na distribuição dos pontos de articulação foi identificado nos grupos com frequências acima de 74,5%. Finalmente, a biossíntese de esteroides foi a via metabólica com o maior número de pontos de articulação com frequências superiores a 80% em sua constituição. A oxidoredutase foi a classe dos pontos de articulação presente no maior número de vias metabólicas. As descobertas sugerem que os gargalos das redes avaliadas são pontos de articulação com as frequências mais altas e localizados no centro da rede. Resta realizar análises mais aprofundadas a respeito dos papéis biológicos destes pontos de articulação encontradosTese Abordagens de Bioinformática aplicadas na análise de dados gerados por estresse abiótico em cana-de-açúcar: microgravidade e peróxido de hidrogênio(Universidade Federal do Rio Grande do Norte, 2024-03-07) Silva, Lucas Felipe da; Scortecci, Katia Castanho; https://orcid.org/0000-0002-4690-2785; http://lattes.cnpq.br/4808910380593455; http://lattes.cnpq.br/3918864615139279; Ferreira, Beatriz Stransky; https://orcid.org/0000-0003-4506-393X; http://lattes.cnpq.br/3142264445097872; Uchoa, Adriana Ferreira; Alvim, Fátima Cerqueira; Calsa Júnior, TercilioA cana-de-açúcar (Saccharum spp.) é uma planta monocotiledônea C4 adaptada a ambientes tropicais e subtropicais pertencente à família Poaceae. O Brasil destaca-se como o maior produtor mundial dessa cultura, desempenhando um papel fundamental na indústria global da cana-de-açúcar. Plantas, incluindo a cana-de-açúcar, são suscetíveis a uma variedade de fatores bióticos e abióticos que induzem ao estresse oxidativo. Esse estresse resulta de um desequilíbrio na homeostase entre a produção e degradação de Espécies Reativas de Oxigênio (EROs), cenário que pode afetar adversamente o desenvolvimento das plantas. Entre essas EROs, o peróxido de hidrogênio (H2O2 ) atua como uma molécula sinalizadora-chave, respondendo a vários estímulos celulares em sistemas de plantas. O principal objetivo deste estudo foi identificar, nas raízes e folhas da cana-de-açúcar, os transcritos e os genes que podem atuar em resposta ao estresse oxidativo induzido pela microgravidade e H2O2 em diferentes concentrações, correlacionando as respostas dos diferentes agentes estressores, assim como suas semelhanças, adaptações específicas e tolerância ao estresse oxidativo. Este trabalho foi realizado utilizando análises de bioinformática, com isso, esta tese foi estruturada em dois capítulos distintos. O primeiro capítulo utiliza ferramentas de bioinformática para investigar os efeitos dos campos gravitacionais alterados como agente estressor nas plantas de cana-de-açúcar, com foco específico na resposta ao estresse oxidativo. Essa investigação foi baseada na análise de dados de sequenciamento de RNA mensageiro. O segundo capítulo aborda a análise dos genes e proteínas expressas pela indução do estresse oxidativo por meio da aplicação exógena de concentrações variadas de H2O2 (0 mM, 10 mM, 20 mM e 30 mM) ao longo de um período de 8 horas, em uma faixa de temperatura controlada de 25-27 °C em plantas de cana-de-açúcar. Considerando que o H2O2 é uma molécula sinalizadora do estresse oxidativo. Essa investigação foi baseada na análise de dados obtidos com uma abordagem proteômica. Em ambas as abordagens metodológicas descritas nos capítulos, as espécies Sorghum bicolor, Zea mays e Oryza sativa subsp. japonica foram utilizadas como modelos de referência. Os resultados da análise de bioinformática identificaram genes específicos que atuam na resposta à microgravidade como o C5WVD4 associados à síntese de isoleucina e o C5YLK6 na produção de NADPH. Além disso, foram identificados genes com expressão alterada em diferentes concentrações de H2O2. Por exemplo, C5XFH6 e B4G143, relacionados ao fornecimento de NADPH e à regulação positiva de EROs na fotossíntese, respectivamente, estavam entre os genes com mudanças de expressão significativas. Além disso, o estudo identificou vias metabólicas enriquecidas em resposta à microgravidade e H2O2. Essas vias incluem o Metabolismo de compostos de selênio, fotossíntese - proteínas de antena e a via da pentose fosfato, destacando adaptações bioquímicas significativas na cana-de-açúcar nas condições estudadas. Este estudo multidisciplinar, que abrangeu histologia, bioquímica, análise de RNA-seq e proteômica, proporcionou uma compreensão dos efeitos da microgravidade e H2O2 nas plantas de cana-de-açúcar. Destaca mudanças interessantes na organização estrutural dos tecidos, acúmulo de lignina e nos níveis de H2O2 e EROs. Consequentemente, esta pesquisa foi fundamental para identificar genes/proteínas distintos expressos de maneira única em cada tecido e as vias metabólicas ativadas nas raízes e folhas. Observa-se respostas variadas das plantas de cana-de-açúcar às condições de gravidade alterada durante o voo do foguete de sondagem VSB-30 e à exposição a diferentes concentrações de H2O2. O estudo revela uma rede complexa de genes e vias metabólicas ativadas em resposta ao estresse oxidativo, desempenhando assim um papel fundamental no desencadeamento de mecanismos de defesa e tolerância. Os dados gerados melhoram significativamente nossa compreensão das respostas das plantas às condições adversas analisadas, destacando estratégias adaptativas específicas empregadas. Além disso, os resultados obtidos ressaltam o papel importante do H2O2 nas respostas adaptativas e de sobrevivência, assim como a versatilidade do fitormônio ácido abscísico (ABA) na mediação da sinalização entre raízes e folhas. Essas percepções são inestimáveis para o desenvolvimento de estratégias de melhoramento genético e otimização de práticas de cultivo para aprimorar o desempenho da planta em condições ambientais variáveis.Tese Advanced convolutional neural network techniques for classification of SARS-CoV-2 variants and other viruses: a study using k-mers and chaos game representation(Universidade Federal do Rio Grande do Norte, 2024-09-05) Câmara, Gabriel Bezerra Motta; Fernandes, Marcelo Augusto Costa; https://orcid.org/0000-0001-7536-2506; http://lattes.cnpq.br/3475337353676349; https://orcid.org/0000-0002-5736-0782; http://lattes.cnpq.br/3849103334728892; Silva, Ivanovitch Medeiros Dantas da; Terrematte, Patrick César Alves; Campos, Túlio de Lima; Barreto, Guilherme de AlencarDesde Dezembro de 2019, o impacto global da pandemia da Covid-19, causada pelo vírus SARS-CoV-2, tem sido profundo. A identificação precoce da classificação taxonômica e da origem genômica do vírus é fundamental para o planeamento estratégico, contenção e tratamento. As técnicas de aprendizagem profunda provaram ser bem-sucedidas na abordagem de vários desafios de classificação viral, incluindo diagnóstico, metagenômica, filogenética e análise genômica. Motivado por esses avanços, este estudo apresenta um classificador de genoma viral eficaz para SARS-CoV-2, utilizando uma estrutura de rede neural convolucional (CNN). Esta pesquisa empregou representações de imagem de sequências genômicas completas para treinar a CNN, alavancando dois conjuntos de dados distintos: um baseado na representação de imagem k-mers e o outro na Representação do Jogo do Caos (CGR). O conjunto de dados k-mers foi usado para experimentos de classificação taxonômica do vírus SARS-CoV-2, enquanto o conjunto de dados CGR focou na classificação de variantes de preocupação (VOCs) e variantes de interesse (VOIs) do SARS-CoV-2. A CNN obteve desempenho notável na classificação taxonômica usando k-mers, com taxas de precisão de cerca de 92% no conjunto de validação e igual a 100% no conjunto de teste contendo amostras de SARS-CoV-2. Esses resultados demonstram a adaptabilidade do modelo para classificar outros vírus emergentes. Para a classificação de variantes do SARS-CoV-2 usando imagens CGR, a CNN apresentou precisão ainda maior, atingindo 99,9% no conjunto de validação e 99,8% no conjunto de teste. As descobertas sublinham a aplicabilidade de técnicas de aprendizagem profunda em tarefas de classificação de genomas, fornecendo uma ferramenta robusta para a detecção precoce e classificação de ameaças virais. A integração de CNNs com representações de imagens k-mers e CGR apresenta um método novo e eficaz para análise do genoma viral, apoiando esforços contínuos em virologia e saúde pública.Dissertação Alport autossômica: um estudo de duas famílias norte-rio-grandenses(2019-12-19) Falcão, Raul Maia; Souza, Jorge Estefano Santana de; ; ; Jerônimo, Selma Maria Bezerra; ; Balbino, Valdir;Síndrome de Alport (SA) é uma patologia geneticamente rara, heterogênea e hereditária associada a mutações germinativas nos genes de colágeno tipo IV (COL4A3, COL4A4 e COL4A5). Caracterizada por provocar perda progressiva das funções renais, auditiva e lesões oculares durante a primeira infância, o progresso da doença evolui para uma doença renal terminal frequentemente associada à falência renal. Estudos que visam diagnosticar precocemente indivíduos com essa nefropatia pode levar ao tratamento adequado e, portanto, melhorar a expectativa de vida. Atualmente tem surgido esforços, focados no genoma dos pacientes, para a criação de testes de diagnósticos de doenças/síndromes raras. Sob esse olhar, conhecer mutações, genes e vias metabólicas envolvidas com a patologia é crucial para o entendimento da complexidade dessas doenças. Pensando em corroborar com os achados e estudos a respeito da SA foi realizado o sequenciamento do exoma de duas famílias do Rio Grande do Norte (RN), ambas compostas por quatro indivíduos. Através dos softwares GATK e VARSCAN2 foi realizada a chamada de variantes seguida de uma varredura por variantes deletérias identificadas por um script in house. Os resultados apontaram duas variantes deletérias inéditas nos genes que formam as cadeias α3 e α4 do colágeno tipo IV (um stop codon no COL4A3 e frameshift em COL4A4) levando a um truncamento prematuro da proteína. Ambas variantes foram detectadas em estado de homozigose nos probandos e em heterozigose nos demais membros da família. Adicionalmente foi detectado uma ampla região de Runs of Homozigosity (ROH) envolvendo os genes COL4A3 e COL4A4 em ambos os probandos das duas famílias. De acordo com os achados das variantes deletérias nos genes COL4A3 e COL4A4 em regiões de ROH, essas variantes passam a estar relacionadas a SA de forma que observações semelhantes possam servir como suporte para possíveis alvos na criação de novos testes de diagnóstico e para o serviço de Aconselhamento Genético.Tese Análise baseada em biologia de sistemas de dados transcricionais de células progenitoras neurais humanas tratadas com chumbo(2019-11-01) Reis, Clóvis Ferreira dos; Dalmolin, Rodrigo Juliani Siqueira; Almeida, Rita Maria Cunha de; ; ; ; Ferreira, Beatriz Stransky; ; Bonatto, Diego; ; Pasquali, Matheus Augusto de Bittencourt; ; Amaral, Viviane Souza do;As consequências do envenenamento por chumbo são diversas e importantes na saúde humana uma vez que este metal pesado pode interagir com muitos sistemas orgânicos, afetando principalmente o sistema nervoso, com implicações graves e irreversíveis do neurodesenvolvimento, consolidação de memória e processos de aprendizagem em crianças. Sua interação com componentes celulares dá-se de muitas formas, afetando proteínas de ligação a íons, proteínas de sinalização de transdução, canais iônicos transmembrana e fatores de transcrição. Apesar da sintomatologia da intoxicação por chumbo já ser bastante conhecida, pouco ainda se sabe sobre seus efeitos sistêmicos e sobre o seu impacto global na modulação da transcrição de células neuronais. A fim de investigar tais efeitos sob uma ótica de biologia de sistemas, aplicamos o pipeline do pacote transcriptogramer R/Bioconductor com a finalidade de avaliar o perfil transcricional de células progenitoras neurais humanas (NPCs) tratadas com acetato de chumbo 30µM por 26 dias. Dotado de um método não supervisionado, o algoritmo do transcriptogramer é projetado para identificar, em experimentos do tipo caso-controle, grupos de genes funcionalmente associados e diferencialmente expressos. Tal pipeline foi capaz de identificar onze clusteres diferencialmente expressos entre os dias 3 e 11 do tratamento com chumbo. Destes, sete apresentaram uma regulação negativa de diversos sistemas celulares envolvidos na diferenciação celular, como organização do citoesqueleto, RNA e biossíntese de proteínas, caracterizados por redes grandes e fortemente conectadas. Os quatro clusteres positivamente regulados apresentaram nós esparsos e pouco conectados, principalmente relacionados a transcrição, transporte transmembrana e transdução de sinal. Já no período subsequente, envolvendo os dias 12 a 26 de tratamento, foi possível observar uma alteração maciça do perfil de transcrição celular com interferência em todas as camadas da regulação da expressão gênica. Desta forma, nossos resultados sugerem que o chumbo induz modificações transcricionais significativas nas NPCs que podem ser correlacionadas a danos e/ou adaptações de diversos sistemas, todos decorrentes da intoxicação por este metal pesado, influenciando, assim, o resultado final da diferenciação das células ES-NP.Dissertação Análise baseada em biologia de sistemas destaca processos alterados que afetam a sobrevida geral de pacientes com sarcoma de Ewing(Universidade Federal do Rio Grande do Norte, 2022-04-06) Dalmolin, Matheus Gibeke Siqueira; Sinigaglia, Marialva; http://lattes.cnpq.br/5450809564180533; https://orcid.org/0000-0002-5400-0909; http://lattes.cnpq.br/6696965491888991; Almeida, Rita Maria Cunha de; Gregianin, Lauro JoséO Sarcoma de Ewing (SE) é uma doença altamente agressiva e a segunda neoplasia óssea pediátrica mais frequente. A marca registrada do SE é a presença do fator de transcrição aberrante EWSR1-FLI que impulsiona a reprogramação metabólica. Os procedimentos terapêuticos aumentaram parcialmente a sobrevida do SE, mas ainda apresentam alta toxicidade e causam morbidade significativa. Para sugerir estratégias terapêuticas mais eficientes, é necessário um entendimento mais abrangente das vias que impactam a sobrevivência do SE para o desenvolvimento de novos diagnósticos e estratégias terapêuticas. Aqui, identificamos diferenças no nível de transição entre pacientes com SE com sobreviventes de curto prazo (SCP) e sobreviventes de longo prazo (SLP) com base em dados transcricionais disponíveis em três conjuntos de dados públicos, aplicando a análise do transcriptograma. Três agrupamentos comuns diferencialmente expressos nas coortes analisadas foram identificados. Processos relacionados à resposta e reparo ao dano do DNA, resposta imune, apoptose e autofagia foram desregulados entre os grupos SCP e SLP. Além disso, o enriquecimento funcional dos genes comuns entre três clusters e regulons ES destacam o upregulation da via Hippo em pacientes SCP. Nossa análise sugere que diferentes processos podem estar orientando o desfecho de pacientes com SE de forma integrada e podem contribuir para a diversidade de fenótipos impulsionados pela flutuação da expressão de EWSR1-FLI1.Tese Análise das alterações transcricionais sexo-específicas do transtorno depressivo maior(Universidade Federal do Rio Grande do Norte, 2022-07-08) Souza, Iara Dantas de; Dalmolin, Rodrigo Juliani Siqueira; https://orcid.org/0000-0002-1688-6155; http://lattes.cnpq.br/4065178015615979; https://orcid.org/0000-0002-2550-6150; http://lattes.cnpq.br/8983310940285796; Franco, Glória Regina; Souza, Gustavo Antônio de; http://lattes.cnpq.br/1012629455821774; Lima, João Paulo Matos Santos; https://orcid.org/0000-0002-6113-8834; http://lattes.cnpq.br/3289758851760692; Pasquali, Matheus Augusto de BittencourtO transtorno depressivo maior (TDM) é um importante distúrbio neuropsiquiátrico com grande prevalência no Brasil, sendo caracterizado por persistente humor deprimido e/ou perda de prazer por pelo menos duas semanas. O TDM é uma condição incapacitante e que predispõe a outras patologias complexas, como doenças cardiovasculares, podendo até resultar em suicídio. O TDM é mais prevalente em mulheres do que em homens e observa-se diferenças anatômicas, imunológicas, neuronais e hormonais, as quais refletem diferentes prognósticos e sintomatologias entre os sexos. No entanto, não há consenso quanto às alterações transcricionais do TDM em homens e mulheres, bem como as implicações funcionais destas alterações no metabolismo celular. A maior parte dos estudos transcricionais do TDM tenta explicar a fisiopatologia do TDM buscando por alterações da expressão global dos genes. Entretanto as alterações podem ocorrer também em nível de transcrito, de modo que o processamento alternativo de transcritos pode estar alterado. O presente trabalho busca investigar as alterações transcricionais do TDM em homens e mulheres por meio da análise de expressão diferencial de genes (DGE), a análise de expressão diferencial de transcritos (DTE) e a análise do uso diferencial de isoformas (DTU) em amostras post-mortem de seis regiões cerebrais. O conjunto dos genes identificados em pelo menos uma das três abordagens foi chamado de genes transcricionalmente alterados (TAGs), os quais representam o perfil de alteração transcricional ampla do TDM. Ao todo, 1075 TAGs foram identificados principalmente nas regiões de córtex pré-frontal. Ainda, aproximadamente metade das alterações transcricionais ocorreram apenas em nível de transcrito. Verificamos uma quase ausência de sobreposição entre os genes alterados identificados em homens e mulheres, indicando que o perfil das alterações transcricionais do TDM, em nível de expressão global de genes e de transcritos, é distinto entre os sexos. Verificamos alterações nas vias de processamento e exportação de RNA mensageiro no córtex orbitofrontal de mulheres, além da alteração da expressão do gene DDX39B, um constituinte da maquinaria de processamento de RNA, em diferentes regiões cerebrais de homens e mulheres, respectivamente. Além disso, mostramos que o gene ATAT1 encontra-se alterado em múltiplas regiões cerebrais de mulheres e o gene ABR encontra-se alterado em múltiplas regiões cerebrais de homens, constituindo potenciais marcadores moleculares sexo-específicos para o TDM. Assim, nosso trabalho mostra que a perturbação na expressão gênica observada no TDM ocorre em nível de expressão global de genes e de seus transcritos.Dissertação Análise do alvo predito da plumieridina em Cryptococcus neoformans(Universidade Federal do Rio Grande do Norte, 2020-02-28) Souza, Eden Silva e; Vainstein, Marilene Henning; Lima, João Paulo Matos Santos; ; ; ; Barbosa, Euzébio Guimarães; ; Souza, Gustavo Antonio de; ; Staats, Charley Christian;Criptococose é uma infecção fúngica causada por leveduras de Cryptococcus spp. A infecção inicia-se quando células dessecadas ou esporos são inalados e chegam aos pulmões. Se a doença não for propriamente tratada, a infecção pode evoluir, atingir o sistema nervoso central e resultar em meningite meningocócica e até em óbito. O tratamento da criptococose é realizado em três estágios e faz uso de três drogas: fluconazol, anfotericina B e 5-flucitosina. Embora eficaz, o uso destas drogas pode resultar no surgimento de resistência fúngica, efeito tóxico para os pacientes e fármacos com a flucitosina não são comerciados em todos os países. Desta forma, propõe-se investigar o modo de ação do composto antifúngico plumieridina bem como a identificação do seu alvo molecular em C. neoformans. Para isso, realizou-se uma série de experimentos in vitro e in silico. Inicialmente, frações cromatográficas do extrato aquoso das sementes de Allamanda polyantha foram submetidas a ensaios de atividade antimicrobiana. Submeteu-se a fração com atividade antifúngica a análise de ressonância magnética nuclear de carbono e hidrogênio afim de se identificar compostos presentes na amostra. Atividade antifúngica, avaliada através de ensaios antifúngicos, foi de 0.250 mg/mL e o componente majoritário na fração foi a plumieridina. Através da triagem virtual baseada na similaridade do ligante, quitinase foi identificada como alvo molecular da plumieridina. Modelos tridimensionais das quitinases de C. neoformans foram criados e, através do atracamento molecular, observou-se a interação com resíduos do sítio ativo. Ensaios de inibição da atividade quitinolítica mostraram que a atividade é significativamente reduzida na fração secretada e fração celular solúvel. No entanto, a atividade quitinolítica é pouco reduzida pela presença de plumieridina na fração celular insolúvel, onde são necessárias maiores concentrações do composto. Embora plumieridina seja capaz de inibir a atividade quitinolítica, o composto não parece estar relacionado aos níveis transcricionais das quitinases de C. neoformans, reduzindo apenas os níveis transcricionais do gene CHI22. Observou-se que extratos contendo quitinases de macrófagos de camundongo, Bacillus subitilis e de Tenebrio molitor também são inibidos na presença de plumieridina. O tratamento com plumieridina ainda altera o padrão de distribuição dos quitooligômeros na parece celular: de um padrão polarizado para um padrão difuso pela parede. Os resultados validam a predição da triagem virtual e mostram que a inibição da atividade quitinolítica pela plumieridina resulta em divisão celular incompleta e, consequente, atividade antifúngica. Finalmente, os resultados indicam que a plumieridina inibe quitinase e cause morte de C. neoformans, entrentanto, a inibição também ocorre em outros membros da família GH18, indicando que este é um potencial inibidor de GH18.Dissertação Análise energética in silico da interação do ER? com estrogênios relacionados a neoplasma mamária: estradiol e dietilestilbestrol(2018-08-10) Costa, Aranthya Hevelly de Lima; ; ; Dalmolin, Rodrigo Juliani Siqueira; ; Freire, Valder Nogueira;O câncer de mama é uma doença hormônio-dependente, que possui vários subtipos diferentes, padrões de expressão de genes e manifestações distintos (CHENG et al., 2002). Segundo o Instituto Nacional de Câncer (INCA), nas mulheres, apresenta a maior incidência e mortalidade, tanto em países em desenvolvimento quanto em países desenvolvidos. A maioria das neoplasias mamárias são ER + (receptor de estrogênio positivo), isto é, dependentes de 17β-estradiol e o número de ERα (receptor de estrogênio subtipo alfa) é superior ao número de ERβ (receptor de estrogênio subtipo beta), evidenciando a importância do subtipo alfa nesta doença. Este trabalho mensurou as energias de ligação individual dos resíduos que compõem o ERα com o 17β-estradiol e Dietilestilbestrol, utilizando a simulação computacional. Para tanto, foi empregado a Teoria do Funcional Densidade (DFT) e o Método de Fracionamento Molecular com Caps Conjugados (MFCC). Os resultados obtidos constataram que os resíduos com os valores energéticos mais significativos são: GLU353, LEU391, MET343, LEU346, MET388, ARG394, PHE404, HIS524, ASP411, LEU525, ARG352 e ARG548. Estes resultados ajudam a caracterizar a interação entre o 17β-estradiol e o Dietilestilbestrol com o ERα e, por sua vez, podem ser utilizados como base para estudos, planejamento estrutural do fármaco, modulação dos fármacos existentes, tal como para o design de novas drogas.Dissertação Análise exploratória do Transcriptoma do Arapaima gigas(Universidade Federal do Rio Grande do Norte, 2020-09-29) Martins, Danilo Lopes; Souza, Jorge Estefano Santana de; ; ; http://lattes.cnpq.br/6248158300785155; Dalmolin, Rodrigo Juliani Siqueira; ; Santos, Sidney Emanuel Batista dos;O Arapaima gigas, conhecido como pirarucu, é considerado um dos maiores peixes de água doce do mundo, com um notável interesse no mercado da aquicultura devido às suas características biológicas particulares, incluindo o seu rápido crescimento nos seus primeiros anos de vida. Nos últimos anos, apesar da disponibilização massiva de dados advindos de projetos de sequenciamento, poucos foram os que abordaram o táxon que inclui essa espécie. O presente estudo foi desenvolvido com a finalidade de caracterizar o transcriptoma dessa espécie, através de uma análise exploratória transcricional e dos padrões de expressão gênica relacionados a perfis genes tecido-específicos, além de evidenciar genes sexo-específicos. Por meio do sequenciamento do cDNA de 12 amostras de tecidos diferentes do pirarucu, montou-se um transcriptoma de referência com a estratégia de montagem guiada pelo genoma referência. Foram analisados os padrões de expressão gênica para os diferentes tecidos de macho e fêmea de espécimes adultos. Pipelines como STAR, SortMeRNA, Braker2, Diamond e mygene para a montagem e anotação gênica foram utilizados, assim como as ferramentas clusterProfiler e KEGG para análise de enriquecimento funcional dos genes e o animalTFDB para identificação de fatores de transcrição. Neste estudo evidenciamos um conjunto de produtos gênicos anotados que servem como potenciais candidatos a produtos biotecnológicos, por estarem envolvidos nos fenótipos individuais dos tecidos, processos de dimorfismo sexual, e na regulação de processos que podem explicar suas características morfológicas únicas. Esse estudo também podem auxiliar substancialmente na condução de análises posteriores.Dissertação Análise filogenética dos genes do Locus rfb do gênero Leptospira dos sorogrupos Sejroe, Mini e Hebdomadis(Universidade Federal do Rio Grande do Norte, 2023-09-29) Setúbal, Ruth Flávia Barros; Souza, Jorge Estefano de Santana; Sakamoto, Tetsu; https://orcid.org/0000-0003-3023-0117; http://lattes.cnpq.br/1342530085695810; https://orcid.org/0000-0003-2347-042X; http://lattes.cnpq.br/8058577659019910; http://lattes.cnpq.br/7173797748516446; Cosate, Maria Raquel VenturimA leptospirose é uma zoonose de grande impacto na saúde pública, pois é considerada uma doença de notificação compulsória ocorrendo principalmente em regiões tropicais com saneamento básico precário e condição socioeconômica vulnerável. Ela é causada por bactérias do gênero Leptospira e filo Spirochaetes e a contaminação se dá através do contato direto ou indireto com o agente contaminante. Além da classificação taxonômica, que é realizada através do sequenciamento e a análise de alguns genes marcadores, como o 16S rRNA e o secY, elas são habitualmente classificadas com base nas suas características antigênicas em sorogrupos e sorovares. Este tipo de classificação é intensamente aplicado nos estudos epidemiológicos e de desenvolvimento de vacinas. Apesar da sua importância, poucos estudos foram realizados para entender a dinâmica evolutiva do surgimento ou a mudança de sorologia neste gênero. Diante disso, aplicamos neste estudo métodos de filogenia molecular no intuito de entender os processos evolutivos que envolvem a sorologia do gênero. Para isso, sequências de genes que fazem parte do locus rfb de amostras dos sorogrupos Sejroe, Mini e Hebdomadis (34 amostras) foram extraídas e submetidas ao pipeline filogenético, resultando na inferência de 75 árvores de máxima verossimilhança. Analisando as árvores, pode-se verificar que aqueles genes do locus rfb encontrados na maioria das espécies de Leptospira apresentaram uma topologia semelhante ao da árvore de espécies. Já aqueles genes que se encontram na região variável do locus apresentaram árvores com topologias que sugerem a ocorrência de transferência lateral entre as espécies L. borgpetersenii e L. kirschneri e L. interrogans e L. weilli. Nesta análise, não foram encontrados evidências sobre a ocorrência da transferência lateral entre amostras do sorovar Hardjo das espécies L. interrogans e L. borgpetersenii, sugerindo que seus genes já estavam presentes no ancestral comum e que eles passaram por herança vertical. Desta forma, sugere-se também que a ocorrência de transferência horizontal dos genes do locus rfb entre espécies distintas seja menos frequente do que se espera.Dissertação Análise genômica de microrganismos degradadores de hidrocarbonetos do petróleo e seu potencial de atuação em hidrocarbonetos prioritários(Universidade Federal do Rio Grande do Norte, 2023-02-28) Silva, Douglas Felipe de Lima; Lima, Lucymara Fassarella Agnez; https://orcid.org/0000-0003-0642-3162; http://lattes.cnpq.br/1083882171718362; http://lattes.cnpq.br/8053019098525102; Dalmolin, Rodrigo Juliani Siqueira; https://orcid.org/0000-0002-1688-6155; http://lattes.cnpq.br/4065178015615979; Vasconcelos, Ana Tereza Ribeiro deA contaminação de solos e ecossistemas marinhos por hidrocarbonetos que compõem o petróleo, provenientes de vazamentos de grande e pequena escala em toda sua cadeia produtiva, traz grave consequências o meio ambiente. Dentre as estratégias existentes para atenuar os impactos ambientais nas áreas acometidas, a biorremediação por bioaumentação ao utilizar organismos capazes de degradar petróleo se mostra uma alternativa com melhor custo-benefício e que promove maior remoção de compostos quando comparada a métodos físico-químicos. São listados por agências reguladoras ambientais nacionais e internacionais 179 compostos com prioridade para biorremediação devido ao seu potencial toxico e/ou mutagênico. A partir de trabalhos anteriores, os integrantes do grupo de pesquisa do Laboratório de Biologia Molecular e Genômica vem obtendo isolados bacterianos a partir de amostras de ambientes contaminados por petróleo, mantendo um estoque desses isolados que formam um banco de microrganismos preservado pelo laboratório. Os genomas de isolados com perfil promissor para atuar em biorremediação estão sendo sequenciados, visando a identificação taxonômica e de seu e perfil metabólico. Sendo assim, até agora, através do sequenciamento do genoma completo de 22 isolados bacterianos obtidos anteriormente pelo grupo e sequenciamento do gene 16S de 18 isolados obtidos a partir de amostras de petróleo coletadas em praias do Rio Grande do Norte no desenvolvimento deste trabalho, resultaram na identificação de 10 gêneros de bactérias capazes de crescer utilizando petróleo como fonte de carbono. A partir da análise dos dados gerados, por meio da linguagem de programação R, foi possível realizar a comparação com os respectivos genomas de referência, determinando suas relações e particularidades. Foram identificados dentre todos os isolados com genoma completo sequenciado 53 genes que codificam enzimas, presentes em 20 vias de degradação e metabolismo de xenobióticos do KEGG, que participam do processo de degradação de 37 hidrocarbonetos relatados como prioritários, bem como o grau de semelhança do perfil de degradação entre isolados. Através da análise dos resultados in sílico foi proposta a formulação de um consórcio de 4 isolados com potencial de atuar na biorremediação de 34 dos 37 compostos.Dissertação Análises de redes modulares de co-expressão gênica revelam vias importantes na doença de Alzheimer e paralisia supranuclear progressiva(Universidade Federal do Rio Grande do Norte, 2021-09-28) Carvalho, Lukas Iohan da Cruz; Costa, Marcos Romualdo; Costa, Marcos Romualdo; 05278916737; http://lattes.cnpq.br/6118493598074445; http://lattes.cnpq.br/6118493598074445; http://lattes.cnpq.br/2797997375475881; Dalmolin, Rodrigo Juliani Siqueira; http://lattes.cnpq.br/4065178015615979; Velho, Tarciso André Ferreira; http://lattes.cnpq.br/8194534389725093; Reis, Ricardo Augusto de Melo; http://lattes.cnpq.br/6046165866539973As demências, doenças neurodegenerativas onde há perda de funções cognitivas, tiveram sua incidência aumentada nos últimos anos, principalmente por causa do aumento da longevidade na população mundial como um todo. O entendimento do início e progressão dessas patologias pode ajudar na identificação de tratamentos preventivos para essas doenças. Neste trabalho, utilizando dados humanos referentes a duas doenças neurodegenerativas (Alzheimer e Paralisia Supranuclear Progressiva) de duas regiões cerebrais (córtex temporal e cerebelo) e dois modelos animais, 5XFAD de amiloidopatia e TauD35 de taupatia, fizemos uma análise integrativa a nível gene/transcrito aliada a uma análise de co-expressão para identificar similaridades e discrepâncias nos processos biológicos afetados por essas duas doencas. Para que pudéssemos comparar os diferentes dados utilizamos a única variável comum em todos os datasets: a idade da morte. Desse modo dividimos os dados humanos em 3 grupos: A (70-80), B (81-89) e C (90+); e os animais em grupos de 4 meses, 12 meses, 17 meses e 18 meses. Os resultados da análise transcricional mostraram que alterações imunes estão presentes em AD apenas no córtex temporal, e não no cerebelo, e que alteração na transmissão sináptica ocorre tardiamente (grupos B e C), e são encontradas apenas quando utilizamos genes com isoformas alteradas no processo de enriquecimento funcional em conjunto com os genes diferencialmente expressos. Na PSP, todas as alterações encontradas imunes e de transmissão sináptica são encontradas apenas nos dados de córtex temporal; no entanto, todas as alterações são específicas para o grupo A. Nos modelos animais, as alterações em 5XFAD são semelhantes às encontradas em AD, alterações da resposta imune-inflamatória presentes em grupos precoces (4 meses) e sinápticas em um grupo mais tardio (18 meses). Em TauD35, no entanto, as alterações imunes ocorrem apenas no grupo de 17 meses, enquanto as sinápticas foram no grupo de 4 meses. Além desses resultados, observamos que as alterações em isoformas (gDTUS) estão presentes quase que exclusivamente em humanos, e principalmente em AD. Para refinar os nossos resultados, utilizamos uma abordagem de coexpressão e identificamos módulos com expressão e assinaturas gênicas específicas. Em AD os módulos envolvendo sinapses não apresentavam diferenças para o controle, no entanto, os módulos relativos a reposta imune-inflamatória, matriz extracelular e reposta a fator de crescimento estavam com atividade maior nos indivíduos com AD. Na PSP, os módulos com atividade sináptica apresentaram maior atividade em relação ao controle, enquanto aqueles relacionados com resposta imune tiveram uma atividade menor. Para confirmar a identidade genética desses módulos, utilizamos os genes encontrados nos mesmos e observamos que havia correspondência entre os módulos relacionados à resposta imune-inflamatória com células microgliais e sinápticos com neurônios glutamatérgicos. Além desses achados, também encontramos que a resposta imune-inflamatória e associada, em AD, a região analisada, dado os resultados encontrados na análise de outro dataset (MSBB). Por fim, encontramos genes identificados como fatores de risco para AD, como PTK2B, TREM1 e TREM2 nos módulos, além de MOB e SA4D nos módulos identificados na PSP. Em conjunto, esses resultados sugerem que no modelo de amiloidopatia e em AD, alterações na sinalização sináptica formam um feedback positivo com a resposta imune-inflamatória, sendo esta posterior a primeira; enquanto no modelo de taupatia e PSP, os efeitos na inflamação são secundários às alterações sinápticas.Dissertação Análises metagenômicas revelam a influência das camadas de profundidade na biodiversidade marinha em regiões tropicais e subtropicais(Universidade Federal do Rio Grande do Norte, 2022-10-28) Santiago, Bianca Cristiane Ferreira; Dalmolin, Rodrigo Juliani Siqueira; https://orcid.org/0000-0002-1688-6155; http://lattes.cnpq.br/4065178015615979; http://lattes.cnpq.br/7545266931352015; Costa, César Renno; Wallau, Gabriel da LuzCerca de 71% do ecossistema da superfície terrestre é coberto por oceano, responsável por conter 97% de toda a água da Terra, sendo o plâncton, a sua forma de vida dominante. Microrganismos têm um papel imprescindível na manutenção do sistema do planeta, uma vez que são fontes de energia e nutrientes aos seres vivos, realizam quase metade da produção primária líquida, mantêm o equilíbrio químico na atmosfera e exportam carbono fixado fotossinteticamente para as camadas mais profundas do oceano. A biologia de ecossistemas oceânicos estuda como os fatores bióticos e abióticos determinam as propriedades do ecossistema oceânico. Com o surgimento de estudos em escala global de organismos de mar aberto, muito tem se descoberto sobre a genômica de comunidades microbianas oceânicas. Um dos principais projetos desta categoria atualmente é o Tara Oceans, um projeto multidisciplinar com o objetivo de compreender a diversidade, interações, funções e complexidade fenotípica em escalas taxonômicas e espaciais do plâncton, através de cerca de 35000 amostras com milhões de organismos coletadas em profundidades de até 2000 m em 210 estações ao longo dos oceanos. O principal objetivo deste trabalho foi comparar amostras oceânicas explorando a abundância, diversidade, e função dos microrganismos encontrados em zonas tropicais e subtropicais, com o intuito de entender como esses fatores afetam a biodiversidade dessas espécies. Para isso, foram selecionadas somente amostras de estações de coleta que apresentaram amostras nas três camadas de profundidade (SRF, DCM e MES) simultaneamente. Essa filtragem resultou em 8 estações com um somatório de 76 amostras. Esses dados foram processados através do pipeline MEDUSA, seguindo o fluxo padrão de uma análise de metagenômica: pré-processamento, alinhamento de sequências com um banco de proteínas referência, classificação taxonômica e anotação funcional. Com os resultados obtidos desse processo foi possível comparar abundância e diversidade dessas amostras e anotar e analisar os resultados dessa comparação. Observou-se uma maior diversidade de organismos na camada mais profunda e não ocorreu uma diferença significativa de abundância entre as camadas de profundidade exploradas. Algumas funções biológicas são exclusivas de cada camada de profundidade, indicando suas particularidades e sua diversidade funcional. Não foi observada distinção significativa de abundância, diversidade ou função comparando exclusivamente as amostras de estações de coleta nos diferentes pontos geográficos.Dissertação Assinatura transcricional do carcinoma renal de células claras baseada no RNA endógeno competidor(Universidade Federal do Rio Grande do Norte, 2023-08-15) Farias Filho, Epitácio Dantas de; Ferreira, Beatriz Stransky; Terrematte, Patrick César Alves; https://orcid.org/0000-0003-4506-393X; http://lattes.cnpq.br/3142264445097872; https://orcid.org/0000-0002-3865-5411; http://lattes.cnpq.br/4326200607523374; Paschoal, Alexandre Rossi; Dalmolin, Rodrigo Juliani Siqueira; https://orcid.org/0000-0002-1688-6155; http://lattes.cnpq.br/4065178015615979O carcinoma renal, por ser uma patologia de desenvolvimento silencioso e multifatorial, é caracterizada por apresentar uma alta taxa de pacientes com metástases. Após diversos estudos elucidarem a atividade dos genes codificantes no desenvolvimento metastático do carcinoma renal, novos estudos buscam avaliar a associação de genes não codificantes, como RNA endógeno competidor (ceRNA), ao processo metastático. Desta forma, o objetivo deste estudo é construir uma assinatura transcricional para o carcinoma renal de células claras (ccRCC), associada ao desenvolvimento metastático a partir de uma rede de ceRNA e analisar as prováveis funções biológicas desempenhada pelos participantes da assinatura. Utilizando os dados de ccRCC do The Cancer Genome Atlas (TCGA), construímos nove assinaturas transcricionais a partir de oito técnicas de seleção de características e analisamos a sensibilidade e especificidade da classificação dos modelos de regressão no processo de benchmarking. Consequentemente, foram obtidos os genes da assinatura e foram realizadas análises de alterações somáticas e de número de cópias, análise de risco para sobrevida e progressão metastática, e análises de anotação funcional. Neste estudo apresentamos uma assinatura transcricional de 11 genes, composta por 2 RNAs longos não codificantes, SNHG15 e AF117829.1, 2 miRNAs, hsa-miR-130a-3p e hsa-mir-381-3p, e 7 mRNAs, BTBD11, INSR, HECW2, RFLNB, PTTG1, HMMR, RASD1. A validação utilizando o conjunto de dados externos do International Cancer Genome Consortium (ICGC) possibilitou avaliar a generalização da assinatura, que apresentou uma acurácia de 72% e área abaixo da curva de 81.5%. As análises genômicas identificaram que os participantes da assinatura se localizam em cromossomos com regiões altamente mutadas (G-index > 2). Os genes hsa-miR-130a-3p, AF117829.1 e HECW2 tiveram uma relação significativa entre a expressão e a sobrevida dos pacientes, e os dois últimos possuem relação significativa com o desenvolvimento metastático. Além disso, foi analisada a anotação funcional em vias importantes para o desenvolvimento tumoral, como: PI3K/AKT, TNF, FoxO, regulação da transcrição da RNA polimerase 2, controle celular e entre outras. Por fim, ao analisar as conexões dos genes da assinatura dentro da rede ceRNA em conjunto com estudos da literatura, foi possível obter um panorama das atividades desempenhadas por eles dentro do ccRCC. Sendo assim, esta assinatura transcricional pode identificar genes não codificantes como potenciais biomarcadores a serem utilizados para uma melhor compreensão do carcinoma renal, bem como no desenvolvimento de futuros tratamentos na área clínica.Dissertação Autogating em dados de citometria de fluxo utilizando classificadores SVM para identificação de bacterioplâncton(2018-03-22) Cordeiro, Elionai Moura; Doria Neto, Adrião Duarte; ; ; Santos, Araken de Medeiros; ; Araújo, Daniel Sabino Amorim de; ; Souza, Jorge Estefano Santana de;Neste trabalho é apresentada a proposta de desenvolvimento de uma metodologia - juntamente com a apresentação dos resultados de sua aplicação - que utiliza uma técnica de aprendizagem de máquina, SVM, para análise automatizada de dados de citometria de fluxo em amostras de ambientes aquáticos, na identificação de bacterioplâncton. As amostras utilizadas na execução desta metodologia foram coletadas em 19 lagos de montanhas de elevada altitude que foram classificados manualmente no Laboratório de Limnologia do Departamento de Oceanografia e Limnologia da UFRN. Previamente, iniciou-se com alguns testes de configuração da função kernel e uma análise quantitativa com base no número médio de acertos na classificação automatizada, na qual percebeu-se que a taxa de erro de predição variou entre 1,86% e 3,35%, em média. Foram realizadas duas etapas de desenvolvimento da metodologia proposta, onde foram criados modelos de predição e realizados uma série de testes com as bases de dados criadas a partir das informações disponíveis. Os resultados obtidos foram expostos a uma série de análises quantitativas e qualitativas, inclusive utilizando PCA para entender a importância de cada variável nos conjuntos de dados das mostras. Para uma avaliação qualitativa da metodologia proposta, foi aplicada uma análise estatística para comparar ambas estratégias de modelos de predição, que tem por base a classificação final apontada pelo algoritmo de Support Vector Machine.Dissertação Bases genéticas associadas à classificação sorológica em Leptospira: um estudo de caso do sorogrupo Sejroe(Universidade Federal do Rio Grande do Norte, 2021-11-30) Medeiros, Eliseu Jayro de Souza; Sakamoto, Tetsu; https://orcid.org/0000-0003-3023-0117; http://lattes.cnpq.br/1342530085695810; http://lattes.cnpq.br/8604580112217498; Souza, Jorge Estefano de Santana; Lima, Anna Monteiro Correia; Cosate, Maria Raquel VenturimA leptospirose é uma zoonose amplamente distribuída, causada por cepas de bactérias patogênicas do gênero Leptospira (Filo Spirochaetes). Seus agentes são comumente classificados com base em suas características antigênicas em sorogrupos e sorovares, que são relevantes para estudos epidemiológicos e desenvolvimento de vacinas. No entanto, os métodos utilizados para isso são considerados trabalhosos e requerem uma infraestrutura especializada. Alguns métodos moleculares foram propostos para acelerar esses procedimentos, mas ainda não podem substituir os testes imunológicos, exigindo assim um maior conhecimento da base genética subjacente à classificação sorológica. Neste trabalho, nos concentramos em elucidar os fatores genéticos determinantes do sorogrupo Sejroe, que é um dos sorogrupos mais prevalentes da pecuária. Para isso realizamos uma análise genômica comparativa utilizando mais de 700 amostras de leptospiras disponíveis no banco de dados públicos. A análise mostrou que os genes que compõem o locus rfb são os principais fatores genéticos associados à classificação sorológica. O locus rfb de amostras do sorogrupo Sejroe tem uma composição de gene conservada que difere da maioria dos outros sorogrupos. Hebdomadis e Mini foram os únicos sorogrupos cujas amostras apresentam locus rfb com composição gênica semelhante aos do sorogrupo Sejroe, corroborando com a similaridade antigênica compartilhada por eles. Finalmente, nós pudemos determinar uma pequena região no locus rfb em que cada um desses três sorogrupos pode ser distinguido por sua composição gênica. Este é o primeiro trabalho que utiliza um extenso repertório de dados genômicos de amostras de leptospira para elucidar as bases moleculares da classificação sorológica e abrir caminho para estratégias mais confiáveis baseadas em métodos moleculares de sorodiagnósticos.Dissertação BIO-DIA: ferramenta web para integração de dados e algoritmos(2019-12-19) Soares, Thiago Dantas; Figuerola, Wilfredo Blanco; Souza, Sandro José de; ; ; ; Signoretti, Alberto; ; Dalmolin, Rodrigo Juliani Siqueira;A ciência de dados é historicamente um campo complexo, não apenas pela enorme quantidade de dados e sua variedade de formatos, mas também pela necessidade de colaboração entre vários especialistas para recuperar informações valiosas. Nesse contexto, criamos o Bio-DIA, um software on-line para criar um processo de fluxo de trabalho de ciência de dados focado na integração de dados e algoritmos. O Bio-DIA também facilita a reutilização de informações/resultados obtidos em processos anteriores sem a necessidade de habilidades específicas do campo da ciência da computação. O software foi criado com o Angular no front-end, o Django no back-end e o Spark para manipular e processar uma variedade de formatos de big data. O fluxo de trabalho/projeto é especificado através do arquivo XML. O aplicativo Bio-DIA facilita a colaboração entre os usuários, permitindo que grupos de pesquisadores compartilhem dados, scripts e informações.Tese Bioinformática aplicada ao desenvolvimento de estratégias de prognóstico e tratamento do câncer: estudos na prospecção de alvos terapêuticos, antígenos tumorais e na dinâmica de resposta a drogas(2018-11-01) Faustino, André Luís Fonseca; Souza, Sandro José de; ; ; Souza, Gustavo Antonio de; ; Lima, Lucymara Fassarella Agnez; ; Carraro, Dirce Maria; ; Balbino, Valdir;Essencialmente, a pesquisa do câncer é um campo que envolve vários ramos, abrangendo a compreensão da biologia do câncer, design de drogas e desenvolvimento terapêutico. De maneira geral, a pesquisa contra o câncer está concentrada no diagnóstico, prognóstico, tratamento e, finalmente, na cura do paciente. Nesse contexto, a bioinformática do câncer surge como um poderoso recurso, integrando dados públicos e, consequentemente, permitindo o avanço de aplicações clínicas. Têm-se como exemplo, o desenvolvimento de abordagens para tratamento, a descoberta de novas drogas e também, recentemente, de estratégias imunoterapêuticas. Neste trabalho, apresenta-se abordagens distintas para compreender a biologia do câncer com foco no seu tratamento e, principalmente, na predição do prognóstico. Cada capítulo mostra diferentes aplicações clínicas como, a previsão de resultados de sobrevida, oportunidades para novos tratamentos imunológicos e resistência a drogas. Nos capítulos iniciais são apresentados catálogos extensivos de genes associados a: i) marcadores de superfície de celular e ii) antígenos de câncer/testículo (CTAs). Em particular, foi demonstrado o efeito de assinaturas gênicas compostas por essas categorias, na predição do status de prognóstico em pacientes com câncer. Em um segundo momento, foi discutido o desenvolvimento de novas estratégias de imunoterapia baseadas em vacinas, combinando múltiplos CTAs. Particularmente, discute-se como as assinaturas de CTAs compostas por HEATR9, INSL3, GTSF1L e HSF5 melhoram o status de prognóstico em pacientes com melanoma. Por último, apresentamos uma metodologia com foco na regulação póstranscricional, a qual integra informação genotípica, dados de expressão e concentração de drogas para avaliar a resistência/sensibilidade do tratamento, utilizando dados de linhagem celular e de pacientes. Como conclusão, foram apresentadas três abordagens independentes para melhorar o tratamento do câncer, que podem ser usadas combinando ou não, os marcadores de prognóstico da superfície celular, o preditor de resposta a drogas e as vacinas contra o câncer. Ainda, como outros produtos importantes, são mencionados dois artigos publicados em períodos internacionais, bem como, uma patente em andamento.