Programa de Pós-Graduação em Bioinformática - IMD
URI Permanente desta comunidadehttps://repositorio.ufrn.br/handle/123456789/24561
Navegar
Navegando Programa de Pós-Graduação em Bioinformática - IMD por Autor "Araújo, Daniel Sabino Amorim de"
Agora exibindo 1 - 4 de 4
- Resultados por página
- Opções de Ordenação
Dissertação Autogating em dados de citometria de fluxo utilizando classificadores SVM para identificação de bacterioplâncton(2018-03-22) Cordeiro, Elionai Moura; Doria Neto, Adrião Duarte; ; ; Santos, Araken de Medeiros; ; Araújo, Daniel Sabino Amorim de; ; Souza, Jorge Estefano Santana de;Neste trabalho é apresentada a proposta de desenvolvimento de uma metodologia - juntamente com a apresentação dos resultados de sua aplicação - que utiliza uma técnica de aprendizagem de máquina, SVM, para análise automatizada de dados de citometria de fluxo em amostras de ambientes aquáticos, na identificação de bacterioplâncton. As amostras utilizadas na execução desta metodologia foram coletadas em 19 lagos de montanhas de elevada altitude que foram classificados manualmente no Laboratório de Limnologia do Departamento de Oceanografia e Limnologia da UFRN. Previamente, iniciou-se com alguns testes de configuração da função kernel e uma análise quantitativa com base no número médio de acertos na classificação automatizada, na qual percebeu-se que a taxa de erro de predição variou entre 1,86% e 3,35%, em média. Foram realizadas duas etapas de desenvolvimento da metodologia proposta, onde foram criados modelos de predição e realizados uma série de testes com as bases de dados criadas a partir das informações disponíveis. Os resultados obtidos foram expostos a uma série de análises quantitativas e qualitativas, inclusive utilizando PCA para entender a importância de cada variável nos conjuntos de dados das mostras. Para uma avaliação qualitativa da metodologia proposta, foi aplicada uma análise estatística para comparar ambas estratégias de modelos de predição, que tem por base a classificação final apontada pelo algoritmo de Support Vector Machine.Tese flowDiv: uma nova ferramenta computacional para análise da diversidade citométrica ambiental(2019-11-25) Wanderley, Bruno Mattos Silva; Doria Neto, Adrião Duarte; ; ; Araújo, Daniel Sabino Amorim de; ; Souza, Jorge Estefano Santana de; ; Amado, André Megali; ; Unrein, Fernando; ; Menezes, Rosemberg Fernandes de;A citometria de fluxo (CMF) é uma técnica analítica baseada na caracterização espectroscópica de partículas em suspensão. Essa técnica permite a descrição quantitativa e qualitativa de uma vasta gama de sistemas celulares em poucos segundos e a custos relativamente baixos - características que a tornam uma ferramenta bastante ubíqua em protocolos analíticos, tanto industriais quanto acadêmicos. Nesse tocante, as ciências ambientais vem lidando com obstáculos bastante notórios quanto à estruturação de protocolos de CMF: a natureza altamente heterogênea das amostras ambientais dificulta o ajuste de protocolos que equilibrem raciocínios matemáticos padronizados e os significados biológicos intrínsecos do sistema em estudo. Diversas abordagens vem sendo concebidas com vistas a corrigir essas incongruências e, dentre elas, as que exploram a ideia da diversidade citométrica - o estudo de dados de CMF com base em métodos de ecologia numérica - vem se mostrando bastante auspiciosas. Contudo, apesar da disponibilidade de soluções, muitos desafios técnicos ainda precisam ser superados. Neste trabalho, nós desenvolvemos e aplicamos uma nova ferramenta computacional, o flowDiv, especialmente projetada para a análise da diversidade citométrica de dados ambientais. Aqui, além de pormenorizarmos a lógica por trás do método e o compararmos a estratégias computacionais similares, nós o aplicamos a problemas reais, revelando como alguns fatores ecológicos importantes, como o estado nutricional, afetam a diversidade citométrica de grupos microbianos de lagos naturais da Patagônia argentina e do nordeste brasileiro. Nossos resultados sugerem que variáveis ambientais importantes - notadamente clorofila a e carbono, fósforo e nitrogênio totais - afetam a diversidade citométrica de bactérias de maneiras distintas. Essas descobertas alinham-se com a literatura vigente sobre o tema e reafirmam a validade do flowDiv para refletir, de forma consistente, alterações na composição das comunidades bacterianas decorrentes de mudanças ambientais.Tese Uma nova assinatura de 13 genes via aprendizagem de máquina para predição de sobrevida de pacientes com carcinoma renal de células clara(Universidade Federal do Rio Grande do Norte, 2022-05-13) Terrematte, Patrick Cesar Alves; Doria Neto, Adrião Duarte; Ferreira, Beatriz Stransky; https://orcid.org/0000-0003-4506-393X; http://lattes.cnpq.br/3142264445097872; https://orcid.org/0000-0002-5445-7327; http://lattes.cnpq.br/1987295209521433; http://lattes.cnpq.br/4283045850342312; Leite, Cicilia Raquel Maia; Araújo, Daniel Sabino Amorim de; http://lattes.cnpq.br/4744754780165354; Assumpção, Paulo Pimentel de; Sakamoto, TetsuPacientes com câncer renal têm sobrevida de 12% em 5 anos em caso de metástase, segundo dados entre 2009 e 2015 da American Cancer Society. Neste sentido, é de suma importância identificar biomarcadores em dados genômicos para ajudar a prever o avanço do carcinoma renal de células claras (ccRCC), sendo este o subtipo mais frequente. Assim, realizamos um estudo com o objetivo de avaliar assinaturas gênicas e propor uma nova assinatura com maior poder preditivo. Usando coortes ccRCC do The Cancer Genome Atlas (TCGA-KIRC) e do International Cancer Genome Consortium (ICGC-RECA), avaliamos modelos de sobrevida usando regressão de Cox comparando 14 assinaturas da literatura e seis métodos de seleção de características, e também realizamos análise funcional e de expressão diferencial. Neste estudo, apresentamos uma assinatura de 13 genes (AR, AL353637.1, DPP6, FOXJ1, GNB3, HHLA2, IL4, LIMCH1, LINC01732, OTX1, SAA1, SEMA3G, ZIC2) cujos níveis de expressão são capazes de prever risco de pacientes com ccCRC. A assinatura genética de melhor desempenho foi alcançada usando o método de comitês de Mínima Redundância e Máxima Relevância (mRMR). Essa assinatura apresenta características únicas em relação às demais, como a generalização por diferentes coortes e o enriquecimento funcional em vias relacionadas à doenças: Doença Renal Crônica, Carcinoma de células de transição, e Nefrolitíase. Dos 13 genes em nossa assinatura, oito são conhecidos na literatura por estarem correlacionados com a sobrevida de pacientes com ccRCC. Nosso modelo mostrou um desempenho de 0,82 usando a métrica Receiver Operator Characteristic (ROC) Area Under Curve (AUC). Nossos resultados revelaram dois agrupamentos de genes com alta expressão (SAA1, OTX1, ZIC2, LINC01732, GNB3 e IL4) e baixa expressão (AL353637.1, AR, HHLA2, LIMCH1, SEMA3G, e DPP6), ambos correlacionados com prognóstico desfavoráveis. Esta assinatura pode potencialmente ser desenvolvida para auxiliar tratamentos na prática clínica.Tese Proposed FPGA-Based hardware architectures for acceleration of Smith-Waterman and K-Mers algorithms(Universidade Federal do Rio Grande do Norte, 2024-04-05) Oliveira, Fábio Fonseca de; Fernandes, Marcelo Augusto Costa; https://orcid.org/0000-0001-7536-2506; http://lattes.cnpq.br/3475337353676349; Moioli, Renan Cipriano; Araújo, Daniel Sabino Amorim de; Sakuyama, Carlos Alberto Valderrama; Silva, Lucileide Medeiros Dantas daNeste trabalho, abordamos o desafio crescente de processar eficientemente o vasto e continuamente expansivo volume de dados em bases de dados biológicas. A necessidade de técnicas de análise de sequências rápidas e precisas é mais premente do que nunca, dada a importância de identificar semelhanças entre sequências biológicas para aplicações em genômica, taxonomia e além. Central para este esforço é a otimização de algoritmos de alinhamento de sequências, particularmente o Smith-Waterman (SW), um método de alto nível de precisão baseado em programação dinâmica, e o K-Mers, uma técnica para a contagem de subsequências que é fundamental na análise genômica. Propomos uma inovadora arquitetura de hardware paralelo para o algoritmo SW, incorporando uma estrutura de array sistólico que acelera significativamente as fases de avanço e retrocesso do alinhamento. Esta arquitetura pré-organiza o alinhamento na etapa de avanço, reduzindo a complexidade do subsequente retrocesso, que é iniciado a partir da posição de pontuação máxima. Validada em Field-Programmable Gate Array (FPGA), a arquitetura alcançou uma taxa de até 79,5 Giga Cell Updates por Segundo (GCPUS), demonstrando um avanço notável na eficiência de processamento. Adicionalmente, desenvolvemos um algoritmo baseado em K-Mers focado na extração exata de subsequências curtas, caracterizado por seu baixo consumo de memória, viabilidade de tempo de execução, alta capacidade de paralelização, e eficiência energética. Destinado primariamente para uso em FPGA, o algoritmo é também adaptável a outras plataformas de hardware. Estas contribuições não apenas estabelecem novos padrões em termos de velocidade e eficiência para o processamento de dados biológicos, mas também abrem caminho para avanços significativos em pesquisas genômicas e taxonômicas, entre outras áreas de bioinformática.