Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina

dc.contributor.advisorGonçalves, Luiz Marcos Garciapt_BR
dc.contributor.advisor-co1Souto, Marcílio Carlos Pereira dept_BR
dc.contributor.advisor-co1IDpor
dc.contributor.advisor-co1Latteshttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790032E1por
dc.contributor.advisorIDpor
dc.contributor.advisorLatteshttp://lattes.cnpq.br/1562357566810393por
dc.contributor.authorMonteiro, Meika Iwatapt_BR
dc.contributor.authorIDpor
dc.contributor.authorLatteshttp://lattes.cnpq.br/6479379685092821por
dc.contributor.referees1Oliveira, Jauvane Cavalcante dept_BR
dc.contributor.referees1IDpor
dc.contributor.referees1Latteshttp://lattes.cnpq.br/4054756781423727por
dc.contributor.referees2Dória Neto, Adrião Duartept_BR
dc.contributor.referees2IDpor
dc.contributor.referees2Latteshttp://lattes.cnpq.br/1987295209521433por
dc.date.accessioned2014-12-17T14:56:02Z
dc.date.available2007-02-12pt_BR
dc.date.available2014-12-17T14:56:02Z
dc.date.issued2005-12-13pt_BR
dc.description.abstractOne of the most important goals of bioinformatics is the ability to identify genes in uncharacterized DNA sequences on world wide database. Gene expression on prokaryotes initiates when the RNA-polymerase enzyme interacts with DNA regions called promoters. In these regions are located the main regulatory elements of the transcription process. Despite the improvement of in vitro techniques for molecular biology analysis, characterizing and identifying a great number of promoters on a genome is a complex task. Nevertheless, the main drawback is the absence of a large set of promoters to identify conserved patterns among the species. Hence, a in silico method to predict them on any species is a challenge. Improved promoter prediction methods can be one step towards developing more reliable ab initio gene prediction methods. In this work, we present an empirical comparison of Machine Learning (ML) techniques such as Na¨ýve Bayes, Decision Trees, Support Vector Machines and Neural Networks, Voted Perceptron, PART, k-NN and and ensemble approaches (Bagging and Boosting) to the task of predicting Bacillus subtilis. In order to do so, we first built two data set of promoter and nonpromoter sequences for B. subtilis and a hybrid one. In order to evaluate of ML methods a cross-validation procedure is applied. Good results were obtained with methods of ML like SVM and Naïve Bayes using B. subtilis. However, we have not reached good results on hybrid databaseeng
dc.description.resumoUm dos grandes desafios da Bioinformática é manipular e analisar os dados acumulados nas bases de dados mundiais. A expressão dos genes em procariotos é iniciada quando a enzima RNA polimerase une-se com uma região próxima ao gene, chamada de promotor, onde é localizado os principais elementos regulatórios do processo de transcrição. Apesar do crescente avanço das técnicas experimentais (in vitro) em biologia molecular, caracterizar e identificar um número significante de promotores ainda é uma tarefa difícil. Os métodos computacionais existentes enfrentam a falta de um número adequado de promotores conhecidos para identificar padrões conservados entre as espécies. Logo, um método para predizê-los em qualquer organismo procariótico ainda é um desafio. Neste trabalho, apresentamos uma comparação empírica de técnicas individuais de aprendizado de máquina, tais como: Classificador Bayesiano Ingênuo, Árvores de Decisão, Máquinas de Vetores de Suporte, Redes Neurais do tipo VotedPerceptron, PART e k-Vizinhos Mais Próximos e sistemas multiclassificadores (Bagging e Adaboosting) e Modelo Oculto de Markov à tarefa de predição de promotores procariotos em Bacilos subtilis. Utilizamos a validação cruzada para avaliar todos os métodos de AM. Para esses testes, foram construídas base de dados com seqüências de promotores e não-promotores do Bacillus subtilis e uma base de dados híbrida. Os métodos de AM obtiveram bons resultados com o SVM e o Naïve Bayes. Não conseguimos entretanto, obter resultados relevantes para a base de dados híbridapor
dc.formatapplication/pdfpor
dc.identifier.citationMONTEIRO, Meika Iwata. Predição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquina. 2005. 92 f. Dissertação (Mestrado em Automação e Sistemas; Engenharia de Computação; Telecomunicações) - Universidade Federal do Rio Grande do Norte, Natal, 2005.por
dc.identifier.urihttps://repositorio.ufrn.br/jspui/handle/123456789/15416
dc.languageporpor
dc.publisherUniversidade Federal do Rio Grande do Nortepor
dc.publisher.countryBRpor
dc.publisher.departmentAutomação e Sistemas; Engenharia de Computação; Telecomunicaçõespor
dc.publisher.initialsUFRNpor
dc.publisher.programPrograma de Pós-Graduação em Engenharia Elétricapor
dc.rightsAcesso Abertopor
dc.subjectAprendizado de Máquinapor
dc.subjectReconhecimento de Promotorespor
dc.subjectBioinformáticapor
dc.subjectLearning Machineeng
dc.subjectPromoters identificationeng
dc.subjectBioinformaticseng
dc.subject.cnpqCNPQ::ENGENHARIAS::ENGENHARIA ELETRICApor
dc.titlePredição de promotores de Bacillus subtilis usando técnicas de aprendizado de máquinapor
dc.typemasterThesispor

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
MeikaIM.pdf
Tamanho:
748.46 KB
Formato:
Adobe Portable Document Format
Carregando...
Imagem de Miniatura
Baixar