Logo do repositório
  • Página Inicial(current)
  • Buscar
    Por Data de PublicaçãoPor AutorPor TítuloPor Assunto
  • Tutoriais
  • Documentos
  • Sobre o RI
  • Eventos
    Repositório Institucional da UFRN: 15 anos de conexão com o conhecimento
  • Padrão
  • Amarelo
  • Azul
  • Verde
  • English
  • Português do Brasil
Entrar

SIGAA

  1. Início
  2. Pesquisar por Autor

Navegando por Autor "Lima Júnior, Francisco Chagas de"

Filtrar resultados informando as primeiras letras
Agora exibindo 1 - 17 de 17
  • Resultados por página
  • Opções de Ordenação
  • Carregando...
    Imagem de Miniatura
    Tese
    Uma abordagem utilizando aprendizagem por reforço hierárquica e computação paralela para o problema dos K-Servos
    (2017-06-09) Costa, Mademerson Leandro da; Doria Neto, Adrião Duarte; http://lattes.cnpq.br/1987295209521433; http://lattes.cnpq.br/9385856028870726; Lima Júnior, Francisco Chagas de; http://lattes.cnpq.br/9342041276186254; http://lattes.cnpq.br/2413250851590746; Santos, João Paulo Queiroz dos; http://lattes.cnpq.br/7325007451912598; Melo, Jorge Dantas de; http://lattes.cnpq.br/9892239670106361; Souza, Samuel Xavier de
    Um sistema de tarefas em espaços métricos é um modelo abstrato para uma classe de problemas de otimização online, incluindo o problema de paginação de memória, listas de acesso, problemas na indústria do petróleo como o gerenciamento de sondas de produção terrestre (workover rigs) e de logística na produção de petróleo offshore, o problema dos K-Servos, dentre outros. A utilização da aprendizagem por reforço na solução destes problemas, embora tenha se mostrado eficiente, está restrita a uma classe simples de problemas, devido à maldição da dimensionalidade inerente ao método. Neste trabalho, apresenta-se uma solução que utiliza a aprendizagem por reforço, baseada em técnicas de decomposição hierárquica e computação paralela para solução de problemas de otimização em espaços métricos, com o objetivo de estender a aplicabilidade do método a problemas complexos na indústria petrolífera, contornando a restrição da sua utilização a problemas teóricos de menor porte. A dimensão da estrutura de armazenamento utilizada pela aprendizagem por reforço para se obter a política ótima cresce em função do número de estados e de ações, sendo diretamente proporcional ao número n de nós e k de servos, fazendo com que o crescimento da complexidade do problema se dê de maneira exponencial (𝐶𝑘𝑛≅𝑂(𝑛𝑘)). Para contorná-lo, o problema foi modelado com um processo de decisão em múltiplas etapas onde inicialmente utilizamos o algoritmo k-means como método de agrupamento visando decompor o problema em subproblemas de menor dimensão. Em seguida foi aplicado o algoritmo Q-learning nos subgrupos buscando-se atingir a melhor política de deslocamento dos servos. Nesta etapa, foram utilizadas técnicas de computação paralela para que os processos de aprendizado e armazenamento nos subgrupos fossem executados de forma paralela. Desta forma, a dimensão do problema e o tempo total de execução do algoritmo foram reduzidos, viabilizando a aplicação do método proposto às grandes instâncias. A abordagem proposta apresentou melhores resultados quando comparada com a aprendizagem por reforço clássica e o método guloso. Além de ter atingido ganhos de speedup e eficiência na avaliação das métricas de desempenho paralelo.
  • Carregando...
    Imagem de Miniatura
    Dissertação
    Um algoritmo híbrido para o problema de roteamento de veículos com frotas heterogêneas
    (Universidade Federal do Rio Grande do Norte, 2011-07-13) Ferreira, Vanessa Danielle Santos; Aloise, Dario José; ; http://lattes.cnpq.br/7266011798625538; ; http://lattes.cnpq.br/7979768296075453; Costa, José Alfredo Ferreira; ; http://lattes.cnpq.br/9745845064013172; Lima Júnior, Francisco Chagas de;
    O presente trabalho visa propor uma meta-heurística híbrida para o Problema de Roteamento de Veículos com Frotas Heterogêneas (PRVFH), que é um problema de otimização combinatória NP-difícil, e que se caracteriza pelo uso de uma frota limitada composta por veículos distintos com capacidades distintas. O método híbrido desenvolvido utiliza-se de um algoritmo memético associado ao componente otimizador Vocabulary Building. A meta-heurística híbrida resultante foi implementada na linguagem de programação C++ e os experimentos computacionais geraram bons resultados em relação à meta-heurística aplicada isoladamente, comprovando a eficiência do método proposto.
  • Carregando...
    Imagem de Miniatura
    Tese
    Algoritmo Q-learning como estratégia de exploração e/ou explotação para metaheurísticas GRASP e algoritmo genético
    (Universidade Federal do Rio Grande do Norte, 2009-03-20) Lima Júnior, Francisco Chagas de; Melo, Jorge Dantas de; Dória Neto, Adrião Duarte; ; http://lattes.cnpq.br/1987295209521433; ; http://lattes.cnpq.br/7325007451912598; ; Aloise, Dario José; ; http://lattes.cnpq.br/7266011798625538; Viana, Gerardo Valdisio Rodrigues; ; http://lattes.cnpq.br/6262051397848744
    Técnicas de otimização conhecidas como metaheurísticas têm obtido sucesso na resolução de problemas classificados como NP - Árduos. Estes métodos utilizam abordagens não determinísticas que geram soluções próximas do ótimo sem, no entanto, garantir a determinação do ótimo global. Além das dificuldades inerentes à complexidade que caracteriza os problemas NP-Árduos, as metaheurísticas enfrentam ainda o dilema de exploração/explotação, que consiste em escolher entre intensificação da busca em uma região específica e a exploração mais ampla do espaço de soluções. Uma forma de orientar tais algoritmos em busca de melhores soluções é supri-los de maior conhecimento do problema através da utilização de um agente inteligente, capaz de reconhecer regiões promissoras e/ou identificar em que momento deverá diversificar a direção de busca, isto pode ser feito através da aplicação de Aprendizagem por Reforço. Neste contexto, este trabalho propõe o uso de uma técnica de Aprendizagem por Reforço - especificamente o Algoritmo Q-learning - como uma estratégia de exploração/explotação para as metaheurísticas GRASP (Greedy Randomized Adaptive Search Procedure) e Algoritmo Genético. Na implementação da metaheurística GRASP proposta, utilizou-se o Q-learning em substituição ao algoritmo guloso-aleatório tradicionalmente usado na fase de construção. Tal substituição teve como objetivo melhorar a qualidade das soluções iniciais que serão utilizadas na fase de busca local do GRASP, e, ao mesmo tempo, suprir esta metaheurísticas de um mecanismo de memória adaptativa que permita a reutilização de boas decisões tomadas em iterações passadas e que evite a repetição de decisões não promissoras. No Algoritmo Genético, o algoritmo Q-learning foi utilizado para gerar uma população inicial de alta aptidão, e após um determinado número de gerações, caso a taxa de diversidade da população seja menor do que um determinado limite L, ele é também utilizado em uma forma alternativa de operador de cruzamento. Outra modificação importante no algoritmo genético híbrido é a proposta de um processo de interação mutuamente cooperativa entre o os operadores genéticos e o Algoritmo Q-learning. Neste processo interativo/cooperativo o algoritmo Q-learning recebe uma atualização adicional na matriz dos Q-valores com base na solução elite da população corrente. Os experimentos computacionais apresentados neste trabalho consistem em comparar os resultados obtidos com a implementação de versões tradicionais das metaheurísticas citadas, com aqueles obtidos utilizando os métodos híbridos propostos. Ambos os algoritmos foram aplicados com sucesso ao problema do caixeiro viajante simétrico, que por sua vez, foi modelado como um processo de decisão de Markov
  • Nenhuma Miniatura disponível
    Tese
    Algoritmos de aprendizagem por reforço para problemas de otimização multiobjetivo
    (Universidade Federal do Rio Grande do Norte, 2021-01-11) Oliveira, Thiago Henrique Freire de; Doria Neto, Adrião Duarte; ; http://lattes.cnpq.br/1987295209521433; ; http://lattes.cnpq.br/0465224964961501; Araújo, Aluizio Fausto Ribeiro; ; http://lattes.cnpq.br/8715023255304328; Araújo, Daniel Sabino Amorim de; ; http://lattes.cnpq.br/4744754780165354; Lima Júnior, Francisco Chagas de; ; http://lattes.cnpq.br/9342041276186254; Melo, Jorge Dantas de; ; http://lattes.cnpq.br/7325007451912598; Fernandes, Marcelo Augusto Costa; ; http://lattes.cnpq.br/3475337353676349
    Problemas de otimização multiobjetivo retratam situações reais e por isso, esta classe de problemas é extremamente importante. No entanto, mesmo já sendo estudada há décadas, esta classe de problemas continua a proporcionar situações desafiadoras, ainda mais com a crescente complexidade dos problemas que surgem ao longo do tempo. Dentre todas as dificuldades que podemos encontrar na otimização de múltiplos objetivos simultaneamente, sejam eles conflitantes ou não, uma das principais com que os algoritmos e abordagens existentes se possuem é a necessidade de conhecimento a priori do problema, ocasionando uma predefinição de importância para cada um dos objetivos, buscando estabelecer isomórfica entre a ponderação e uma solução. Já quando tratamos esta classe de problemas por meio da aprendizagem por reforço, duas abordagens são predominantes: política única (single-policy) e múltiplas políticas (multi-policy). Algoritmos e técnicas que utilizam a primeira abordagem sofrem com a necessidade de conhecimento prévio do problema, característica inerente dos problemas multiobjetivo. Já a segunda abordagem possui outras dificuldades, tais como: limitação do conjunto de soluções e elevado custo computacional. Diante deste contexto apresentado, o trabalho propõe dois algoritmos híbridos, chamados de Q-Managed with reset e Q-Managed without reset. Ambos são uma hibridização do algoritmo Q-Learning e a abordagem econstraint, respectivamente técnicas pertencentes a aprendizagem por reforço e otimização multiobjetivo. De forma resumida, os algoritmos propostos atuam da seguinte forma: o Q-Learning é utilizado para a exploração do ambiente, enquanto que a abordagem econstraint é utilizada para a delimitação dinâmica do ambiente — restrição da busca no espaço de soluções —, permitindo manter intacta a essência de como o algoritmo Q-Learning atua. Essa delimitação tem a seguinte finalidade: impor que o agente de aprendizagem possa aprender outras soluções por meio do bloqueio de ações que o levem a soluções já aprendidas e sem melhoria das mesmas, ou seja, soluções para qual o agente de aprendizagem já convergiu. Tal característica do bloqueio de ações é realizada pela figura de um supervisor (Manager), onde o mesmo é responsável por observar tudo o que ocorre no ambiente. Com relação a diferença entre os algoritmos propostos, basicamente trata-se da escolha de aproveitar ou não o conhecimento já adquirido do ambiente após uma solução ser considerada aprendida, ou seja, o agente de aprendizado ter convergido para uma determinada solução. Como forma de testar a eficácia das duas versões do Q-Managed, foram utilizados benchmarks tradicionais, os quais também foram adotados em outros trabalhos, permitindo assim uma comparação mais justa. Assim, duas abordagens comparativas foram adotadas, sendo a primeira delas por meio da implementação dos algoritmos de terceiros para uma comparação direta, enquanto que a segunda se deu por meio de uma métrica comum a todos que utilizaram os mesmos benchmarks. Em todos os testes possíveis, os algoritmos aqui propostos se mostraram eficazes, sempre encontrando toda a Fronteira de Pareto.
  • Carregando...
    Imagem de Miniatura
    Dissertação
    Uma aplicação da apredizagem por reforço na otimização da produção em um campo de petróleo
    (Universidade Federal do Rio Grande do Norte, 2010-01-27) Oliveira, Amanda Gondim de; Melo, Jorge Dantas de; ; http://lattes.cnpq.br/7325007451912598; ; http://lattes.cnpq.br/3619642245221227; Mata, Wilson da; ; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781404Z6; Dória Neto, Adrião Duarte; ; http://lattes.cnpq.br/1987295209521433; Lima Júnior, Francisco Chagas de;
    O objetivo da engenharia de reservatórios é o de gerenciar campos de produção de petróleo de forma a maximizar a produção dos hidrocarbonetos obedecendo a restrições físicas e econômicas existentes. A definição de estratégias de produção é uma atividade complexa por envolver diversas variáveis do processo. Deste modo, um sistema inteligente, que auxilie na otimização das alternativas de desenvolvimento do campo, torna-se bastante útil no dia-a-dia dos engenheiros de reservatórios. Este trabalho propõe o estudo preliminar de um sistema inteligente de auxílio à tomadas de decisões, no que diz respeito à otimização de estratégias de produção em campos de petróleo. A inteligência desse sistema será implementada por meio do uso da técnica de aprendizado por reforço, a qual se apresenta como uma poderosa ferramenta em problemas de decisão multi-estágios. O sistema estudado visa permitir que o especialista obtenha, em tempo hábil, a alternativa ótima (ou quase-ótima) para o desenvolvimento de um campo de petróleo conhecido
  • Carregando...
    Imagem de Miniatura
    Dissertação
    Aplicaçaõ das técnicas Path-relinking e Vocabulary buiding na melhoria de performance do algoritmo memético para o problema do caixeiro viajante assimétrico
    (Universidade Federal do Rio Grande do Norte, 2009-07-10) Silva Neto, João Saturnino da; Aloise, Dario José; ; http://lattes.cnpq.br/7266011798625538; ; http://lattes.cnpq.br/7925566521492797; Pereira, Marcelo Gomes; ; http://lattes.cnpq.br/8115277730238592; Lima Júnior, Francisco Chagas de;
    O presente trabalho propõe estratégias de melhoria em uma bem sucedida metaheur ística evolucionaria para a resolução do Problema do Caixeiro Viajante Assimétrico. Tal procedimento consiste em um algoritmo memético projetado especificamente para esse problema. Essas melhorias têm por base a aplicação de técnicas de otimização conhecidas como Path-Relinking e Vocabulary Building, sendo essa última técnica utilizada de dois modos distintos, com o intuito de avaliar os efeitos de melhoria sobre a metaheurística evolucionária empregada. Os métodos propostos foram implementados na linguagem de programação C++ e os experimentos computacionais foram realizados sobre instâncias disponibilizadas na biblioteca TSPLIB, tornando possível observar que os procedimentos propostos alcançaram êxito nos testes realizados
  • Carregando...
    Imagem de Miniatura
    Tese
    Aprendizagem por reforço profundo uma nova perspectiva sobre o problema dos k-servos
    (Universidade Federal do Rio Grande do Norte, 2020-01-28) Lins, Ramon Augusto Sousa; Dória Neto, Adrião Duarte; ; ; Lima Júnior, Francisco Chagas de; ; Barreto, Guilherme de Alencar; ; Melo, Jorge Dantas de; ; Fernandes, Marcelo Augusto Costa; ; Souza, Samuel Xavier de;
    O problema dos k-servos em um grafo ponderado (ou espaço métrico) é definido pela necessidade de mover eficientemente k servos para atender uma sequência de requisições que surgem de maneira online em cada nó do grafo. Este é talvez o problema mais influente de computação online cuja solução continua em aberto servindo de abstração para diversas aplicações, como a compra e venda de moedas, reatribuição de processos em processamento paralelo para balanceamento de carga, serviços de transporte online, gerenciamento de sondas de produção de petróleo, dentre outros. Sua simplicidade conceitual contrasta com sua complexidade computacional que cresce exponencialmente com o aumento do número de nós e servos. Anteriormente a este trabalho, o algoritmo Q-learning foi utilizado na solução de pequenas instâncias do problema dos k-servos. A solução ficou restrita à pequenas dimensões do problema pois sua estrutura de armazenamento cresce exponencialmente com o aumento do número de nós e servos. Este problema, conhecido como maldição de dimensionalidade, torna ineficiente ou até impossibilita a execução do algoritmo para certas instâncias do problema. Para lidar com maiores dimensões, o Qlearning em conjunto com o algoritmo guloso foi aplicado a um número reduzido de nós separados por um processo de agrupamento (abordagem hierárquica). A política local obtida em cada agrupamento, em conjunto com a política gulosa, foi utilizada na formação de uma política global, abordando de maneira satisfatória grandes instâncias do problema. Os resultados foram comparados a importantes algoritmos da literatura, o Work function, o Harmonic e o guloso. As soluções até então propostas dão ênfase ao aumento do número de nós, porém se analisarmos o crescimento da estrutura de armazenamento definida por Cn,k ' O(nk), é possível perceber que o aumento do número de servos pode torná-la rapidamente limitada pelo problema da maldição da dimensionalidade. Para contornar esta barreira, o problema dos k-servos foi modelado como um problema de aprendizagem por reforço profundo cuja a função de valor estado-ação foi definida por uma rede neural perceptron de múltiplas camadas capaz de extrair as informações do ambiente a partir de imagens que codificam a dinâmica do problema. A aplicabilidade do algoritmo proposto foi ilustrada em um estudo de caso no qual diferentes configurações do problema foram consideradas. O comportamento dos agentes foi analisado durante a fase de treinamento e sua performance foi avaliada a partir de testes de desempenho que quantificaram a qualidade das políticas de deslocamento dos servos geradas. Os resultados obtidos fornecem uma visão promissora de sua utilização como solução alternativa ao problema dos k-servos.
  • Carregando...
    Imagem de Miniatura
    Dissertação
    Classificação de padrões através de um comitê de máquinas aprimorado por aprendizagem por reforço
    (Universidade Federal do Rio Grande do Norte, 2012-08-13) Lima, Naiyan Hari Cândido; Melo, Jorge Dantas de; ; http://lattes.cnpq.br/7325007451912598; ; http://lattes.cnpq.br/8241420490601784; Dória Neto, Adrião Duarte; ; http://lattes.cnpq.br/1987295209521433; Martins, Allan de Medeiros; ; http://lattes.cnpq.br/4402694969508077; Lima Júnior, Francisco Chagas de;
    A aprendizagem por reforço é uma técnica de aprendizado de máquina que, embora já tenha encontrado uma grande quantidade de aplicações, talvez ainda não tenha alcançado seu pleno potencial. Uma das possibilidades que não foi devidamente testada até hoje foi a utilização da aprendizagem por reforço em conjunto com outros métodos para a solução de problemas de classificação de padrões. É bem documentada na literatura a problemática que ensembles de máquinas de vetor de suporte encontram em termos de capacidade de generalização. Algoritmos como Adaboost não lidam apropriadamente com os desequilíbrios que podem surgir nessas situações. Várias alternativas já foram propostas, com margens variadas de sucesso. Esta dissertação apresenta uma nova abordagem para a construção de comitês de máquinas de vetor de suporte. O algoritmo apresentado combina o algoritmo Adaboost com uma camada de aprendizagem por reforço, para ajustar parâmetros do comitê evitando que desequilíbrios nos classificadores componentes do comitê prejudiquem o desempenho de generalização da hipótese final. Foram efetuadas comparações de comitês com e sem essa camada adicional de aprendizagem por reforço, testando conjuntos de dados benchmarks amplamente conhecidos na área de classificação de padrões
  • Carregando...
    Imagem de Miniatura
    Tese
    Controlador em Modo Dual Adaptativo Robusto Indireto (IDMARC)
    (2016-07-27) Teixeira, Leonardo Rodrigues de Lima; Araújo, Aldayr Dantas de; ; http://lattes.cnpq.br/3165031680223608; ; http://lattes.cnpq.br/8435923730992064; Martins, Allan de Medeiros; ; http://lattes.cnpq.br/4402694969508077; Cunha, Caio Dorneles; ; http://lattes.cnpq.br/2348572465951605; Oliveira, Josenalde Barbosa de; ; http://lattes.cnpq.br/0503501772199456; Lima Júnior, Francisco Chagas de; ; http://lattes.cnpq.br/9342041276186254; Paiva, José Álvaro de; ; http://lattes.cnpq.br/6136888701626547
    Neste trabalho, é proposto o Controlador em Modo Dual Adaptativo Robusto Indireto (IDMARC), o qual une as boas características transitórias e de robustez típicas dos Sistemas a Estrutura Variável, mais especificamente do Controlador Adaptativo por Modelo de Referência e Estrutura Variável Indireto (IVS-MRAC), com um sinal de controle suave em regime permanente, típico dos Controladores Adaptativos convencionais, como o Controlador Adaptativo por Modelo de Referência Indireto (IMRAC). Por fazer uso da abordagem indireta, ele proporciona uma maneira mais intuitiva de realizar o projeto do controlador, baseado nos parâmetros físicos da planta, tais como: resistências, momentos de inércia, capacitâncias, dentre outros. Análises de estabilidade, baseadas na Teoria de Lyapunov, são apresentadas tanto para o caso ideal quanto considerando perturbação limitada na entrada da planta, além de resultados de simulação. Adicionalmente, neste trabalho também é proposto o Controlador Adaptativo Binário por Modelo de Referência Indireto (IB-MRAC), o qual foi precursor da ideia de um controlador que pode atuar tanto como IMRAC quanto como IVS-MRAC, a partir de ganhos adaptativos fixos definidos na fase de projeto.
  • Carregando...
    Imagem de Miniatura
    Tese
    Controle com adaptação em modo dual utilizando uma rede RBF
    (2016-09-01) Oliveira, Odailson Cavalcante de; Araújo, Aldayr Dantas de; Martins, Allan de Medeiros; ; http://lattes.cnpq.br/4402694969508077; ; http://lattes.cnpq.br/3165031680223608; ; http://lattes.cnpq.br/2051284839389590; Cunha, Caio Dorneles; ; http://lattes.cnpq.br/2348572465951605; Oliveira, Josenalde Barbosa de; ; http://lattes.cnpq.br/0503501772199456; Lima Júnior, Francisco Chagas de; ; http://lattes.cnpq.br/9342041276186254; Paiva, José Álvaro de; ; http://lattes.cnpq.br/6136888701626547
    Neste trabalho será apresentada uma estratégia de controle utilizando uma rede com funções de base radial (rede RBF) com adaptação em modo dual. O objetivo da estratégia é utilizar a capacidade aproximativa da rede RBF no controle de sistemas não-lineares desconhecidos, ou conhecidos com incertezas. O controle proposto utiliza a estrutura do Controle Adaptativo por Modelo de Referência (MRAC) e uma rede RBF cujos parâmetros são ajustados em tempo real através de uma adaptação em modo dual, o que permitirá um rápido transitório e um sinal de controle suave em regime permanente. A adaptação em modo dual dos parâmetros da rede RBF é feita usando a função tangente hiperbólica, que durante o transitório proporcionará um comportamento similar ao controle por estrutura variável, e durante o regime permanente atuarão as leis integrais do MRAC reguladas pela função secante hiperbólica. A tangente hiperbólica é usada no lugar da função sinal das leis chaveadas para reduzir o fenômeno de chattering. A função secante hiperbólica é usada para regular a lei integral, aumentando seu efeito em regime permanente e reduzindo durante o transitório, evitando oscilações na resposta do sistema. Serão apresentadas uma prova de estabilidade baseada na teoria de Lyapunov para a rede RBF em modo dual e comparações através de simulações.
  • Carregando...
    Imagem de Miniatura
    Dissertação
    Estratégia de navegação com planejamento dinâmico e algoritmo genético aplicada a robôs móveis terrestres
    (Universidade Federal do Rio Grande do Norte, 2015-12-07) Oliveira, Átila Varela Ferreira Medeiros de; Fernandes, Marcelo Augusto Costa; ; http://lattes.cnpq.br/3475337353676349; ; http://lattes.cnpq.br/0397477233335767; Dória Neto, Adrião Duarte; ; http://lattes.cnpq.br/1987295209521433; Pedrosa, Diogo Pinheiro Fernandes; ; http://lattes.cnpq.br/3276436982330644; Lima Júnior, Francisco Chagas de; ; http://lattes.cnpq.br/9342041276186254
    Este trabalho propõe uma nova estratégia de navegação autônoma assistida por algoritmo genético com planejamento dinâmico para robôs móveis terrestres, chamada DPNA-GA (Dynamic Planning Navigation Algorithm optimized with Genetic Algorithm). A estratégia foi aplicada em ambientes - tanto estáticos, quanto dinâmicos - nos quais a localização e o formato dos obstáculos não são previamente conhecidos. A cada evento de deslocamento, uma nova rota é planejada através de um algoritmo que minimiza a distância entre o robô e o objetivo e maximiza a distância em relação aos obstáculos. Utilizando um sensor de localização espacial e um conjunto de sensores de distância, a estratégia de navegação proposta foi capaz de planejar dinamicamente percursos ótimos livres de colisão. Simulações realizadas em diferentes ambientes demostraram que a técnica fornece um alto grau de flexibilidade e robustez. Para isso, foram aplicadas diversas variações de parâmetros genéticos, tais como: taxa de cruzamento, tamanho da população, dentre outros. Finalmente, os resultados das simulações demonstram satisfatoriamente a eficácia e robustez da técnica DPNA-GA, validando-a para aplicações reais em robôs móveis terrestres.
  • Carregando...
    Imagem de Miniatura
    Tese
    Estratégias de busca reativa utilizando aprendizagem por reforço e algoritmos de busca local
    (Universidade Federal do Rio Grande do Norte, 2014-09-12) Santos, João Paulo Queiroz dos; Melo, Jorge Dantas de; ; http://lattes.cnpq.br/7325007451912598; ; http://lattes.cnpq.br/2413250851590746; Dória Neto, Adrião Duarte; ; http://lattes.cnpq.br/1987295209521433; Aloise, Daniel; ; http://lattes.cnpq.br/5093210888872414; Aloise, Dario José; ; http://lattes.cnpq.br/7266011798625538; Lima Júnior, Francisco Chagas de; ; http://lattes.cnpq.br/9342041276186254; Cavalcanti, George Darmiton da Cunha; ; http://lattes.cnpq.br/8577312109146354
    Técnicas de otimização conhecidas como as metaheurísticas tem conseguido resolversatisfatoriamente problemas conhecidos, mas desenvolvimento das metaheurísticas écaracterizado por escolha de parâmetros para sua execução, na qual a opção apropriadadestes parâmetros (valores). Onde o ajuste de parâmetro é essencial testa-se os parâmetrosaté que resultados viáveis sejam obtidos, normalmente feita pelo desenvolvedor que estaimplementando a metaheuristica. A qualidade dos resultados de uma instância1 de testenão será transferida para outras instâncias a serem testadas e seu feedback pode requererum processo lento de “tentativa e erro” onde o algoritmo têm que ser ajustado para umaaplicação especifica. Diante deste contexto das metaheurísticas surgiu a Busca Reativaque defende a integração entre o aprendizado de máquina dentro de buscas heurísticaspara solucionar problemas de otimização complexos. A partir da integração que a BuscaReativa propõe entre o aprendizado de máquina e as metaheurísticas, surgiu a ideia dese colocar a Aprendizagem por Reforço mais especificamente o algoritmo Q-learning deforma reativa, para selecionar qual busca local é a mais indicada em determinado instanteda busca, para suceder uma outra busca local que não pode mais melhorar a soluçãocorrente na metaheurística VNS. Assim, neste trabalho propomos uma implementação reativa,utilizando aprendizado por reforço para o auto-tuning do algoritmo implementado,aplicado ao problema do caixeiro viajante simétrico e ao problema escalonamento sondaspara manutenção de poços.
  • Carregando...
    Imagem de Miniatura
    Tese
    Um método para o cálculo da inversa de matrizes em blocos com uso limitado de memória
    (2018-05-04) Cosme, Iria Caline Saraiva; Souza, Samuel Xavier de; ; ; Doria Neto, Adrião Duarte; ; Aloise, Daniel; ; Oliveira, Luiz Affonso Henderson Guedes de; ; Oliveira, Aurelio Ribeiro Leite de; ; Lima Júnior, Francisco Chagas de;
    A inversão de matrizes de ordem extremamente alta tem sido uma tarefa desafiadora devido ao processamento e à capacidade de memória limitados dos computadores convencionais. Em um cenário em que os dados não cabem na memória, é oportuno considerar a troca de mais tempo de processamento por menos uso de memória para permitir a computação da inversa matricial, o que seria proibitivo de outra forma. Sendo assim, este trabalho apresenta um novo algoritmo para o cálculo da inversa de matrizes particionadas em blocos com uso reduzido de memória. O algoritmo funciona de forma recursiva para inverter um bloco de uma matriz Mk×k , com k ≥ 2, com base na divisão de M, sucessivamente, em matrizes de menor ordem. Este algoritmo, denominado BRI (do inglês, Block Recursive Inversion), calcula um bloco da matriz inversa por vez para limitar o uso da memória durante todo o processamento. Considerando que o baixo consumo de memória, proporcionado pelo BRI, é contrabalanceado por um maior tempo de processamento, este trabalho também discorre sobre uma implementação paralela, em OpenMP, do algoritmo a fim de reduzir o tempo de processamento e ampliar sua aplicabilidade. Além disso, uma melhoria no algoritmo sequencial é proposta. Como aplicação prática, o algoritmo proposto foi utilizado no processo de validação cruzada para Máquinas de Vetor de Suporte por Mínimos Quadrados (LS-SVM, do inglês, Least Squares Support Vector Machines). Este procedimento computacional utiliza o cálculo da matriz inversa para encontrar os rótulos esperados das amostras de testes na validação cruzada. Os resultados experimentais com o BRI demonstraram que, apesar do aumento da complexidade computacional, matrizes, que de outra forma excederiam o limite de uso da memória, podem ser invertidas usando esta técnica.
  • Carregando...
    Imagem de Miniatura
    Tese
    Órbita Perpétua e outras técnicas de otimização global robusta para os algoritmos Simulated Annealing Acoplado e Nelder-Mead
    (2018-06-28) Silva, Kayo Gonçalves e; Souza, Samuel Xavier de; ; ; Bianchini, Calebe de Paula; ; Lima Júnior, Francisco Chagas de; ; Lucena, Liacir dos Santos; ; Medeiros Júnior, Manoel Firmino de;
    As metaheurísticas são algoritmos cuja estratégia visa reduzir o custo computacional em detrimento da qualidade ótima das soluções. Elas são amplamente utilizadas para aproximar soluções de problemas de otimização computacionalmente intratáveis. Embora tipicamente de implementação simples, algumas metaheurísticas sofrem por não possuírem robustez quanto à sintonização de alguns parâmetros de inicialização, o que demanda um processo de tentativa de valoração muito oneroso devido à sua natureza empírica. Neste trabalho, apresentamos algumas soluções para esse problema propondo três novas metaheurísticas baseadas nas abordagens livres de parâmetro, menos é mais (LIMA) e paralelas, que visam tornar robusto algumas metaheurísticas. Como resultados, os algoritmos Nelder-Mead Simplificado (SNM), o Simulated Annealing Acoplado Síncrono (SCSA) e Assíncrono (ACSA), e o Simulated Annealing Acoplado com Órbita Perpétua (PO-CSA) foram propostos. O SNM é o resultado da abordagem LIMA ao método Nelder-Mead (NM). Além de sua implementação possuir muito menos pontos que o algoritmo original, sua capacidade de realizar vários passos simples o torna capaz de encontrar melhores resultados do que o NM original mesmo para funções não convexas. O SCSA e ACSA são implementações paralelas do Simulated Annealing Acoplado (CSA) que permitem ao usuário a escolha eficiente de uma ou outra versão baseado no tamanho do problema e no número de otimizadores. A técnica Órbita Perpétua (PO) foi desenvolvida no intuito de controlar a temperatura de geração do CSA para torná-lo livre de parâmetros de inicialização. O PO-CSA aproveita a técnica PO combinada com o escalonamento automático quase-ótimo da temperatura de aceitação do CSA para tornar a otimização do CSA mais robusta com relação aos parâmetros de inicialização. Enquanto que o PO-CSA tem melhor desempenho do que os algoritmos de referência para a maioria das funções objetivo, tanto em qualidade de solução como em tempo de execução, seu controle da temperatura de geração também se mostrou mais efetivo do que o CSA original com parâmetros de inicialização ajustados exaustivamente.
  • Carregando...
    Imagem de Miniatura
    Dissertação
    Otimização de escalas de serviço de tripulações estudo de caso em uma empresa de transporte urbano na região metropolitana de Natal/RN
    (Universidade Federal do Rio Grande do Norte, 2012-06-25) Rocha, Miriam Karla; Aloise, Dario José; ; http://lattes.cnpq.br/7266011798625538; ; http://lattes.cnpq.br/1389310423761626; Leite, Laura Silvia Bahiense da Silva; ; http://lattes.cnpq.br/2291334095539768; Lima Júnior, Francisco Chagas de;
    Este trabalho tem por objetivo construir escalas de serviços de tripulações de ônibus urbano de forma a minimizar o custo com horas extras. Para tanto desenvolveu-se um modelo matemático por meio de um estudo de caso em uma empresa de transporte urbano na região metropolitana de Natal. Este problema, de uma maneira geral, é conhecido na literatura como Problema de Programação de Tripulação (PPT) e classificado como NP-difícil. A programação matemática contempla restrições tais como: realização de todas as viagens, jornada diária máxima permitida e intervalo de repouso e/ou alimentação. Foi utilizado o aplicativo Xpress-MP para implementar e validar o modelo proposto. Para as instâncias testadas o modelo apresentou uma redução da hora extra entre 38% e 84%.
  • Carregando...
    Imagem de Miniatura
    Dissertação
    Predição não-linear de curvas de produção de petróleo via redes neurais recursivas
    (Universidade Federal do Rio Grande do Norte, 2010-01-27) Araújo Júnior, Aldayr Dantas de; Dória Neto, Adrião Duarte; ; http://lattes.cnpq.br/1987295209521433; ; http://lattes.cnpq.br/3689675071475525; Mata, Wilson da; ; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781404Z6; Melo, Jorge Dantas de; ; http://lattes.cnpq.br/7325007451912598; Lima Júnior, Francisco Chagas de;
    Uma das atividades essenciais na engenharia de petroleo e a estimativa de producao de oleo existente nas reservas petroliferas. O calculo dessas reservas e crucial para a determinação da viabilidade economica de sua explotacao. Atualmente, a industria do petroleo tem se deparado com problemas para analisar a producao enquanto facilidades operacionais disponibilizam um volume de informacoes que crescem exponencialmente. Tecnicas convencionais de modelagem de reservatorios como simulacao matematica e visualizacao estao bem desenvolvidas e disponiveis. A proposta deste trabalho e o uso de tecnicas inteligentes, como as redes neurais artificiais, para a predicao de producao de petroleo e comparar seus resultados com os obtidos pela simulacao numerica, metodo bastante utilizado na pratica para a realizacao de predicao do comportamento da producao de petroleo. As redes neurais artificiais serao usadas devido a sua capacidade de aprendizado, adaptacao e interpolacao
  • Carregando...
    Imagem de Miniatura
    Tese
    Técnicas de conformação de feixe em arranjo de antenas utilizando aprendizagem por reforço
    (Universidade Federal do Rio Grande do Norte, 2015-06-19) Almeida, Nathalee Cavalcante de; Dória Neto, Adrião Duarte; Fernandes, Marcelo Augusto Costa; ; http://lattes.cnpq.br/3475337353676349; ; http://lattes.cnpq.br/1987295209521433; ; Silva, José Patrocínio da; ; http://lattes.cnpq.br/5753289728835624; Melo, Jorge Dantas de; ; http://lattes.cnpq.br/7325007451912598; Cardoso, Fabbryccio Akkazzha Chaves Machado; ; http://lattes.cnpq.br/7415386096240061; Lima Júnior, Francisco Chagas de; ; http://lattes.cnpq.br/9342041276186254
    A conformação de feixe, também conhecida como beamforming, é uma técnica bastante utilizada em diversas áreas. Com o auxílio de um arranjo de antenas, a conformação de feixe tem como objetivo minimizar sinais interferentes de direções desconhecidas e capturar um sinal desejado de uma direção específica. Nesta tese são propostas técnicas de conformação de feixe utilizando Aprendizagem por Reforço (AR) através do algoritmo Q-Learning, em arranjo de antenas. Uma das propostas é utilizar AR para encontrar a política ótima de seleção entre a conformação de feixe (CF) e o controle de potência (CP) a fim de aproveitar melhor as características individuais de cada uma delas para um determinado valor de Relação Sinal-Ruído Interferente (SINR). Outra proposta é utilizar AR na determinação da política ótima para comutação dos algoritmos de conformação cega de feixes, Algoritmo do Módulo Constante (CMA) e o algoritmo de Decisão Direta (DD) em ambientes com multipercurso. Através de simulações destas propostas foi possível concluir que a AR pode ser eficaz para implementar uma política de comutação entre diferentes técnicas buscando aproveitar características positivas de cada uma delas.
Repositório Institucional - UFRN Campus Universitário Lagoa NovaCEP 59078-970 Caixa postal 1524 Natal/RN - BrasilUniversidade Federal do Rio Grande do Norte© Copyright 2025. Todos os direitos reservados.
Contato+55 (84) 3342-2260 - R232Setor de Repositórios Digitaisrepositorio@bczm.ufrn.br
DSpaceIBICT
OasisBR
LAReferencia
Customizado pela CAT - BCZM