Uma abordagem utilizando aprendizagem por reforço hierárquica e computação paralela para o problema dos K-Servos

Costa, Mademerson Leandro da

Uma abordagem utilizando aprendizagem por reforço hierárquica e computação paralela para o problema dos K-Servos

Página do item simplificado Estatísticas

dc.contributor.advisor	Doria Neto, Adrião Duarte
dc.contributor.advisorLattes	http://lattes.cnpq.br/1987295209521433	pt_BR
dc.contributor.author	Costa, Mademerson Leandro da
dc.contributor.authorLattes	http://lattes.cnpq.br/9385856028870726	pt_BR
dc.contributor.referees1	Lima Júnior, Francisco Chagas de
dc.contributor.referees1Lattes	http://lattes.cnpq.br/9342041276186254	pt_BR
dc.contributor.referees1Lattes	http://lattes.cnpq.br/2413250851590746	pt_BR
dc.contributor.referees2	Santos, João Paulo Queiroz dos
dc.contributor.referees2Lattes	http://lattes.cnpq.br/7325007451912598	pt_BR
dc.contributor.referees3	Melo, Jorge Dantas de
dc.contributor.referees3Lattes	http://lattes.cnpq.br/9892239670106361	pt_BR
dc.contributor.referees4	Souza, Samuel Xavier de
dc.date.accessioned	2017-10-24T22:28:39Z
dc.date.available	2017-10-24T22:28:39Z
dc.date.issued	2017-06-09
dc.description.abstract	A metrical task system is an abstract model for a class of online optimization problems, including paging, access lists, industry oil problems such as the management of workover rigs and logistics in the production of offshore oil, the problem of K-Servos, among others. The use of reinforcement learning to solving these problems, although proved to be efective, is restricted to a simple class of problems due to the curse of dimensionality inherent to the method. This work presents a solution that uses reinforcement learning based on hierarchical decomposition techniques and parallel computing to solve optimization problems in metric spaces. The use of these techniques allowed to extend the applicability of the method to more complex problems, bypassing the restriction of its use to smaller problems. As the size of the storage structure used by reinforcement learning to obtain the optimal policy grows as a function of the number of states and actions, which in turn is proportional to the number n of nodes and k of servers, it is noticed that their growth is given exponentially (𝐶𝑘𝑛≅𝑂(𝑛𝑘)). To circumvent this, the problem was modeled with a multi-step decision process where we initially used the k-means algorithm as a grouping method to decompose the problem into smaller subproblems. Then, the Q-learning algorithm was applied in the subgroups, aiming at achieving the best server displacement policy. In this step, the learning and storage processes in the subgroups were executed in parallel. In this way, the problem dimension and the total execution time of the algorithm were reduced, making possible the application of the proposed method to the large instances. The proposed approach presented better results when compared to the classical reinforcement learning and the greedy method. In addition to achieving speedup and efficiency gains in the evaluation of parallel performance metrics. Keywords— Metrical Task Systems, The K-Server Problem, Curse of Dimensionality, Hierarchical Reinforcement Learning, Q-Learning Algorithm, Parallel Computing.	pt_BR
dc.description.resumo	Um sistema de tarefas em espaços métricos é um modelo abstrato para uma classe de problemas de otimização online, incluindo o problema de paginação de memória, listas de acesso, problemas na indústria do petróleo como o gerenciamento de sondas de produção terrestre (workover rigs) e de logística na produção de petróleo offshore, o problema dos K-Servos, dentre outros. A utilização da aprendizagem por reforço na solução destes problemas, embora tenha se mostrado eficiente, está restrita a uma classe simples de problemas, devido à maldição da dimensionalidade inerente ao método. Neste trabalho, apresenta-se uma solução que utiliza a aprendizagem por reforço, baseada em técnicas de decomposição hierárquica e computação paralela para solução de problemas de otimização em espaços métricos, com o objetivo de estender a aplicabilidade do método a problemas complexos na indústria petrolífera, contornando a restrição da sua utilização a problemas teóricos de menor porte. A dimensão da estrutura de armazenamento utilizada pela aprendizagem por reforço para se obter a política ótima cresce em função do número de estados e de ações, sendo diretamente proporcional ao número n de nós e k de servos, fazendo com que o crescimento da complexidade do problema se dê de maneira exponencial (𝐶𝑘𝑛≅𝑂(𝑛𝑘)). Para contorná-lo, o problema foi modelado com um processo de decisão em múltiplas etapas onde inicialmente utilizamos o algoritmo k-means como método de agrupamento visando decompor o problema em subproblemas de menor dimensão. Em seguida foi aplicado o algoritmo Q-learning nos subgrupos buscando-se atingir a melhor política de deslocamento dos servos. Nesta etapa, foram utilizadas técnicas de computação paralela para que os processos de aprendizado e armazenamento nos subgrupos fossem executados de forma paralela. Desta forma, a dimensão do problema e o tempo total de execução do algoritmo foram reduzidos, viabilizando a aplicação do método proposto às grandes instâncias. A abordagem proposta apresentou melhores resultados quando comparada com a aprendizagem por reforço clássica e o método guloso. Além de ter atingido ganhos de speedup e eficiência na avaliação das métricas de desempenho paralelo.	pt_BR
dc.identifier.citation	COSTA, Mademerson Leandro da. Uma abordagem utilizando aprendizagem por reforço hierárquica e computação paralela para o problema dos K-Servos. 2017. 95f. Tese (Doutorado em Ciência e Engenharia de Petróleo) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2017.	pt_BR
dc.identifier.uri	https://repositorio.ufrn.br/jspui/handle/123456789/24149
dc.language	por	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.initials	UFRN	pt_BR
dc.publisher.program	PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA E ENGENHARIA DE PETRÓLEO	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	Aprendizagem por reforço hierárquica	pt_BR
dc.subject	Problemas de otimização em espaços métricos	pt_BR
dc.subject	Computação paralela	pt_BR
dc.subject.cnpq	CNPQ::ENGENHARIAS::ENGENHARIA QUIMICA::TECNOLOGIA QUIMICA::PETROLEO E PETROQUIMICA	pt_BR
dc.title	Uma abordagem utilizando aprendizagem por reforço hierárquica e computação paralela para o problema dos K-Servos	pt_BR
dc.type	doctoralThesis	pt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: AbordagemUtilizandoAprendizagem_Costa_2017.pdf
Tamanho:: 1.8 MB
Formato:: Adobe Portable Document Format

Baixar

Coleções

PPGCEP - Doutorado em Ciência e Engenharia do Petróleo

SIGAA

Uma abordagem utilizando aprendizagem por reforço hierárquica e computação paralela para o problema dos K-Servos

Arquivos

Pacote Original

Coleções