Uma contribuição à solução do problema dos k-servos usando aprendizagem por reforço

Lima Júnior, Manoel Leandro de

Uma contribuição à solução do problema dos k-servos usando aprendizagem por reforço

Página do item simplificado Estatísticas

dc.contributor.advisor	Melo, Jorge Dantas de	pt_BR
dc.contributor.advisor-co1	Dória Neto, Adrião Duarte	pt_BR
dc.contributor.advisor-co1ID		por
dc.contributor.advisor-co1Lattes	http://lattes.cnpq.br/1987295209521433	por
dc.contributor.advisorID		por
dc.contributor.advisorLattes	http://lattes.cnpq.br/7325007451912598	por
dc.contributor.author	Lima Júnior, Manoel Leandro de	pt_BR
dc.contributor.authorID		por
dc.contributor.referees1	Aloise, Dario José	pt_BR
dc.contributor.referees1ID		por
dc.contributor.referees1Lattes	http://lattes.cnpq.br/7266011798625538	por
dc.contributor.referees2	Medeiros Júnior, Manoel Firmino de	pt_BR
dc.contributor.referees2ID		por
dc.contributor.referees2Lattes	http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781378J1	por
dc.date.accessioned	2014-12-17T14:55:59Z
dc.date.available	2007-02-12	pt_BR
dc.date.available	2014-12-17T14:55:59Z
dc.date.issued	2005-04-06	pt_BR
dc.description.resumo	Neste trabalho é proposto um novo algoritmo online para o resolver o Problema dos k-Servos (PKS). O desempenho desta solução é comparado com o de outros algoritmos existentes na literatura, a saber, os algoritmos Harmonic e Work Function, que mostraram ser competitivos, tornando-os parâmetros de comparação significativos. Um algoritmo que apresente desempenho eficiente em relação aos mesmos tende a ser competitivo também, devendo, obviamente, se provar o referido fato. Tal prova, entretanto, foge aos objetivos do presente trabalho. O algoritmo apresentado para a solução do PKS é baseado em técnicas de aprendizagem por reforço. Para tanto, o problema foi modelado como um processo de decisão em múltiplas etapas, ao qual é aplicado o algoritmo Q-Learning, um dos métodos de solução mais populares para o estabelecimento de políticas ótimas neste tipo de problema de decisão. Entretanto, deve-se observar que a dimensão da estrutura de armazenamento utilizada pela aprendizagem por reforço para se obter a política ótima cresce em função do número de estados e de ações, que por sua vez é proporcional ao número n de nós e k de servos. Ao se analisar esse crescimento (matematicamente, ) percebe-se que o mesmo ocorre de maneira exponencial, limitando a aplicação do método a problemas de menor porte, onde o número de nós e de servos é reduzido. Este problema, denominado maldição da dimensionalidade, foi introduzido por Belmann e implica na impossibilidade de execução de um algoritmo para certas instâncias de um problema pelo esgotamento de recursos computacionais para obtenção de sua saída. De modo a evitar que a solução proposta, baseada exclusivamente na aprendizagem por reforço, seja restrita a aplicações de menor porte, propõe-se uma solução alternativa para problemas mais realistas, que envolvam um número maior de nós e de servos. Esta solução alternativa é hierarquizada e utiliza dois métodos de solução do PKS: a aprendizagem por reforço, aplicada a um número reduzido de nós obtidos a partir de um processo de agregação, e um método guloso, aplicado aos subconjuntos de nós resultantes do processo de agregação, onde o critério de escolha do agendamento dos servos é baseado na menor distância ao local de demanda	por
dc.format	application/pdf	por
dc.identifier.citation	LIMA JÚNIOR, Manoel Leandro de. Uma contribuição à solução do problema dos k-servos usando aprendizagem por reforço. 2005. 96 f. Dissertação (Mestrado em Automação e Sistemas; Engenharia de Computação; Telecomunicações) - Universidade Federal do Rio Grande do Norte, Natal, 2005.	por
dc.identifier.uri	https://repositorio.ufrn.br/jspui/handle/123456789/15405
dc.language	por	por
dc.publisher	Universidade Federal do Rio Grande do Norte	por
dc.publisher.country	BR	por
dc.publisher.department	Automação e Sistemas; Engenharia de Computação; Telecomunicações	por
dc.publisher.initials	UFRN	por
dc.publisher.program	Programa de Pós-Graduação em Engenharia Elétrica	por
dc.rights	Acesso Aberto	por
dc.subject	K-Servos	por
dc.subject	Aprendizado por Reforço	por
dc.subject	Q-Learning	por
dc.subject	K-Servos	eng
dc.subject	Reinforcement Learning	eng
dc.subject	Q-Learning	eng
dc.subject.cnpq	CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA	por
dc.title	Uma contribuição à solução do problema dos k-servos usando aprendizagem por reforço	por
dc.type	masterThesis	por

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: ManoelLJ.pdf
Tamanho:: 463.49 KB
Formato:: Adobe Portable Document Format

Baixar

Coleções

PPGEE - Mestrado em Engenharia Elétrica e de Computação

SIGAA

Uma contribuição à solução do problema dos k-servos usando aprendizagem por reforço

Arquivos

Pacote Original

Coleções