Uma contribuição à solução do problema dos k-servos usando aprendizagem por reforço
dc.contributor.advisor | Melo, Jorge Dantas de | pt_BR |
dc.contributor.advisor-co1 | Dória Neto, Adrião Duarte | pt_BR |
dc.contributor.advisor-co1ID | por | |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/1987295209521433 | por |
dc.contributor.advisorID | por | |
dc.contributor.advisorLattes | http://lattes.cnpq.br/7325007451912598 | por |
dc.contributor.author | Lima Júnior, Manoel Leandro de | pt_BR |
dc.contributor.authorID | por | |
dc.contributor.referees1 | Aloise, Dario José | pt_BR |
dc.contributor.referees1ID | por | |
dc.contributor.referees1Lattes | http://lattes.cnpq.br/7266011798625538 | por |
dc.contributor.referees2 | Medeiros Júnior, Manoel Firmino de | pt_BR |
dc.contributor.referees2ID | por | |
dc.contributor.referees2Lattes | http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781378J1 | por |
dc.date.accessioned | 2014-12-17T14:55:59Z | |
dc.date.available | 2007-02-12 | pt_BR |
dc.date.available | 2014-12-17T14:55:59Z | |
dc.date.issued | 2005-04-06 | pt_BR |
dc.description.resumo | Neste trabalho é proposto um novo algoritmo online para o resolver o Problema dos k-Servos (PKS). O desempenho desta solução é comparado com o de outros algoritmos existentes na literatura, a saber, os algoritmos Harmonic e Work Function, que mostraram ser competitivos, tornando-os parâmetros de comparação significativos. Um algoritmo que apresente desempenho eficiente em relação aos mesmos tende a ser competitivo também, devendo, obviamente, se provar o referido fato. Tal prova, entretanto, foge aos objetivos do presente trabalho. O algoritmo apresentado para a solução do PKS é baseado em técnicas de aprendizagem por reforço. Para tanto, o problema foi modelado como um processo de decisão em múltiplas etapas, ao qual é aplicado o algoritmo Q-Learning, um dos métodos de solução mais populares para o estabelecimento de políticas ótimas neste tipo de problema de decisão. Entretanto, deve-se observar que a dimensão da estrutura de armazenamento utilizada pela aprendizagem por reforço para se obter a política ótima cresce em função do número de estados e de ações, que por sua vez é proporcional ao número n de nós e k de servos. Ao se analisar esse crescimento (matematicamente, ) percebe-se que o mesmo ocorre de maneira exponencial, limitando a aplicação do método a problemas de menor porte, onde o número de nós e de servos é reduzido. Este problema, denominado maldição da dimensionalidade, foi introduzido por Belmann e implica na impossibilidade de execução de um algoritmo para certas instâncias de um problema pelo esgotamento de recursos computacionais para obtenção de sua saída. De modo a evitar que a solução proposta, baseada exclusivamente na aprendizagem por reforço, seja restrita a aplicações de menor porte, propõe-se uma solução alternativa para problemas mais realistas, que envolvam um número maior de nós e de servos. Esta solução alternativa é hierarquizada e utiliza dois métodos de solução do PKS: a aprendizagem por reforço, aplicada a um número reduzido de nós obtidos a partir de um processo de agregação, e um método guloso, aplicado aos subconjuntos de nós resultantes do processo de agregação, onde o critério de escolha do agendamento dos servos é baseado na menor distância ao local de demanda | por |
dc.format | application/pdf | por |
dc.identifier.citation | LIMA JÚNIOR, Manoel Leandro de. Uma contribuição à solução do problema dos k-servos usando aprendizagem por reforço. 2005. 96 f. Dissertação (Mestrado em Automação e Sistemas; Engenharia de Computação; Telecomunicações) - Universidade Federal do Rio Grande do Norte, Natal, 2005. | por |
dc.identifier.uri | https://repositorio.ufrn.br/jspui/handle/123456789/15405 | |
dc.language | por | por |
dc.publisher | Universidade Federal do Rio Grande do Norte | por |
dc.publisher.country | BR | por |
dc.publisher.department | Automação e Sistemas; Engenharia de Computação; Telecomunicações | por |
dc.publisher.initials | UFRN | por |
dc.publisher.program | Programa de Pós-Graduação em Engenharia Elétrica | por |
dc.rights | Acesso Aberto | por |
dc.subject | K-Servos | por |
dc.subject | Aprendizado por Reforço | por |
dc.subject | Q-Learning | por |
dc.subject | K-Servos | eng |
dc.subject | Reinforcement Learning | eng |
dc.subject | Q-Learning | eng |
dc.subject.cnpq | CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA | por |
dc.title | Uma contribuição à solução do problema dos k-servos usando aprendizagem por reforço | por |
dc.type | masterThesis | por |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- ManoelLJ.pdf
- Tamanho:
- 463.49 KB
- Formato:
- Adobe Portable Document Format
Carregando...