ELSA - Expanded Latent Space Autoencoder Architecture for Feature Extraction: a case study application to Covid-19 time series forecasting

dc.contributor.advisorGonçalves, Luiz Marcos Garcia
dc.contributor.advisorIDhttps://orcid.org/0000-0002-7735-5630pt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/1562357566810393pt_BR
dc.contributor.authorOliveira, Emerson Vilar de
dc.contributor.authorLatteshttp://lattes.cnpq.br/8790940901329225pt_BR
dc.contributor.referees1Oliveira, Luiz Affonso Henderson Guedes de
dc.contributor.referees1IDhttps://orcid.org/0000-0003-2690-1563pt_BR
dc.contributor.referees1Latteshttp://lattes.cnpq.br/7987212907837941pt_BR
dc.contributor.referees2Silva Júnior, Andouglas Gonçalves da
dc.contributor.referees3Santos, Davi Henrique dos
dc.contributor.referees4Aroca, Rafael Vidal
dc.date.accessioned2025-02-13T17:54:28Z
dc.date.available2025-02-13T17:54:28Z
dc.date.issued2024-09-20
dc.description.abstractThe global SARS-CoV-2 pandemics compelled governments, institutions, and researchers to assess its impact and develop strategies based on general indicators to achieve the most accurate predictions possible, in order to help managers mitigating its effect. While known epidemiological models were naturally used, they often produced uncertain forecasts due to insufficient or missing data. In addition to data limitation, various machine-learning models such as random forests, support vector regression, LSTM, auto-encoders, and traditional time-series models like Prophet and ARIMA—were employed, yielding impressive yet somewhat limited results. Some of these methods struggle with precision when handling multi-variable inputs, which are crucial for problems like pandemics time series prediction that require both short- and long-term forecasting. In response to this challenge, we propose a novel approach for time-series prediction that utilizes a stacked auto-encoder structure. Our model uses n internal autoencoders to process the input and generate different latent spaces for this respective input. Then these different latent spaces are concatenated and the expanded latent space is obtained. We conducted an experiment using previously published data series on COVID-19 cases, deaths, temperature, humidity, and the air quality index (AQI) in São Paulo City, Brazil. This experiment assessed the suitability of our model for short-, medium-, and long-term forecasting. Furthermore, we directly compared our proposed model with two existing works in the literature that have already undergone expert scrutiny. The first comparison places our model among those that use one network for feature extraction and another for predicting the pandemic trends. The second comparison highlights our model’s effectiveness in multi-series forecasting of pandemic indicators. The results suggest that our proposed model possesses strong capabilities in both feature extraction and multi-series forecasting, offering improvements over the two comparison works. Finally, the model demonstrates promising forecasting accuracy and versatility across datasets of varying lengths, making it a standout option for time-series forecasting tasks.pt_BR
dc.description.resumoA pandemia global de SARS-CoV-2 levou governos, instituições e pesquisadores a avaliar seu impacto e a desenvolver estratégias baseadas em indicadores gerais para alcançar as previsões mais precisas possíveis. Embora os modelos epidemiológicos tenham sido amplamente utilizados, eles frequentemente geravam previsões incertas devido a dados insuficientes ou ausentes. Além das limitações de dados, diversos modelos de aprendizado de máquina, como florestas aleatórias, regressão por vetores de suporte, LSTM, autoencoders e modelos tradicionais de séries temporais, como Prophet e ARIMA, foram empregados, resultando em desempenhos impressionantes, mas com algumas limitações. Alguns desses métodos enfrentam dificuldades de precisão ao lidar com entradas multivariadas, o que é crucial para problemas como a previsão de séries temporais em pandemias, que exigem previsões de curto e longo prazo. Em resposta a esse desafio, propomos uma abordagem inovadora para a previsão de séries temporais que utiliza uma estrutura de autoencoder empilhado. Nosso modelo utiliza n autoencoders internos para processar as entradas e gerar diferentes espaços latentes para essas respectivas entradas. Em seguida, esses diferentes espaços latentes são concatenados e o espaço latente expandido é obtido. Conduzimos um experimento usando um conjunto de series previamente publicados sobre casos de COVID-19, mortes, temperatura, umidade e índice de qualidade do ar (IQAr) na cidade de São Paulo, Brasil. Esse experimento avaliou a adequação do nosso modelo para previsões de curto, médio e longo prazo. Além disso, comparamos diretamente nosso modelo proposto com dois trabalhos existentes na literatura que já passaram pelo escrutínio de especialistas. A primeira comparação posiciona nosso modelo entre aqueles que utilizam uma rede para extração de características e outra para prever tendências da pandemia. A segunda comparação destaca a eficácia do nosso modelo na previsão de múltiplas séries de indicadores pandêmicos. Os resultados sugerem que o modelo proposto possui fortes capacidades tanto na extração de características quanto na previsão de múltiplas séries, oferecendo melhorias em relação aos dois trabalhos comparados. Finalmente, o modelo demonstra uma precisão promissora em previsões e versatilidade em conjuntos de dados de diferentes tamanhos, tornando-se uma opção destacada para tarefas de previsão de séries temporais.pt_BR
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESpt_BR
dc.identifier.citationOLIVEIRA, Emerson Vilar de. ELSA - Expanded Latent Space Autoencoder Architecture for Feature Extraction: a case study application to Covid-19 time series forecasting. Orientador: Dr. Luiz Marcos Garcia Gonçalves. 2024. 104f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2024.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/62690
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectRedes neurais artificiaispt_BR
dc.subjectAutoencoderpt_BR
dc.subjectAutoencoders empilhadospt_BR
dc.subjectSARS-CoV-2pt_BR
dc.subjectSéries temporaispt_BR
dc.subjectEspaço latentept_BR
dc.subject.cnpqCNPQ::ENGENHARIAS::ENGENHARIA ELETRICApt_BR
dc.titleELSA - Expanded Latent Space Autoencoder Architecture for Feature Extraction: a case study application to Covid-19 time series forecastingpt_BR
dc.typedoctoralThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
ELSAExpandedLatent_Oliveira_2024.pdf
Tamanho:
1.16 MB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar