ELSA - Expanded Latent Space Autoencoder Architecture for Feature Extraction: a case study application to Covid-19 time series forecasting
dc.contributor.advisor | Gonçalves, Luiz Marcos Garcia | |
dc.contributor.advisorID | https://orcid.org/0000-0002-7735-5630 | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/1562357566810393 | pt_BR |
dc.contributor.author | Oliveira, Emerson Vilar de | |
dc.contributor.authorLattes | http://lattes.cnpq.br/8790940901329225 | pt_BR |
dc.contributor.referees1 | Oliveira, Luiz Affonso Henderson Guedes de | |
dc.contributor.referees1ID | https://orcid.org/0000-0003-2690-1563 | pt_BR |
dc.contributor.referees1Lattes | http://lattes.cnpq.br/7987212907837941 | pt_BR |
dc.contributor.referees2 | Silva Júnior, Andouglas Gonçalves da | |
dc.contributor.referees3 | Santos, Davi Henrique dos | |
dc.contributor.referees4 | Aroca, Rafael Vidal | |
dc.date.accessioned | 2025-02-13T17:54:28Z | |
dc.date.available | 2025-02-13T17:54:28Z | |
dc.date.issued | 2024-09-20 | |
dc.description.abstract | The global SARS-CoV-2 pandemics compelled governments, institutions, and researchers to assess its impact and develop strategies based on general indicators to achieve the most accurate predictions possible, in order to help managers mitigating its effect. While known epidemiological models were naturally used, they often produced uncertain forecasts due to insufficient or missing data. In addition to data limitation, various machine-learning models such as random forests, support vector regression, LSTM, auto-encoders, and traditional time-series models like Prophet and ARIMA—were employed, yielding impressive yet somewhat limited results. Some of these methods struggle with precision when handling multi-variable inputs, which are crucial for problems like pandemics time series prediction that require both short- and long-term forecasting. In response to this challenge, we propose a novel approach for time-series prediction that utilizes a stacked auto-encoder structure. Our model uses n internal autoencoders to process the input and generate different latent spaces for this respective input. Then these different latent spaces are concatenated and the expanded latent space is obtained. We conducted an experiment using previously published data series on COVID-19 cases, deaths, temperature, humidity, and the air quality index (AQI) in São Paulo City, Brazil. This experiment assessed the suitability of our model for short-, medium-, and long-term forecasting. Furthermore, we directly compared our proposed model with two existing works in the literature that have already undergone expert scrutiny. The first comparison places our model among those that use one network for feature extraction and another for predicting the pandemic trends. The second comparison highlights our model’s effectiveness in multi-series forecasting of pandemic indicators. The results suggest that our proposed model possesses strong capabilities in both feature extraction and multi-series forecasting, offering improvements over the two comparison works. Finally, the model demonstrates promising forecasting accuracy and versatility across datasets of varying lengths, making it a standout option for time-series forecasting tasks. | pt_BR |
dc.description.resumo | A pandemia global de SARS-CoV-2 levou governos, instituições e pesquisadores a avaliar seu impacto e a desenvolver estratégias baseadas em indicadores gerais para alcançar as previsões mais precisas possíveis. Embora os modelos epidemiológicos tenham sido amplamente utilizados, eles frequentemente geravam previsões incertas devido a dados insuficientes ou ausentes. Além das limitações de dados, diversos modelos de aprendizado de máquina, como florestas aleatórias, regressão por vetores de suporte, LSTM, autoencoders e modelos tradicionais de séries temporais, como Prophet e ARIMA, foram empregados, resultando em desempenhos impressionantes, mas com algumas limitações. Alguns desses métodos enfrentam dificuldades de precisão ao lidar com entradas multivariadas, o que é crucial para problemas como a previsão de séries temporais em pandemias, que exigem previsões de curto e longo prazo. Em resposta a esse desafio, propomos uma abordagem inovadora para a previsão de séries temporais que utiliza uma estrutura de autoencoder empilhado. Nosso modelo utiliza n autoencoders internos para processar as entradas e gerar diferentes espaços latentes para essas respectivas entradas. Em seguida, esses diferentes espaços latentes são concatenados e o espaço latente expandido é obtido. Conduzimos um experimento usando um conjunto de series previamente publicados sobre casos de COVID-19, mortes, temperatura, umidade e índice de qualidade do ar (IQAr) na cidade de São Paulo, Brasil. Esse experimento avaliou a adequação do nosso modelo para previsões de curto, médio e longo prazo. Além disso, comparamos diretamente nosso modelo proposto com dois trabalhos existentes na literatura que já passaram pelo escrutínio de especialistas. A primeira comparação posiciona nosso modelo entre aqueles que utilizam uma rede para extração de características e outra para prever tendências da pandemia. A segunda comparação destaca a eficácia do nosso modelo na previsão de múltiplas séries de indicadores pandêmicos. Os resultados sugerem que o modelo proposto possui fortes capacidades tanto na extração de características quanto na previsão de múltiplas séries, oferecendo melhorias em relação aos dois trabalhos comparados. Finalmente, o modelo demonstra uma precisão promissora em previsões e versatilidade em conjuntos de dados de diferentes tamanhos, tornando-se uma opção destacada para tarefas de previsão de séries temporais. | pt_BR |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES | pt_BR |
dc.identifier.citation | OLIVEIRA, Emerson Vilar de. ELSA - Expanded Latent Space Autoencoder Architecture for Feature Extraction: a case study application to Covid-19 time series forecasting. Orientador: Dr. Luiz Marcos Garcia Gonçalves. 2024. 104f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2024. | pt_BR |
dc.identifier.uri | https://repositorio.ufrn.br/handle/123456789/62690 | |
dc.language | pt_BR | pt_BR |
dc.publisher | Universidade Federal do Rio Grande do Norte | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.initials | UFRN | pt_BR |
dc.publisher.program | PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Redes neurais artificiais | pt_BR |
dc.subject | Autoencoder | pt_BR |
dc.subject | Autoencoders empilhados | pt_BR |
dc.subject | SARS-CoV-2 | pt_BR |
dc.subject | Séries temporais | pt_BR |
dc.subject | Espaço latente | pt_BR |
dc.subject.cnpq | CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA | pt_BR |
dc.title | ELSA - Expanded Latent Space Autoencoder Architecture for Feature Extraction: a case study application to Covid-19 time series forecasting | pt_BR |
dc.type | doctoralThesis | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- ELSAExpandedLatent_Oliveira_2024.pdf
- Tamanho:
- 1.16 MB
- Formato:
- Adobe Portable Document Format
Nenhuma Miniatura disponível