ELSA - Expanded Latent Space Autoencoder Architecture for Feature Extraction: a case study application to Covid-19 time series forecasting

Oliveira, Emerson Vilar de

ELSA - Expanded Latent Space Autoencoder Architecture for Feature Extraction: a case study application to Covid-19 time series forecasting

Página do item simplificado Estatísticas

dc.contributor.advisor	Gonçalves, Luiz Marcos Garcia
dc.contributor.advisorID	https://orcid.org/0000-0002-7735-5630	pt_BR
dc.contributor.advisorLattes	http://lattes.cnpq.br/1562357566810393	pt_BR
dc.contributor.author	Oliveira, Emerson Vilar de
dc.contributor.authorLattes	http://lattes.cnpq.br/8790940901329225	pt_BR
dc.contributor.referees1	Oliveira, Luiz Affonso Henderson Guedes de
dc.contributor.referees1ID	https://orcid.org/0000-0003-2690-1563	pt_BR
dc.contributor.referees1Lattes	http://lattes.cnpq.br/7987212907837941	pt_BR
dc.contributor.referees2	Silva Júnior, Andouglas Gonçalves da
dc.contributor.referees3	Santos, Davi Henrique dos
dc.contributor.referees4	Aroca, Rafael Vidal
dc.date.accessioned	2025-02-13T17:54:28Z
dc.date.available	2025-02-13T17:54:28Z
dc.date.issued	2024-09-20
dc.description.abstract	The global SARS-CoV-2 pandemics compelled governments, institutions, and researchers to assess its impact and develop strategies based on general indicators to achieve the most accurate predictions possible, in order to help managers mitigating its effect. While known epidemiological models were naturally used, they often produced uncertain forecasts due to insufficient or missing data. In addition to data limitation, various machine-learning models such as random forests, support vector regression, LSTM, auto-encoders, and traditional time-series models like Prophet and ARIMA—were employed, yielding impressive yet somewhat limited results. Some of these methods struggle with precision when handling multi-variable inputs, which are crucial for problems like pandemics time series prediction that require both short- and long-term forecasting. In response to this challenge, we propose a novel approach for time-series prediction that utilizes a stacked auto-encoder structure. Our model uses n internal autoencoders to process the input and generate different latent spaces for this respective input. Then these different latent spaces are concatenated and the expanded latent space is obtained. We conducted an experiment using previously published data series on COVID-19 cases, deaths, temperature, humidity, and the air quality index (AQI) in São Paulo City, Brazil. This experiment assessed the suitability of our model for short-, medium-, and long-term forecasting. Furthermore, we directly compared our proposed model with two existing works in the literature that have already undergone expert scrutiny. The first comparison places our model among those that use one network for feature extraction and another for predicting the pandemic trends. The second comparison highlights our model’s effectiveness in multi-series forecasting of pandemic indicators. The results suggest that our proposed model possesses strong capabilities in both feature extraction and multi-series forecasting, offering improvements over the two comparison works. Finally, the model demonstrates promising forecasting accuracy and versatility across datasets of varying lengths, making it a standout option for time-series forecasting tasks.	pt_BR
dc.description.resumo	A pandemia global de SARS-CoV-2 levou governos, instituições e pesquisadores a avaliar seu impacto e a desenvolver estratégias baseadas em indicadores gerais para alcançar as previsões mais precisas possíveis. Embora os modelos epidemiológicos tenham sido amplamente utilizados, eles frequentemente geravam previsões incertas devido a dados insuficientes ou ausentes. Além das limitações de dados, diversos modelos de aprendizado de máquina, como florestas aleatórias, regressão por vetores de suporte, LSTM, autoencoders e modelos tradicionais de séries temporais, como Prophet e ARIMA, foram empregados, resultando em desempenhos impressionantes, mas com algumas limitações. Alguns desses métodos enfrentam dificuldades de precisão ao lidar com entradas multivariadas, o que é crucial para problemas como a previsão de séries temporais em pandemias, que exigem previsões de curto e longo prazo. Em resposta a esse desafio, propomos uma abordagem inovadora para a previsão de séries temporais que utiliza uma estrutura de autoencoder empilhado. Nosso modelo utiliza n autoencoders internos para processar as entradas e gerar diferentes espaços latentes para essas respectivas entradas. Em seguida, esses diferentes espaços latentes são concatenados e o espaço latente expandido é obtido. Conduzimos um experimento usando um conjunto de series previamente publicados sobre casos de COVID-19, mortes, temperatura, umidade e índice de qualidade do ar (IQAr) na cidade de São Paulo, Brasil. Esse experimento avaliou a adequação do nosso modelo para previsões de curto, médio e longo prazo. Além disso, comparamos diretamente nosso modelo proposto com dois trabalhos existentes na literatura que já passaram pelo escrutínio de especialistas. A primeira comparação posiciona nosso modelo entre aqueles que utilizam uma rede para extração de características e outra para prever tendências da pandemia. A segunda comparação destaca a eficácia do nosso modelo na previsão de múltiplas séries de indicadores pandêmicos. Os resultados sugerem que o modelo proposto possui fortes capacidades tanto na extração de características quanto na previsão de múltiplas séries, oferecendo melhorias em relação aos dois trabalhos comparados. Finalmente, o modelo demonstra uma precisão promissora em previsões e versatilidade em conjuntos de dados de diferentes tamanhos, tornando-se uma opção destacada para tarefas de previsão de séries temporais.	pt_BR
dc.description.sponsorship	Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES	pt_BR
dc.identifier.citation	OLIVEIRA, Emerson Vilar de. ELSA - Expanded Latent Space Autoencoder Architecture for Feature Extraction: a case study application to Covid-19 time series forecasting. Orientador: Dr. Luiz Marcos Garcia Gonçalves. 2024. 104f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2024.	pt_BR
dc.identifier.uri	https://repositorio.ufrn.br/handle/123456789/62690
dc.language	pt_BR	pt_BR
dc.publisher	Universidade Federal do Rio Grande do Norte	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.publisher.initials	UFRN	pt_BR
dc.publisher.program	PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	Redes neurais artificiais	pt_BR
dc.subject	Autoencoder	pt_BR
dc.subject	Autoencoders empilhados	pt_BR
dc.subject	SARS-CoV-2	pt_BR
dc.subject	Séries temporais	pt_BR
dc.subject	Espaço latente	pt_BR
dc.subject.cnpq	CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA	pt_BR
dc.title	ELSA - Expanded Latent Space Autoencoder Architecture for Feature Extraction: a case study application to Covid-19 time series forecasting	pt_BR
dc.type	doctoralThesis	pt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: ELSAExpandedLatent_Oliveira_2024.pdf
Tamanho:: 1.16 MB
Formato:: Adobe Portable Document Format

Baixar

Coleções

PPGEE - Doutorado em Engenharia Elétrica e de Computação

SIGAA

ELSA - Expanded Latent Space Autoencoder Architecture for Feature Extraction: a case study application to Covid-19 time series forecasting

Arquivos

Pacote Original

Coleções