Uma análise exploratória de dados e o uso de aprendizado de máquina para classificação de doenças cardiovasculares

dc.contributor.advisorOliveira, Luiz Affonso Henderson Guedes De
dc.contributor.advisorIDhttps://orcid.org/0000-0003-2690-1563pt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/7987212907837941pt_BR
dc.contributor.authorSantos, Bruno Bruno Silva dos
dc.contributor.authorLatteshttp://lattes.cnpq.br/6151311030175220pt_BR
dc.contributor.referees1Santos, Mailson Ribeiro
dc.contributor.referees1Latteshttp://lattes.cnpq.br/7242148883405512pt_BR
dc.contributor.referees2Nunes, Yuri Thomas Pinheiro
dc.contributor.referees2IDhttps://orcid.org/0000-0003-0280-0346pt_BR
dc.contributor.referees2Latteshttp://lattes.cnpq.br/4965053749389598pt_BR
dc.date.accessioned2022-02-21T18:00:01Z
dc.date.available2022-02-21T18:00:01Z
dc.date.issued2022-01-11
dc.description.abstractThe purpose of this project is to show a study based on data science for the elaboration of an analysis regarding cardiovascular diseases (CVD). In addition, to identify causes that may influence an individual to acquire this type of disease. Based on patient data and predictive analysis, to identify the probability of future results of people with CVD, in order to help the health system to obtain a better prognosis regarding their patients. Using for that, previous data to perform a study, through artificial intelligence, to determine whether there is CVD in the patient. In particular, the work provides an exploratory data analysis (EDA) seeking to find correlations between the data studied and CVD, as well as the use of artificial intelligence (AI) with five classification algorithms for predicting cases of cardiovascular disease. The algorithms predict the risk of acquiring a cardiovascular disease based on previous information from a database collected from patients. The dataset used was obtained from the Kaggle repository, found from the IEEEDataPort platform, in which, based on the study, blood pressure, cholesterol, age and BMI were found to have a higher correlation between the risk of obtaining a cardiovascular disease. The results on the dataset using the machine learning technique obtained a better result for the Random Florest method with an accuracy of 80%, F1-score of 82% and 78% for the possibility of not having or having a cardiovascular disease, respectively, using cross-validation with kfold equal to $5$.pt_BR
dc.description.resumoO objetivo deste trabalho é mostrar um estudo embasado na ciência de dados para a elaboração de uma análise a respeito de doenças cardiovasculares (DCV). Além disso, identificar os fatores que podem vir a influenciar um indivíduo a contrair esse tipo de enfermidade. A partir dos dados de pacientes e da análise preditiva, identificar a probabilidade de resultados futuros de pessoas com DCV, afim de ajudar ao sistema de saúde a obter um melhor prognóstico em relação aos seus pacientes. Utilizando para isso, dados anteriores para efetuar um estudo, através de uma inteligência artificial, para determinar se existe a DCV no paciente. Em particular, o trabalho fornece uma análise exploratória de dados (AED) buscando encontrar correlações entre os dados estudados e a DCV, assim como o uso da inteligência artificial (IA) com cinco algoritmos de classificação de casos de doenças cardiovasculares. Os algoritmos preveem o risco de obter uma doença cardiovascular com base nas informações anteriores de uma base de dados coletados de pacientes. O conjunto de dados usado foi obtido do repositório Kaggle, encontrado a partir da plataforma IEEEDataPort, no qual, com base no estudo, verificou-se que a pressão arterial, o colesterol, idade e o IMC têm uma maior correlação entre o risco de se obter uma doença cardiovascular. Os resultados no conjunto de dados usando a técnica de aprendizado de máquina obteve-se um melhor resultado para o método Floresta Aleatória com uma acurácia de 80%, F1-score de 82% e 78% para a possibilidade de não ter ou ter uma doença cardiovascular, respectivamente, usando cross-validation com k-fold igual a 5.pt_BR
dc.identifier.citationSANTOS, Bruno Silva dos. Uma análise exploratória de dados e o uso de aprendizado de máquina para classificação de doenças cardiovasculares. 2022. 55 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/46134
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentEngenharia de Computação e Automaçãopt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programEngenharia de Computaçãopt_BR
dc.subjectDoença cardiovascularpt_BR
dc.subjectCiência de dadospt_BR
dc.subjectAnálise de dadospt_BR
dc.subjectInteligência artificialpt_BR
dc.subjectFloresta aleatóriapt_BR
dc.subjectCardiovascular diseasept_BR
dc.subjectData sciencept_BR
dc.subjectData analysispt_BR
dc.subjectArtificial intelligencept_BR
dc.subjectRandom forestpt_BR
dc.titleUma análise exploratória de dados e o uso de aprendizado de máquina para classificação de doenças cardiovascularespt_BR
dc.title.alternativeAn exploratory data analysis and the use of machine learning for cardiovascular disease classificationpt_BR
dc.typebachelorThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
UmaAnaliseExploratoria_Bruno_2022.pdf
Tamanho:
1.73 MB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.45 KB
Formato:
Item-specific license agreed upon to submission
Nenhuma Miniatura disponível
Baixar