Uma nova assinatura de 13 genes via aprendizagem de máquina para predição de sobrevida de pacientes com carcinoma renal de células clara

dc.contributor.advisorDoria Neto, Adrião Duarte
dc.contributor.advisor-co1Ferreira, Beatriz Stransky
dc.contributor.advisor-co1IDhttps://orcid.org/0000-0003-4506-393Xpt_BR
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/3142264445097872pt_BR
dc.contributor.advisorIDhttps://orcid.org/0000-0002-5445-7327pt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/1987295209521433pt_BR
dc.contributor.authorTerrematte, Patrick Cesar Alves
dc.contributor.authorLatteshttp://lattes.cnpq.br/4283045850342312pt_BR
dc.contributor.referees1Leite, Cicilia Raquel Maia
dc.contributor.referees2Araújo, Daniel Sabino Amorim de
dc.contributor.referees2Latteshttp://lattes.cnpq.br/4744754780165354pt_BR
dc.contributor.referees3Assumpção, Paulo Pimentel de
dc.contributor.referees4Sakamoto, Tetsu
dc.date.accessioned2022-06-23T20:38:19Z
dc.date.available2022-06-23T20:38:19Z
dc.date.issued2022-05-13
dc.description.abstractPatients with renal cancer have a survival rate of 12% in 5 years in case of metastasis according data between 2009 to 2015 of American Cancer Society. It is of paramount importance to identify biomarkers in genomic data that could help predict the aggressive- ness of clear cell renal cell carcinoma (ccRCC), the most frequent renal cancer subtype. Thus, we conducted a study with the aims of evaluating gene signatures and proposing a novel one with higher predictive power and generalization in comparison to the for- mer signatures. Using ccRCC cohorts of the Cancer Genome Atlas (TCGA-KIRC) and International Cancer Genome Consortium (ICGC-RECA), we evaluated linear survival models of Cox regression with 14 signatures and six methods of feature selection, and performed functional analysis and differential gene expression approaches. In this study, we established a 13-gene signature (AR, AL353637.1, DPP6, FOXJ1, GNB3, HHLA2, IL4, LIMCH1, LINC01732, OTX1, SAA1, SEMA3G, ZIC2) whose expression levels are able to predict distinct outcomes of patients with ccRCC. Moreover, we performed a com- parison between our signature and others from the literature. The best-performing gene signature was achieved using the ensemble method Min-Redundancy and Max-Relevance (mRMR). This signature comprises unique features in comparison to the others, such as generalization through different cohorts and being functionally enriched in significant pathways: Urothelial Carcinoma, Chronic Kidney disease, and Transitional cell carcinoma, Nephrolithiasis. From the 13 genes in our signature, eight are known to be correlated with ccRCC patient survival and four are immune-related. Our model showed a performance of 0.82 using the Receiver Operator Characteristic (ROC) Area Under Curve (AUC) metric and it generalized well between the cohorts. Our findings revealed two clusters of genes with high expression (SAA1, OTX1, ZIC2, LINC01732, GNB3 and IL4) and low expression (AL353637.1, AR, HHLA2, LIMCH1, SEMA3G, and DPP6) which are both correlated with poor prognosis. This signature can potentially be used in clinical practice to support patient treatment care and follow-up.pt_BR
dc.description.resumoPacientes com câncer renal têm sobrevida de 12% em 5 anos em caso de metástase, segundo dados entre 2009 e 2015 da American Cancer Society. Neste sentido, é de suma importância identificar biomarcadores em dados genômicos para ajudar a prever o avanço do carcinoma renal de células claras (ccRCC), sendo este o subtipo mais frequente. Assim, realizamos um estudo com o objetivo de avaliar assinaturas gênicas e propor uma nova assinatura com maior poder preditivo. Usando coortes ccRCC do The Cancer Genome Atlas (TCGA-KIRC) e do International Cancer Genome Consortium (ICGC-RECA), avaliamos modelos de sobrevida usando regressão de Cox comparando 14 assinaturas da literatura e seis métodos de seleção de características, e também realizamos análise funcional e de expressão diferencial. Neste estudo, apresentamos uma assinatura de 13 genes (AR, AL353637.1, DPP6, FOXJ1, GNB3, HHLA2, IL4, LIMCH1, LINC01732, OTX1, SAA1, SEMA3G, ZIC2) cujos níveis de expressão são capazes de prever risco de pacientes com ccCRC. A assinatura genética de melhor desempenho foi alcançada usando o método de comitês de Mínima Redundância e Máxima Relevância (mRMR). Essa assinatura apresenta características únicas em relação às demais, como a generalização por diferentes coortes e o enriquecimento funcional em vias relacionadas à doenças: Doença Renal Crônica, Carcinoma de células de transição, e Nefrolitíase. Dos 13 genes em nossa assinatura, oito são conhecidos na literatura por estarem correlacionados com a sobrevida de pacientes com ccRCC. Nosso modelo mostrou um desempenho de 0,82 usando a métrica Receiver Operator Characteristic (ROC) Area Under Curve (AUC). Nossos resultados revelaram dois agrupamentos de genes com alta expressão (SAA1, OTX1, ZIC2, LINC01732, GNB3 e IL4) e baixa expressão (AL353637.1, AR, HHLA2, LIMCH1, SEMA3G, e DPP6), ambos correlacionados com prognóstico desfavoráveis. Esta assinatura pode potencialmente ser desenvolvida para auxiliar tratamentos na prática clínica.pt_BR
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESpt_BR
dc.identifier.citationTERREMATTE, Patrick Cesar Alves. Uma nova assinatura de 13 genes via aprendizagem de máquina para predição de sobrevida de pacientes com carcinoma renal de células clara. 2022. 72f. Tese (Doutorado em Bioinformática) - Instituto Metrópole Digital, Universidade Federal do Rio Grande do Norte, Natal, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufrn.br/handle/123456789/48273
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal do Rio Grande do Nortept_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.initialsUFRNpt_BR
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICApt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectAprendizagem de máquinapt_BR
dc.subjectBioinformáticapt_BR
dc.subjectCâncer renalpt_BR
dc.subjectAssinatura genéticapt_BR
dc.subjectSeleção de característicaspt_BR
dc.subjectInformação mútuapt_BR
dc.titleUma nova assinatura de 13 genes via aprendizagem de máquina para predição de sobrevida de pacientes com carcinoma renal de células clarapt_BR
dc.title.alternativeA novel machine learning 13-gene signature: improving risk analysis and survival prediction for clear cell renal cell carcinoma patientspt_BR
dc.typedoctoralThesispt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
Novaassinatura13genes_Terrematte_2022.pdf
Tamanho:
13.43 MB
Formato:
Adobe Portable Document Format
Nenhuma Miniatura disponível
Baixar