The genetic basis of Alzheimer’s disease and its related endophenotypes

Author

Moreno Grau, Sonia

Director

Ruiz Laza, Agustín

Tutor

Comella i Carnicé, Joan Xavier

Date of defense

2019-11-29

ISBN

9788449090233

Pages

254 p.



Department/Institute

Universitat Autònoma de Barcelona. Departament de Bioquímica i Biologia Molecular

Abstract

La malaltia d’Alzheimer (MA) és la principal causa de demència. S’ha suggerit que la MA és precedeix per un llarg període, que inclou una etapa pre-clínica i altra prodòmica. La MA presenta un fort component genètic. Des d'un punt de vista genètic, es reconeixen dues formes de la malaltia: la forma autosòmica dominant, exclusiva de casos d’inici primerenc (EOAD,<65 anys); i la forma poligènica, principalment descrita per casos d’inici tardà (LOAD,>65 anys). Gairebé, 40 factors de risc genètic s’han associat amb la MA. D'aquests, l’al·lel Ԑ4 del gen APOE, el primer gen identificat per la MA, es el factor de risc genètic més important. Malgrat l’extensa recerca genètica, una gran part de l'heretabilitat roman desconeguda, i els mecanismes de malaltia, encara hi son, incomprensibles. Els objectius d’aquesta tesi son comprendre el paper d’alguns factors de risc genètic prèviament identificats, així com identificar nous gens i rutes biològiques per a la MA. Primer vam intentar d’esclarir el paper d’APOE Ԑ4 a l’etapa pre-clínica de la MA, i la seva relació amb la càrrega de beta d'amiloide cerebral (Aβ). Els nostres resultats recolzaren que el genotip d’APOE pot ser utilitzat instrumentalment per enriquir amb casos d’Alzheimer les poblacions en risc de sofrir la malaltia. A més, els genotips d’APOE explicaren un 11% de la variància d'amiloide cerebral, el qual recolza el paper d’altres factors, tant genètics, com epigenètics. Després, tenint en compte que prop d’on es localitza APOE han sortit troballes genètiques controvertides, com per exemple el factor de risc genètic rs3865444-CD33, vam decidir analitzar si patrons de desequilibri de lligament (LRLD) podrien estar alterant la resta de senyals genètiques a la regió. Així, vam detectar un LRLD dèbil, entre el APOE Ԑ2 al·lel i rs3865444, al gen CD33, però les forces que causen aquest LRLD romanen desconegudes. Seguidament, per descobrir nous factors de risc genètic vam aplicar una estratègia de gens candidats. Així, vam comprovar si gens involucrats en processos d'apoptosi neuronal es trobàvem associats amb la MA. Els nostres resultats no van demostrar cap associació entre les variants genètiques testades i la MA. Per dur a cap una estratègia lliure d’hipòtesis, vam generar la base de dades de rastreig del genoma complet (GWAS) de demència més gran per població espanyola, l’estudi GR@ACE. Vam explorar l'impacte de l'heterogeneïtat fenotípica en troballes genètiques i en rutes biològiques. Vam detectar tres categories de gens que operen de forma diferent en funció del subgrup de malalts de MA. Després vam combinar dades genòmiques amb dades de co-expressió gènica. Això ens va permetre identificar que el processos de regulació de la vasculatura formen part del mecanisme causal per les formes més pures de la MA. El meta-anàlisi de les dades de GR@ACE amb altres bases de dades genètiques revelà dos nous gens vinculats amb la MA: ANKRD31-rs4704171(localitzat a la proximitat del gen de HMGCR) i NDUFAF6-rs10098778, i va confirmar SCIMP-rs7225151 i CD33-rs3865444. Els nostres resultats indiquen que les troballes genètiques estan influenciades per diversos subgrups clínics de la MA Per buscar variants recessives associades amb la MA vam utilitzar “runs de homocigositat” (ROHs). Primer, es detectar un excés d’homocigositat als casos respecte als controls. Després, vam dissenyar una estratègia per capturar individus consanguinis des d’una població no relacionada, un mètode refinat per analitzar la consanguinitat a la MA. L'ús complementari de dades de seqüencia d’exons va permetre que seleccionarem variants recessives candidates. D'entre elles, destaca la troballa al gen SPON1, ja que aquest gen interacciona amb APP. A més, altres variants recessives candidates van ser trobades en regions genètiques anteriorment associades amb la MA, CNTNAP2 i TP53INP1/NDUFAF6. En general, els nostres resultats suggereixen que els efectes recessius poden comptar amb una porció de l'heretabilitat de la MA.


La enfermedad de Alzheimer (EA) es la principal causa de demencia. La EA está precedida por un largo periodo, que incluye una etapa preclínica y otra prodrómica. La EA presenta un fuerte componente genético. Desde un punto de vista genético se reconocen dos formas: la autosómica dominante, exclusiva de casos de inicio temprano (EOAD,<65 años); y la poligénica, principalmente descrita para casos de inicio tardío (LOAD,>65 años). Alrededor de 40 factores de riesgo genético se han asociado con EA. Entre ellos, el alelo Ԑ4 del gen APOE, primer gen identificado para la EA, es el mayor factor de riesgo genético. A pesar de la extensa investigación genética, una gran parte de la heredabilidad para EA permanece desconocida, y los mecanismos biológicos incomprensibles. El objetivo de esta tesis es comprender el papel de algunos factores de riesgo genético previamente identificados, así como identificar nuevos genes y rutas biológicas para la EA. Primero intentamos esclarecer el papel de APOE-Ԑ4 en fases preclínicas de EA, y su relación con la carga de beta de amiloide cerebral (Aβ). Nuestros resultados apoyaron que el genotipo de APOE puede ser utilizado instrumentalmente para enriquecer las poblaciones en riesgo de sufrir EA. Además, los genotipos de APOE explicaron un 11% de la varianza de la carga de amiloide cerebral, sugieriendo que otros factores tanto genéticos como epigenéticos. Seguidamente, teniendo en cuenta cerca de APOE se han identificado hallazgos genéticos adicionales, y controvertidos, como por ejemplo el marcador rs3865444 en el gen CD33; decidimos analizar si patrones de desequilibrio de ligamento de largo alcance (LRLD) podrían estar alterando el resto de señales genéticas en esta región. Así, detectamos un LRLD débil, entre APOE-Ԑ2 y el marcador rs3865444-CD33, pero las fuerzas que causan este LRLD permanecen desconocidas. Para descubrir nuevos factores de riesgo genético aplicamos una estrategia de genes candidatos. Comprobamos si genes involucrados en procesos de apoptosis neuronal se encontraban asociados con la EA. Nuestros resultados no demostraron ninguna asociación entre las variantes genéticas testadas y EA. A continuación para aplicar una estrategia libre de hipótesis, generamos la base de datos de rastreo del genoma completo (GWAS) de demencia más grande para población española, el estudio GR@ACE. Exploramos el impacto de la heterogeneidad fenotípica en hallazgos genéticos y rutas biológicas para la enfermedad. Detectamos tres categorías de genes que operan de forma diferente en función del subgrupo clínico de EA. Después combinamos datos genómicos con datos de co-expresión génica. Esto nos permitió identificar que los procesos de regulación de la vasculatura forman parte del mecanismo causal para las formas más puras de EA. El meta-análisis de los datos de GR@ACE con otras bases de datos genéticas reveló dos nuevos genes vinculados con la EA: ANKRD31-rs4704171 (localizado en la proximidad del gen de HMGCR) y NDUFAF6-rs1098778, y confirmó SCIMP-rs7225151 y CD33-rs3865444. Nuestros resultados indican que los hallazgos genéticos están influenciados por la presencia de subgrupos clínicos para la EA. Finalmente, para buscar variantes recesivas asociadas con la EA utilizamos “runs de homocigosidad” (ROHs). Detectamos un exceso de homocigosidad en los casos respecto a los controles. Por ello, diseñamos una estrategia para capturar individuos consanguíneos desde una población no relacionada, un método refinado para analizar la consanguinidad a la EA. El uso complementario de datos de secuencia de exones permitió la selección de variantes recesivas candidatas. De entre ellas, destaca el hallazgo en el gen SPON1, puesto que este gen interacciona con APP. Otras variantes recesivas candidatas fueron encontradas en regiones genéticas anteriormente asociadas con la EA, CNTNAP2 y TP53INP1/NDUFAF6. En general, nuestros resultados sugieren que los componentes recesivos pueden explicar una porción de la heredabilidad de la EA.


Alzheimer’s disease (AD) is the leading cause of dementia worldwide. Although clinical symptoms mainly appear in the elderly, it is suggested that AD is preceded by a long continuum, which includes preclinical and prodromal stages. AD presents a strong genetic component. From a genetic point of view, two forms of the disease have been recognized: the autosomal dominant form for early-onset AD (EOAD, <65 years old); and the polygenic form, mainly described for late-onset AD cases (LOAD, >65 years old). Nearly 40 genetic risk factors have been associated with LOAD. Of these, the Ԑ4 allele of the APOE gene was the first to be identified, and remains the major genetic risk factor for AD. In spite of extensive genetic research, the disease heritability remains largely unexplained, and the disease mechanisms incomprehensible. This thesis aims at understanding the role of certain known AD loci and identifying new genetic risk factors and related pathways for AD. First, we analyzed the role of a major AD loci, the APOE Ԑ4 genetic risk factor, in preclinical stages of AD, and its relationship with the cerebral amyloid beta (Aβ) burden in the AD continuum. Our results supported the hypothesis that APOE genotypes can be used instrumentally to enrich at risk populations of AD. Furthermore, APOE genotypes explained 11% of brain amyloid variance, which supported the role of additional genetic and/or epigenetic factors. Next, considering the emergence of controversial AD genetic findings, e.g. the rs3865444-CD33 marker, in the close vicinity of APOE gene, we decided to analyze whether long-range linkage disequilibrium (LRLD) patterns in this important AD region could be disturbing additional genetic discoveries. We detected a weak and non-universal LRLD between the APOE Ԑ2 allele and rs3865444 in CD33 locus, but forces causing this LRLD remain elusive. To uncover new AD genetic loci, we first applied a candidate gene approach, testing whether genes related with neuronal apoptosis were associated with AD. Our results did not show evidence of a genetic relationship between tested markers and AD. After that, we moved to a hypothesis-free strategy. We generated the largest Spanish genome-wide dataset for dementia, the GR@ACE Stage I, and explored the impact of phenotypic heterogeneity on genetic findings and biological pathways to dementia. We detected three gene categories operating differently across AD subgroups of patients. After combining genomic and co-expression data, we identified vasculature regulation as a primary event in the causative mechanism for purer forms of AD. Meta-analysis of GR@ACE with additional genetic datasets revealed two novel AD loci: ANKRD31-rs4704171 (in the HMGCR genomic region) and NDUFAF6-rs10098778, and confirmed SCIMP-rs7225151 and CD33-rs3865444 to be genome-wide significant. Our results indicate that, genetic discoveries can be strongly disturbed by the presence of clinical subgroups of AD patients. Finally, to investigate genetic heterogeneity in AD, we looked for recessive variants in runs of homozygosity (ROHs). We first detected that increased homozygosity was present in AD cases respect to controls. Next, we efficiently captured inbred AD cases from an outbred population, which supposes a refined method to analyze inbreeding in AD. The use of complementary sequencing data led us to select ROHs harboring potential recessive variants. Of these, the SPON1 gene appears to be a novel candidate AD locus with a potential recessive component, as it is a biological partner of APP. Potential recessive variants were found in the CNTNAP2 and TP53INP1/NDUFAF6 genetic regions previously associated with AD. Overall, our results further suggest that recessive effects may explain a portion of AD heritability.

Keywords

Malaltia d'Alzheimer; Enfermedad de Alzheimer; Alzheimer's disease; Genètica; Genética; Genetics

Subjects

616.8 - Neurology. Neuropathology. Nervous system

Knowledge Area

Ciències Experimentals

Documents

smg1de1.pdf

9.173Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

This item appears in the following Collection(s)