Decoding Functional Genomics: Exploring Gene Expression Regulation and Unveiling the Drivers of Inter-Individual Variation

Author

Oliveros Diez, Winona

Director

Melé Messeguer, Marina

Tutor

Gelpi Buchaca, Josep Lluís

Date of defense

2025-04-07

Pages

343 p.



Department/Institute

Universitat de Barcelona. Facultat de Biologia

Abstract

[eng] Understanding gene expression and its regulation is crucial for uncovering the molecular mechanisms driving phenotypic diversity and disease susceptibility. Regulatory regions of the genome, including non-coding elements, play a pivotal role in controlling gene activity, yet their influence on transcriptomic variation remains incompletely understood. My work, conducted within the Transcriptomics and Functional Genomics group at the Barcelona Supercomputing Center under the guidance of Dr. Marta Melé, aims to unravel these complexities by leveraging high-throughput sequencing technologies and advanced computational analyses. This PhD thesis explores the regulatory mechanisms of the human transcriptome in health and disease, employing both large-scale transcriptomic analyses and functional genomics approaches. It consists of two main chapters, each addressing distinct aspects of gene regulation using complementary methodologies. The main goal is to elucidate how genetic, demographic, and environmental factors shape transcriptional and epigenetic regulation, ultimately contributing to phenotypic diversity and disease susceptibility. These insights pave the way for more effective and personalized medical approaches. The thesis is structured into two main chapters. In Chapter 1, we investigate how demographic factors (such as sex, age, ancestry, and BMI) collectively influence gene expression, alternative splicing, and DNA methylation across multiple human tissues. While previous transcriptomic studies have provided valuable insights into gene regulation, the full extent of inter-individual variability remains poorly characterized. Using large-scale publicly available datasets, we systematically quantify the contributions of these demographic traits, identify common and tissue-specific regulatory patterns, and explore the potential functional consequences of DNA methylation variations. Our findings reveal widespread hypermethylation in the female autosomal genome, particularly at Polycomb-repressed regions, across tissues. Additionally, we observe a systematic age-related hypermethylation pattern at Polycomb target regions and regulatory sites associated with developmental genes in both sexes across tissues, with the exception of the gonads. Furthermore, ancestry-related differences, particularly in ribosomal protein regulation and the epigenetic landscape, underscore the importance of population diversity in genomic studies. These insights highlight the need for inclusive research frameworks to better understand human biology and disease mechanisms across populations. In Chapter 2, we shift focus to the functional effects of non-coding genetic variants associated with cardiovascular traits. Many disease-associated variants identified through genome-wide association studies (GWAS) lie within regulatory regions, yet their precise roles remain unclear. To address this, we employ Massively Parallel Reporter Assays (MPRAs) to functionally assess 4,608 genetic variants linked to blood pressure regulation in vascular smooth muscle cells (VSMCs) and cardiomyocytes (CMs). By integrating MPRA results with publicly available epigenomic datasets, we refine a set of likely regulatory variants and identify their potential roles in cardiovascular disease. Our findings highlight the complexity of non-coding variant function, demonstrating that regulatory effects are often cell type-specific. This work not only advances our understanding of the genetic architecture of cardiovascular disease but also lays the foundation for future research aimed at developing targeted therapies. By combining large-scale transcriptomic analyses with high-throughput functional assays, this thesis provides a comprehensive view of gene regulation in both health and disease contexts. This research underscores the importance of considering demographic diversity in transcriptomic studies and highlights the power of functional genomics approaches in deciphering the roles of non-coding variants. These findings have important implications for personalized medicine, contributing to a deeper understanding of the molecular mechanisms underlying disease susceptibility.


[cat] Entendre l'expressió gènica i la seva regulació és crucial per desxifrar els mecanismes que promouen la diversitat fenotípica i la susceptibilitat a malalties. Les regions reguladores del genoma, tenen un paper fonamental en el control de l'activitat gènica, i la seva influència en la variació transcriptòmica encara no està del tot compresa. El meu treball, dut a terme dins del grup de Transcriptòmica i Genòmica Funcional al Barcelona Supercomputing Center sota la direcció de la Dra. Marta Melé, té com a objectiu estudiar aquests mecanismes mitjançant l’ús de les tecnologies més avançades de seqüenciació i anàlisis computacionals. Aquesta tesi doctoral explora els mecanismes reguladors del transcriptoma humà en la salut i la malaltia, utilitzant anàlisis transcriptòmiques i mètodes de genòmica funcional. Consta de dos capítols principals, cadascun dels quals aborda aspectes diferents de la regulació gènica mitjançant metodologies complementàries. L'objectiu principal és comprendre com els factors genètics, demogràfics i ambientals modelen la regulació transcripcional i epigenètica, contribuint a la diversitat fenotípica i la susceptibilitat a malalties. Aquests resultats obren el camí cap a enfocaments mèdics més eficaços i personalitzats. La tesi està dividida en dos capítols. En el Capítol 1, investiguem com els factors demogràfics (com el sexe, l’edat, l’ascendència i l’índex de massa corporal) influeixen col·lectivament en l'expressió gènica, l’splicing alternatiu i la metilació del DNA en múltiples teixits humans. Tot i que estudis transcriptòmics previs han aportat coneixements valuosos sobre la regulació gènica, l’abast complet de la variabilitat interindividual encara està poc caracteritzat. Mitjançant l'ús de grans bases de dades disponibles públicament, quantifiquem sistemàticament la contribució d'aquests trets demogràfics, identifiquem patrons reguladors comuns i específics de teixit i explorem les possibles conseqüències funcionals de les variacions en la metilació del DNA. Els nostres resultats revelen una hipermetilació generalitzada en el genoma autosòmic femení, especialment en regions reprimides per Polycomb. A més, observem un patró d’hipermetilació relacionat amb l’edat en regions diana de Polycomb i en llocs reguladors associats a gens del desenvolupament en ambdós sexes, excepte en les gònades. Finalment, les diferències relacionades amb l’ascendència, especialment en la regulació de proteïnes ribosòmiques i el patró epigenètic, subratllen la importància de la diversitat poblacional en la recerc. Aquests resultats remarquen la necessitat de marcs de recerca inclusius per a una millor comprensió de la biologia humana i les malalties en diferents poblacions. En el Capítol 2, canviem el focus cap als efectes reguladors de les variants genètiques no codificants associades a trets cardiovasculars. Moltes variants associades a malalties, identificades mitjançant estudis d’associació del genoma (GWAS), es localitzen en regions reguladores, però les seves funcions encara no estan clares. Per abordar aquesta qüestió, utilitzem la tècnica de “Massively Parallel Reporter Assay” (MPRAs) per avaluar funcionalment 4.608 variants genètiques relacionades amb la regulació de la pressió arterial en cèl·lules musculars llises vasculars (VSMCs) i cardiomiòcits (CMs). Integrant els resultats dels MPRAs amb dades epigenòmiques disponibles públicament, refinem un conjunt de variants probablement reguladores i identifiquem els seus possibles rols en la hipertensió. Els nostres resultats destaquen la complexitat de la funció de les variants no codificants, demostrant que els efectes reguladors són sovint específics del tipus cel·lular. Aquest treball no només amplia el coneixement sobre l’arquitectura genètica de la hipertensió, sinó que també estableix les bases per a futures investigacions dirigides al desenvolupament de teràpies individualitzades. En conjunt, combinant anàlisis transcriptòmiques amb mètodes de genòmica funcional, aquesta tesi ofereix una visió integral de la regulació gènica tant en la salut com en la malaltia. Aquesta recerca subratlla la importància de considerar la diversitat demogràfica en la recerca i posa en relleu el poder de les tècniques de genòmica funcional per desxifrar el paper de les variants no codificants. Aquests resultats tenen implicacions per a la medicina personalitzada, ja que contribueixen a una comprensió més profunda dels mecanismes moleculars subjacents a la susceptibilitat a les malalties.

Keywords

Transcripció genètica; Transcripción genética; Genetic transcription; Metilació; Metilación; Methylation; Variació (Biologia); Variación (Biología); Variation (Biology); Genoma humà; Genoma humano; Human genome

Subjects

575 - General genetics. General cytogenetics. Immunogenetics. Evolution. Phylogeny

Knowledge Area

Ciències Experimentals i Matemàtiques

Note

Programa de Doctorat en Biomedicina / Tesi realitzada al Barcelona Supercomputing Center (BSC)

Documents

WOD_PhD_THESIS.pdf

92.65Mb

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

This item appears in the following Collection(s)