Human population genetics in the Mediterranean region. From single markers to whole-genome sequencing = Genètica de poblacions humanes del Mediterrani. Des de marcadors únics fins la seqüenciació del genoma complet

Autor/a

Álvarez Álvarez, Miguel Martin

Director/a

Moral Castrillo, Pedro

Athanasiadis, Georgios

Tutor/a

Esteban i Torné, Maria Esther

Fecha de defensa

2019-11-26

Páginas

230 p.



Departamento/Instituto

Universitat de Barcelona. Departament de Biologia Evolutiva, Ecologia i Ciències Ambientals

Resumen

The human populations of the Mediterranean region have been thoroughly studied. Nonetheless, there are numerous aspects of their demographic and epidemiological history that remain uncertain to date. The growing use of high-throughput genetic data is helping to unravel these questions. A crucial part in designing a population genetics study is to determine the type and amount of genetic data that is needed in order to obtain accurate results. In the case of analyses that deal with large-scale population processes, such as continental barriers, or that focus on some specific candidate genes, sparse genetic data with a high degree of variation could be an option that allows for larger sample sizes. However, to obtain more refined results, such as estimating the date of an admixture event, inferring historical changes in population sizes, or focusing on restricted geographic areas, it is required the use of array-based or, ideally, whole-genome sequencing data. In this doctoral thesis, I present four studies in which the density of genetic markers employed vary in accordance to the depth of the analysis. Globally, this work contributes to the knowledge in the sphere of the population genetics of Mediterranean populations. The first survey supports the role of the Mediterranean sea as a historical barrier to gene flow, making use of three single nucleotide polymorphisms (SNP) located within or around LIN28B, a gene associated with cancer. One of these markers, rs221639, shows a specially high degree of variation between Mediterranean populations. The second article analyzes the presence of a sub-Saharan genetic component in four CAD-associated genomic regions in Mediterranean populations. This component is more prevalent in the North African coast, suggesting a more intense sub-Saharan gene flow than in Southern Europe. Furthermore, D-statistics suggest potential sub-Saharan introgression at the 10q11 region, which includes CXCL12, a gene that codes for a chemokine ligand linked to cardiovascular disease with protective effects. In the third study, the level of resolution achieved by array-based genome-wide data allows to refine previous estimates of a Sephardic component present in current Iberian populations. The incorporation of neighbouring populations to the analyses shows a gene flow process from the Iberian Peninsula outwards, which could be reflecting a migration pattern followed by the expelled Sephardic Jews. Finally, I present an analysis of deep-coverage whole-genome sequencing data from the Spanish Eastern Pyrenean population. In combination with accurate genealogical information of the samples, the quality of the data allows to analyze the demographic history of the Spanish Eastern Pyreneans with a high degree of detail using, among others, haplotype-based and deep learning methods. Namely, the Spanish Eastern Pyreneans appear as a distinct group within the Iberian populations, closely related to the Basques. In addition, this human group presents fine-scale population structure, and it has undergone a historical isolation process involving a reduction of the effective size, whose epidemiological consequence has been a significant depletion of many rare and highly deleterious mutations.


Las poblaciones humanas de la región Mediterránea han sido ampliamente estudiadas históricamente. Sin embargo, hay numerosas cuestiones sobre su historia demográfica y epidemiológica que siguen sin resolver. En esta tesis doctoral se recogen cuatro estudios en los que la densidad de marcadores genéticos utilizados varía en función de la profundidad del análisis. En conjunto, estos trabajos contribuyen al conocimiento en el ámbito de la genética de poblaciones humanas del Mediterráneo. En el primer artículo se corrobora el rol histórico del mar Mediterráneo como barrera genética, mediante el uso de un número reducido de polimorfismos localizados en un gen asociado al cáncer, LIN28B. El segundo artículo informa sobre la existencia de un componente subsahariano en cuatro regiones genómicas asociadas a la enfermedad de las arterias coronarias, distribuido de manera dispar entre el sur de Europa y el Norte de África. En el tercer estudio se utilizan datos genómicos obtenidos a partir de un chip de genotipado. El nivel de resolución así conseguido permite refinar estimaciones previas sobre la magnitud del componente genético de origen sefardita presente en algunas poblaciones actuales de la Península Ibérica. Este análisis se extiende a poblaciones adyacentes, y se detecta así una posible ruta migratoria seguida por los sefarditas expulsados. Por último, se presenta un análisis de la población del Pirineo catalán, utilizando en este caso datos de secuenciación de segunda generación con una profundidad de cobertura de 40×. Ello, unido a la infomación genealógica de las muestras, permite analizar la historia demográfica de la región con un alto grado de detalle. Esta población se enmarca en el contexto genético de la Península Ibérica, mostrando una alta similitud con muestras del País Vasco francés. Presenta subestructura poblacional, y ha sufrido un proceso de aislamiento histórico con reducción del tamaño efectivo, cuya implicación epidemiológica ha sido una selección purificadora de numerosas mutaciones altamente deletéreas.

Palabras clave

Genètica de poblacions humanes; Genética de poblaciones humanas; Human population genetics; Mediterrània (Regió); Mediterráneo (Región); Mediterranean Region

Materias

574 - Ecología general y biodiversidad

Área de conocimiento

Ciències Experimentals i Matemàtiques

Documentos

MMAA_PhD_THESIS.pdf

31.80Mb

 

Derechos

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

Este ítem aparece en la(s) siguiente(s) colección(ones)