Visualization, description and analysis of the genome variation of a natural population of Drosophila melanogaster

Author

Ràmia Jesús, Miquel

Director

Barbadilla Prados, Antonio

Date of defense

2015-11-12

ISBN

9788449058189

Pages

157 p.



Department/Institute

Universitat Autònoma de Barcelona. Departament de Genètica i de Microbiologia

Abstract

La descripció i explicació de la variació genètica dins i entre poblacions, l’objectiu de la genètica de poblacions des del seu origen, s’ha vist frenat durant dècades degut a la impossibilitat tècnica de mesurar directament la variació genètica de les poblacions. La present era genòmica, amb el creixement explosiu de genomes sequenciats alimentat per les tecnologies de seqüenciació de nova generació, han obert el camí a la present època daurada de l’estudi de la variació genètica a escala genòmica. La genètica de poblacions ja no és una ciència amb mancances empíriques, si no que és més que mai un camp de recerca on les eines bioinformàtiques per mineria de dades i gestió de grans volums de dades, models estadístics i evolutius, i noves tècniques moleculars de generació de seqüències, queden totes integrades en una empresa interdisciplinària. Com a conseqüència d’aquest avenç, una nova disciplina ‘òmica’ ha aparegut: La Genòmica de Poblacions. Però, què és la Genòmica de Poblacions? Segons Charlesworth (2010), simplement és “un nou terme per un camp d’estudi tant antic com la pròpia Genètica”. Es tracta de “l’antic camp” de la Genètica de Poblacions, quan l’estudi de la quantitat i les causes de la variabilitat natural a les poblacions és fa des d’una prespectiva genòmica. Aquesta tesis és tant un estudi de genòmica de poblacions com un projecte bioinformàtic centrat en la visualització, descripció i anàlisis de la variació del DNA a tot el genoma, a partir de dades d’una població natural de l’organisme model Drosophila melanogaster. Les dades utilitzades s’han obtingut a la iniciativa internacional Drosophila Genetic Reference Panel (DGRP) (Mackay et al. 2012). El DGRP ja seqüenciat els genomes complets de 158 (primera fase) i 205 (segona fase) línies consanguínies de D. melanogaster provinents d’una població natural a Raleigh (Estats Units). Un dels objectius principals del projecte va ser la creació d’un recurs de dades del polimorfisme genètic per a realitzar anàlisis de genòmica de poblacions. Les dades de seqüències del DGRP ens ha permès ralitzar un complet estudi de la variació a nivell genòmic a una població natural de D. melanogaster. Després de desenvolupar un complert accessible mapa públic del polimorfisme present en aquesta població, hem descrit els patrons de polimorfisme i divergència (tant de variants nucleotídiques com d’insercions i delecions, índels) al llarg dels braços cromosòmics. Observem un patró clar i consistent de diversitat genòmica al llarg dels autosomes tant per SNPs (varició d’un sol nucleótid) i índels: la diversitat es veu reduïda a les zones centromèriques en comparació a les no centromèriques, i també als telòmers. Aquest patró no s’observa al cromosoma X, on la diversitat és gairebé uniforme al llarg del cromosoma. Polimorfisme i recombinació es troben correlacionats al llarg dels braços cromosomis, però només en aquelles regions amb taxa de recombinació per sota 2cM Mb-1. La taxa de recombinació sembla ser la força principal responsable de donar forma als patrons de polimorfisme als cromosomes i el seu efecte sembla estar mediat pel seu impacte a la selecció lligada. Hem mapejat la petjada de la selecció natural a SNPs i índels a tot el genoma, observant una acció arreu de la selecció natural, tant per selecció adaptativa com purificadora. La selecció adaptativa actua preferentment a zones no centromèriques. La selecció natural actua diferent a insercions i delecions, sent les delecions seleccionades més intensament en contra per la selecció purificadora, fet que suporta la teoria de l’equilibri mutacional per a l’evolució de la mida del genoma.


The description and explanation of genetic variation within and between populations, the goal of population genetics since its origins, has been hampered by decades because of the technical inability to directly measure the genetic variation of populations. The present genome era, with the explosive growth of genome sequences fueled by the next-generation sequencing technologies, has lead us to the present golden age of the study of genetic variation at the genome scale. Population genetics is no longer an empirically insufficient science, but it is more than ever a research field where bioinformatics tools for data mining and management of large-scale dataset, statistical and evolutionary models, and advanced molecular techniques of mass generation of sequences are all them integrated in an interdisciplinary endeavor. As a consequence of this breakthrough, a new ‘omic’ discipline has emerged: Population Genomics. But, what is Population Genomics? For Charlesworth (2010), it's simply "a new term for a field of study as old as Genetics itself". It's the 'old field' of Population Genetics when studying the amount and causes of variability in natural populations in a genome-wide fashion. This thesis is both a population genomics study and a bioinformatics project centred on the visualization, description and analysis of the genome-wide DNA variation data from a natural population of model organism Drosophila melanogaster. The data used has been obtained by the international initiative The Drosophila Genetic Reference Panel (DGRP) (Mackay et al. 2012). DGRP has sequenced the complete genomes of 158 (freeze 1) and 205 (freeze 2) inbred lines of Drosophila melanogaster from a single natural population of Raleigh (USA). A major goal of this project was to create a resource of common genetic polymorphism data to further perform population genomics analyses. The DGRP sequence data has allowed us to carry out a thorough study of genome-wide variation in a natural population of D. melanogaster. After developing a complete, public and accessible map of the polymorphism present in this population, we have described the patterns of polymorphism and divergence (nucleotide and indel variants) along chromosome arms. We observe a clear and consistent pattern of genome diversity along arms of the autosomic chromosomes both for SNP and indels: diversity is reduced on average in centromeric regions relative to non-centromeric regions, and at the telomeres. This pattern is not observed in the X chromosome, where diversity is almost uniform all along the chromosome. Polymorphism and recombination are correlated along chromosome arms, but only for those regions where recombination rate is below 2cM Mb-1. Recombination rate seems to be the major force shaping the patterns of polymorphism along chromosome arms and its effect seems to be mediated by its impact on linked selection. We have mapped the footprint of natural selection on SNP and indel variants throughout the genome, observing a pervasive action of natural selection, both adaptive and purifying selection. Adaptive selection occurs preferentially in non-centromeric regions. Natural selection acts differently between insertions and deletions, being deletions more strongly selected by purifying selection, which supports the mutational equilibrium theory for genome size evolution.

Keywords

Genòmica de poblacions; Genómica de poblaciones; Population genomics; Bioinfromàtica; Bioinformática; Bioinformatics; Evolució; Evolución; Evolution

Subjects

575 - General genetics. General cytogenetics

Knowledge Area

Ciències Experimentals

Documents

mrj1de1.pdf

6.255Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/3.0/es/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/3.0/es/

This item appears in the following Collection(s)