Diseño, desarrollo e implementación de una plataforma bioinformática orientada al análisis y gestión de infomación en epidemiología molecular

Author

Amadoz Navarro, Alicia

Director

González Candelas, Fernando

Date of defense

2011-10-21

ISBN

9788437085296

Pages

248 p.



Department/Institute

Universitat de València. Departament de Bioquímica i Biologia Molecular

Abstract

La investigación genética y epidemiológica de las enfermedades infecciosas requiere actualmente grandes cantidades de datos. En un laboratorio de tamaño medio, la información necesaria para realizar estudios de investigación suele almacenarse de forma independiente en diferentes formatos y lugares, lo que dificulta su gestión y análisis. Esta organización de la información conlleva que el trabajo habitual en un laboratorio se realice de forma lenta y desordenada. En esta situación, la integración de la información es de vital importancia para poder llevar a cabo estos trabajos de forma eficiente, sistematizada y común a todos los investigadores del laboratorio. La principal motivación de esta tesis fue cubrir la necesidad de un sistema de gestión y análisis de datos de forma sencilla, flexible y fiable. El objetivo principal de esta tesis consistió en el desarrollo de un sistema de información orientado al área de epidemiología molecular de patógenos infecciosos, que permitiese almacenar y analizar de forma centralizada la información clínica de pacientes junto con la información molecular de los patógenos de interés. En los últimos años, la bioinformática se ha convertido en una parte esencial de las soluciones eficientes de integración, transformación y creación de nueva información. epiPATH, la plataforma bioinformática que presentamos en esta tesis, consta de dos grupos de herramientas diferenciadas pero, a su vez, diseñadas para interactuar entre sí facilitando el manejo y análisis de grandes cantidades de datos. Por un lado, diseñamos y desarrollamos una base de datos junto con varias aplicaciones que facilitan su gestión y, por otro lado, integramos y desarrollamos diferentes aplicaciones de análisis que permitiesen realizar estudios epidemiológicos, evolutivos y poblacionales de las secuencias moleculares de los patógenos. El almacenamiento conjunto de datos clínicos de pacientes y de datos moleculares de patógenos en una base de datos centraliza la búsqueda y la gestión de información, facilitando comparaciones entre ellos y estudios sobre infecciones múltiples. Además, permite el estudio de la variación que existe dentro de los distintos patógenos y los cambios que registran a lo largo de su evolución, hasta su distribución en distintos pacientes con diferentes afecciones y cuadros clínicos. En este sentido, epiPATH también facilita la vigilancia epidemiológica basada en señales específicas de la enfermedad, mediante la identificación de regiones patógenas a través de la comparación de secuencias cuyos pacientes tengan un perfil clínico determinado. epiPATH incluye información desde el momento en que un paciente acude a un centro de salud hasta el análisis molecular del patógeno en el laboratorio. La información que recoge esta base de datos comienza en los lugares donde se puede encontrar un patógeno. Después, se puede recoger información clínica del paciente cuando acude al médico, se le realizan pruebas clínicas y se puede obtener información sobre el tipo de transmisión. Posteriormente, se aplica un tratamiento y se recogen muestras del patógeno que siguen un procesado de laboratorio. En el laboratorio, se obtienen secuencias que corresponden a un patógeno determinado asociado, en algunos casos, a un brote epidemiológico. Por otro lado, las secuencias pueden analizarse con métodos filogenéticos y publicarse en distintos trabajos generando una bibliografía. La integración de herramientas de análisis junto con la información almacenada en la base de datos facilita las tareas del flujo de trabajo habitual en un laboratorio y en colaboraciones con otras instituciones, preservando la información del acceso público. Además, los programas de análisis de genética poblacional y evolutiva desarrollados en esta tesis (epiPATH-tools) son de gran utilidad y permiten el análisis masivo de datos. Las epiPATH-tools incluyen el cálculo de parámetros relevantes en el estudio de la divergencia, posiciones sinónimas y no-sinónimas, pruebas de neutralidad y estudio de polimorfismos.


Large volumes of data are currently needed in genetics research and infectious diseases epidemiology studies. In a medium size laboratory, information needed in research studies is usually stored independently within different formats and places, which makes information management and data analysis a difficult task. This organization of information involves that the common laboratory workflow is made in a slow and disorganized way. In this situation, information integration is of vital importance to perform these kind of studies in an efficient, systematized and common manner for all the researchers in a laboratory. The main aim of this thesis was to cover the necessity of a data management and analysis system for molecular epidemiology studies of infectious diseases, that allow researchers to store and analyze clinical information of patients together with molecular data of pathogens in a centralized way. epiPATH, the bioinformatics platform that is presented in this thesis, has two different groups of tools designed to interact between them in order to ease the management and analysis of huge amounts of data. We designed and developed a database together with data management applications, and we also integrated and developed different analysis applications to perform molecular epidemiology, population and evolutionary genetics studies. From the moment a patient arrives to a hospital until the processing and analysis of molecular sequences obtained from infectious pathogens in the laboratory, lots of information is collected from different sources. Our database covers many aspects of samples, laboratory processes, molecular sequences, clinical information, treatments, pathogens, transmissions and outbreaks information. epiPATH allows researchers to perform comparisons between pathogens and multiple infections studies. Moreover, it allows studies from variability within pathogens and evolutionary changes to their distribution among patients with different clinical conditions. In this respect, our platform is also useful for the facilitation of surveillance based on either syndromic or disease-specific signals. We also developed the epiPATH-tools, a group of applications for population and evolutionary genetics that calculate parameters relating to a large amount of sequences. They include parameters of interest in the study of population divergence, synonymous and non-synonymous positions, neutrality tests and polymorphism studies.

Subjects

004 - Computer science and technology. Computing. Data processing; 577 - Material bases of life. Biochemistry. Molecular biology. Biophysics

Knowledge Area

Biològiques

Documents

amadoz.pdf

30.98Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)