Development and application of computational tools for the coupled exploration of chemical and biological spaces

Author

Sánchez Aparicio, José Emilio

Director

Pierre Marechal, Jean Didier

Date of defense

2022-11-14

Pages

165 p.



Doctorate programs

Universitat Autònoma de Barcelona. Programa de Doctorat en Bioinformàtica

Abstract

En la majoria de camps a la frontera entre la química i la biologia, una visió tridimensional dels sistemes moleculars és de vital importància, perquè proporciona informació essencial sobre les estructures i mecanismes de les molècules. En les darreres dècades, l’augment de la capacitat computacional, la millora en l’estabilitat dels codis, al mateix temps que un increment del coneixement dels modeladors, ha portat a una expansió massiva de l’aplicació del modelatge molecular en la química i les seves interfases. Malgrat aquests avenços, una sèrie de reptes han de ser encara resolts, incloent el fet de predir camins d’unió de substrats o cofactors, la identificació de llocs d’unió de metalls, o la cerca d’optimitzacions químiques per a una estructura donada de receptor. En aquesta tesi, proposem adreçar aquests reptes amb el desenvolupament de noves eines computacionals per expandir el límit de les actuals, i optimitzar l’aplicació dels mètodes existents en sistemes bioquímics que són difícils de resoldre avui en dia. La primera part del treball reporta la implementació, validació i aplicació de tres nous programes informàtics. Dos d’ells estan basats en un algorisme evolutiu multi-objectiu: GPathFinder per a la identificació de camins d’unió de lligands en proteïnes, i GAlkemist per a l’exploració, dirigida per hipòtesis, de l’espai químic. El tercer programa, anomenat BioMetAll, està enfocat a la predicció de llocs d’unió de metalls en proteïnes, y està basat en descriptores geomètrics simples de la columna vertebral de la proteïna. La segona part del treball reporta l’aplicació de GaudiMM, un algorisme genètic multi-objectiu optimitzat per a tasques de modelatge molecular, a tres casos reals de recerca en acoblaments moleculars no estàndard. També es reporta l’aplicació de fluxos de treball optimitzats per a l’estudi de dos sistemes bioinorgànics (interaccions entre l’oxaliplatí i la insulina, i el mecanisme d’una ciclopropanasa artificial).


En la mayoría de campos en la frontera entre la química y la biología, una visión tridimensional de los sistemas moleculares es de vital importancia, porque proporciona información esencial acerca de las estructuras y mecanismos de las moléculas. En las últimas décadas, el aumento de la capacidad computacional, la mejora en la estabilidad de los códigos, al mismo tiempo que un incremento en el conocimiento de los modeladores, ha llevado a una expansión masiva de la aplicación del modelado molecular en la química y sus interfaces. A pesar de estos avances, una serie de retos deben ser todavía resueltos, incluyendo cómo lidiar con la predicción de caminos de unión de substratos o cofactores, la identificación de sitios de unión de metales, o la búsqueda de optimizaciones químicas para una estructura dada de receptor. En esta tesis, proponemos atajar estos retos con el desarrollo de nuevas herramientas computacionales para expandir el límite de las actuales, y optimizar la aplicación de los métodos existentes en sistemas bioquímicos que son difíciles de resolver hoy en día. La primera parte del trabajo reporta la implementación, validación y aplicación de tres nuevos programas informáticos. Dos de ellos están basados en un algoritmo evolutivo multiobjetivo: GPathFinder para la identificación de caminos de unión de ligandos en proteínas, y GAlkemist para la exploración, dirigida por hipótesis, del espacio químico. El tercer programa, llamado BioMetAll, está enfocado a la predicción de sitios de unión de metales en proteínas, y está basado en descriptores geométricos simples de la columna vertebral de la proteína. La segunda parte del trabajo reporta la aplicación de GaudiMM, un algoritmo genético multiobjetivo optimizado para tareas de modelado molecular, a tres casos reales de investigación en acoplamientos moleculares no estándar. También se reporta la aplicación de flujos de trabajo optimizados para el estudio de dos sistemas bioinorgánicos (interacciones entre el oxaliplatino y la insulina, y el mecanismo de una ciclopropanasa artificial).


In most fields at the interface between chemistry and biology, a three-dimensional vision of the molecular systems is crucial, because it provides essential information about the structures and mechanisms of molecules. In the last decades, the rise of computer power, the improvement of the stability of the codes as well as the increase of savoir-faire of the modelers, have led to a massive expansion of the application of molecular modeling in chemistry and its interfaces. Despite this advance, a series of challenges have still to be solved that include how to deal with the prediction of substrate or cofactor binding routes, the identification of metal binding sites, and the search for chemical optimizations for a given receptor structure. In this thesis, we aim at addressing these challenges by developing new tools to expand the limits of current software, and optimizing the application of pre-existing methods to biochemical systems that are difficult to handle nowadays. The first part of the work reports the implementation, benchmark, and application of three novel pieces of software. Two of them are based on a multi-objective evolutionary algorithm: GPathFinder for the identification of ligand binding pathways in proteins, and GAlkemist for a hypothesis driven exploration of the chemical space. The third tool, called BioMetAll, aims at the prediction of metal-binding sites in proteins based on simple geometric descriptors of the protein backbone. The second part of the work reports the application of GaudiMM, a multi-objective genetic algorithm optimized for molecular modeling tasks, to three real research cases on non-standard dockings. Also, the application of optimized computational workflows for the study of two bioinorganic systems (interactions between oxaliplatin and insulin, and mechanism of an artificial dirhodium cyclopropanase, is reported.

Keywords

Espais bioquímics; Espacios bioquímicos; Biochemical spaces; Modelatge molecular; Modelado molecular; Molecular modeling; Algorismes evolutius; Algoritmos evolutivos; Evolutionary algorithms

Subjects

577 - Material bases of life. Biochemistry. Molecular biology. Biophysics

Knowledge Area

Ciències Experimentals

Documents

jesa1de1.pdf

22.03Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

This item appears in the following Collection(s)