dc.contributor
Universitat Rovira i Virgili. Departament d'Enginyeria Electrònica, Elèctrica i Automàtica
dc.contributor.author
Martinez De Cripan Vazquez, Sara
dc.date.accessioned
2025-01-28T12:09:49Z
dc.date.issued
2024-12-12
dc.identifier.uri
http://hdl.handle.net/10803/693485
dc.description.abstract
Els experiments de metabolómica no dirigida generen entre centenars i milers de senyals iónics de
metabólits;T]a
cerca en biblioteques de referencia és el métode principal pera la identificació de compostos. Ara
bé, només una petita fracció de les senyals detectades s'anoten coma compostos coneguts. Encara que
la disponibilitat de biblioteques i estándards de referencia ha augmentat en els últims anys,
continuen sent insuficients. Aquesta tesi pretén desenvolupar noves estratégies computacionals
basades en métodes d'aprenentatge automátic (ML) i quimioinformática com a alternatives fiables a
les biblioteques en l'anotació metabolómica no dirigida. A més, la tesi pretén aplicar i validar
aquestes estratégies en experiments de metabolómica no dirigida. La tesi es divideix en dues parts
principals. En primer lloc, es va desenvolupar un algorisme denomina! anotació de fragments basada
en estructura (SBFA) pera guiar la identificació de metabólits basant-se en l'anotació de fragments
de la font a nivell MS1 sense utilitzar biblioteques MS/MS de referencia. En segon lloc, es va
avaluar l'ús de models ML pera predir propietats moleculars, com els valors de l'index de retenció
(RI) i la secció transversal de col·lisió (CCS).
ca
dc.description.abstract
Los experimentos de metabolómica no dirigida generan entre cientos y miles de señales iónicas de
metabolitos, y la búsqueda en biblio.ecas de referencia es el método principal para la
identificación de compuestos Sin embargo, solo una pequeña fracción de las señales detectadas se
anotan como compuestos conocidos. Aunque la disponibilidad de bibliotecas y estándares de
referencia ha aumentado en los últimos años. siguen siendo insuficientes. Esta tesis pretende
desarrollar nuevas estrategias computacionales basadas en métodos de aprendiza¡e automático (ML) y
quimioinformática como alternativas fiables a las bibliotecas para la anotación de metabolómica no
dirigida. Además, la tesis pretende aplicar y validar estas estrategias en experimentos de
metabolómica no dirigida. La tesis se divide en dos partes principales. En primer lugar, se
desarrolló un algoritmo denominado anotación de fragmentos basada en estructura (SBFA) para guiar
la identificación de metabolitos basándose en la anotación de fragmentos de la fuente a nivel MS1
sin utilizar bitiliotecas MSIMS de referencia.
ca
dc.description.abstract
Untargeted metabolomics experiments generate hundreds to thousands ot ion signals trom metabolites,
and reterence
library searching is the primary method for compound identification. However, only a small portion
of the detected signals are annotated as known compounds. Although the availability of reference
libraries and reference standards has increased in recent years, they are still insufficient. This
thesis aims to develop new computational strategies based on machine learning (ML) and
chemoinformatics methods as reliable alternatives to libraries in untargeted metabolomics
annotation. Also, the thesis aims to apply and validate these strategies in untargeted metabolomics
experiments. The thesis is divided into two main parts. First, an algorithm called Structure-based
fragment annotation (SBFA) was developed to guide the identification of metabolites based on the
annotation of in-source fragments al the MS1 leve! without using reference MSIMS librarles.
Second, the use of ML models to predict molecular properties, such as retention index (RI) and
Collision Cross Section (CCS) values, was assessed. A framework for applying these predicted values
for metabolite annotation was provided, which is of special utility in the absence of reference
data.
ca
dc.format.extent
141 p.
ca
dc.publisher
Universitat Rovira i Virgili
dc.rights.license
ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
ca
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Estratègies computacionals
ca
dc.subject
Metabolómica
ca
dc.subject
Estrategias computacionales
ca
dc.subject
Metabolomics
ca
dc.subject
Computational strategies
ca
dc.subject.other
Ciències de la salut
ca
dc.title
New strategies based on machine learning and cheminformatics for untargeted metabolomics data annotation
ca
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.contributor.authoremail
saramartinezdecripan@gmail.com
ca
dc.contributor.director
Domingo Almenara, Xavier
dc.embargo.terms
12 mesos
ca
dc.date.embargoEnd
2025-12-12T01:00:00Z
dc.rights.accessLevel
info:eu-repo/semantics/embargoedAccess