Machine learning methods for predicting days to discharge in Intensive Care Units patients

Author

Cuadrado Gómez, David

Director

Valls Mateu, Aïda

Date of defense

2023-10-30

Pages

86 p.



Department/Institute

Universitat Rovira i Virgili. Departament d'Enginyeria Informàtica i Matemàtiques

Abstract

Les UCI donen atenció especialitzada per a pacients crítics, amb monitorització constant i equips d'atenció mèdica dedicats fins a la seva estabilitat per ser traslladats o donats d'alta. Una planificació inadequada pot donar lloc a una reducció de la qualitat de l’atenció, retrassos i un augment de la morbiditat i la mortalitat. Per abordar aquest problema, calen eines informàtiques fiables per predir les estades a la UCI, ajudant en la planificació de llits, medicació i de personal. Hi ha dos enfocaments predictius: eines estàtiques que estimen la durada de l'estada (LOS) i eines dinàmiques que prediuen els dies fins a l'alta (DTD) a mesura que avança el tractament. Aquesta tesi té com a objectiu predir l'alta de pacients de la UCI amb precisió utilitzant Machine Learning i dades privades de l'Hospital Joan XXIII i el conjunt de dades públiques d'eICU per a una diversa representació de pacients. Per millorar-ne la precisió, és fonamental comprendre l'heterogeneïtat dels pacients. La tesi proposa quatre mesures per quantificar l'heterogeneïtat i dos enfocaments per analitzar LOS i DTD: identificació de biomarcadors i reconeixement de fenotips. Es van fer servir tres algoritmes (Random Forest, XGBoost i lightGBM) per crear models predictius per a DTD i LOS, i combinar-los en un model híbrid va millorar la precisió. El model LOS va funcionar bé inicialment, mentre que el model DTD va destacar més endavant a l'estada. Els resultats van aconseguir un error quadràtic mitjà (RMSE) i un error mitjà mitjà (MAE) dins de rangs acceptables.


Las UCI brindan atención especializada para pacientes críticos, con monitoreo constante y equipos de atención médica dedicados hasta su estabilidad para ser trasladados o dados de alta. Una planificación inadecuada puede dar lugar a una reducción de la calidad de la atención, retrasos y un aumento de la morbilidad y la mortalidad. Para abordar este problema, se necesitan herramientas informáticas confiables para predecir las estadías en la UCI, ayudando en la planificación de camas, medicación y de personal. Existen dos enfoques predictivos: herramientas estáticas que estiman la duración de la estancia (LOS) y herramientas dinámicas que predicen los días hasta el alta (DTD) a medida que avanza el tratamiento. Esta tesis tiene como objetivo predecir el alta de pacientes de la UCI con precisión utilizando Machine Learning y datos privados del Hospital Joan XXIII y el conjunto de datos públicos de eICU para una representación diversa de pacientes. Para mejorar la precisión, es fundamental comprender la heterogeneidad de los pacientes. La tesis propone cuatro medidas para cuantificar la heterogeneidad y dos enfoques para analizar LOS y DTD: identificación de biomarcadores y reconocimiento de fenotipos. Se usaron tres algoritmos (Random Forest, XGBoost y lightGBM) para crear modelos predictivos para DTD y LOS, y combinarlos en un modelo híbrido mejoró la precisión. El modelo LOS funcionó bien inicialmente, mientras que el modelo DTD destacó más adelante en la estancia. Los resultados lograron un error cuadrático medio (RMSE) y un error medio promedio (MAE) dentro de rangos aceptables.


ICUs provide specialized care for critically ill patients, with constant monitoring and dedicated healthcare teams until stability for safe transfer or discharge. Inadequate planning can lead to reduced care quality, delays, and increased morbidity and mortality. To address this issue, reliable computer tools are needed to predict ICU stays, aiding in bed, medication, and personnel planning. Two predictive approaches exist: static tools estimating length of stay (LOS) and dynamic tools predicting days to discharge (DTD) as treatment progresses. This thesis aims to predict ICU patient discharge accurately using Machine Learning and private data from Joan XXIII Hospital and the eICU public dataset for diverse patient representation. To enhance accuracy, it is critical to understand the heterogeneity of patients. The thesis proposes four measures to quantify heterogeneity and two approaches to analyze LOS and DTD: biomarker identification and phenotype recognition. Three algorithms (Random forest, XGBoost, and lightGBM) were used to create predictive models for DTD and LOS, and combining them into a hybrid model improved accuracy. The LOS model performed well initially, while the DTD model excelled later in the stay. The results achieved a root mean square error (RMSE) and mean average error (MAE) within acceptable ranges

Keywords

Aprenentatge automàtic; Predicció dies fins l’alta; Unitat de cures intensives; Aprendizaje automático; Predicción días para el alta; Unidad de curas intensivas; Machine Learning; Days to discharge prediction; Intensive care unit

Subjects

004 - Computer science and technology. Computing. Data processing; 311 - Statistics as a science. Statistical theory; 51 - Mathematics; 62 - Engineering. Technology in general

Knowledge Area

Enginyeria i arquitectura

Documents

TESI David Cuadrado Gomez.pdf

5.071Mb

This document contains embargoed files until 2024-04-27

 

Rights

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)