Predicción de eventos clínicos a través de aprendizaje automático

ANTÚNEZ MUIÑOS, PABLO JOSÉ

Predicción de eventos clínicos a través de aprendizaje automático

ANTÚNEZ MUIÑOS, PABLO JOSÉ

Dirigida por:

Ignacio Cruz González Director
Víctor Vicente Palacios Codirector/a

Universidad de defensa: Universidad de Salamanca

Fecha de defensa: 12 de diciembre de 2023

Tribunal:

Pedro Luis Sánchez Fernández Presidente
Diego López Otero Secretario/a
Soledad Ojeda Pineda Vocal

Tipo: Tesis

Teseo: 825559 DIALNET TESEO editor

Resumen

Introducción: La IA (inteligencia artificial), y más específicamente el ML (machine learning9, surgen como herramientas que pueden ser muy útiles en el ámbito sanitario. Es posible utilizar esta nueva tecnología para realizar estudios que no son posibles efectuar, o son muy costosos, mediante los métodos estadísticos clásicos. De hecho, en cardiología, las guías de práctica clínica basan muchas de sus recomendaciones en las opiniones de expertos, sin poder sustentarse en ningún estudio. Existe entonces un hueco en el que el ML puede aportar soluciones, ante la falta de evidencia en determinados temas. Muchas veces esto se debe a que se tratan de patologías raras de baja prevalencia, o eventos infrecuentes con alto impacto clínico dentro de patologías más prevalentes. En cuanto al coste, al principio este puede ser más elevado que en otros estudios, hasta que se consiga dotar de las infraestructuras necesarias para ello. Sin embargo, se podrán realizar análisis retrospectivos y prospectivos, con elevados niveles de computación. Aunque para ello, deberá mejorarse y protocolizarse la recogida y codificación de los datos clínicos y médicos para así disponer de grandes bases de datos con las que trabajar. La FA (fibrilación auricular) es una arritmia muy frecuente en la población mayor en los países occidentales. Sin embargo, el cierre de orejuela es un procedimiento que se lleva cabo a día de hoy en solamente un pequeño porcentaje de los pacientes con este diagnóstico. Además, un grupo muy reducido de paciente a los que se les practica el cierre percutáneo de la orejuela izquierda presentan durante el seguimiento una trombosis del dispositivo implantado. Esta complicación implica una repercusión clínica muy importante, ya que aumenta el riesgo de eventos tromboembólicos, y suele frecuentemente precisar reintroducir la anticoagulación, que muchas veces está contraindicada en estos pacientes. Es por estos motivos por los que es necesario la creación de un modelo de predicción potente, y en la actualidad los modelos estadísticos clásicos no han conseguido hallar predictores consistentes. Por lo tanto, el ML puede ser una herramienta clave a la hora de buscar nuevos modelos que consigan ayudar a predecir aquellos pacientes con mayor riesgo de presentar trombosis sobre el dispositivo de cierre de orejuela. Este evento es poco frecuente, pero tiene una implicación clínica tal que seleccionar aquellos con mayores probabilidades podría permitir llevar a cabo un seguimiento más cercano o un tratamiento más agresivo. Este potencial uso del ML está en expansión en los últimos años, y puede ser clave para predecir eventos raros y con ello conseguir crear una medicina más personalizada. Por estos motivos, surge la posibilidad de aplicar el aprendizaje automático en la trombosis del dispositivo de cierre de orejuela, ya que se trata de un evento muy poco prevalente, pero con un impacto clínico muy relevante. Además, los estudios publicados hasta la fecha son escasos y con limitada evidencia o potencia estadística. La aplicación de métodos de ML no está todavía sistematizada por parte de los profesionales sanitarios. La infrautilización de la IA dentro de la medicina puede perjudicar a la calidad de la atención sanitaria. Uno de los principales motivos puede ser la escasa formación del sector médico en estos nuevos modelos. Por ello surge la necesidad de crear planes formativos ya desde la educación secundaria o en las escuelas de medicina, siendo necesario en primer lugar evaluar cuál es el nivel de conocimientos de este sector. Por otro lado, parece interesante crear herramientas que faciliten el uso de la IA por parte de personas poco experimentadas. Esto podría ayudar a explotar de forma más eficiente el potencial del ML dentro de este campo. Un uso generalizado ayudaría a mejorar muchas facetas de la atención médica, como planes preventivos, ayudas en el diagnóstico o en la toma de decisiones. Incluso la robótica podría ayudar a mejorar los resultados quirúrgicos respecto incluso a personas muy experimentadas. Hipótesis: Los modelos creados a través de la tecnología de ML aportan más potencia predictiva que los métodos estadísticos convencionales para predecir aquellos pacientes con mayor riesgo de presentar trombosis del dispositivo tras el cierre percutáneo de orejuela izquierda. La creación y desarrollo de plataformas para facilitar el uso de los modelos de ML por parte de los sanitarios son necesarias. Una mayor formación, unido a aplicaciones o herramientas que faciliten su uso conllevarán un aumento de la implementación de estas nuevas tecnologías con un alto potencial. Objetivos: - Aplicación de algoritmos de aprendizaje automático para identificar potenciales predictores de trombosis de dispositivo de orejuela. - Comparación de la potencia de predicción de trombosis sobre dispositivo de cierre de orejuela entre los métodos estadísticos clásicos y las técnicas de ML. - Desarrollo de una plataforma para facilitar el uso de modelos de IA en el ámbito sanitario. (Proyecto KOOPA ML). - Evaluación del conocimiento sobre IA y ML de los profesionales de la salud, y comparar la capacidad de ellos para crear modelos de predicción con herramientas de ML mediante la plataforma KOOPA ML entre dos grupos de participantes no expertos en IA, recibiendo o no recomendaciones durante el proceso. Resultados: Se realizó un primer experimento, en el que se intentó identificar posibles predictores de trombosis sobre el dispositivo de cierre de orejuela. Esto se realizó mediante métodos estadísticos clásicos y mediante herramientas de ML, y se compararon ambos resultados. En este segundo caso, se realizaron experimentos con y sin remuestreo, y se eligieron algoritmos como la regresión logística, el random forest o el gradient boosting. Se utilizó un registro europeo de casos con trombosis sobre el dispositivo de cierre de orejuela sin conseguir identificar aquellas variables clínicas, analíticas o ecocardiográficas que consiguieran predecir nuevos eventos fuera de la muestra a estudio. Además, se observó, que los modelos obtenidos mediante aprendizaje automático no mejoraban a los modelos estadísticos en su poder predictivo. Se realizaron 4 experimentos, 2 con métodos estadísticos clásicos y 2 con herramientas de aprendizaje automático. En estos últimos, se utilizaron 3 algoritmos de clasificación, uno lineal como la regresión logística, y otros dos no lineales como el random forest y el gradient boosting. En el experimento I, se realizó un análisis multivariable hallándose únicamente el HASBLED como predictor independiente de trombosis del dispositivo. Sin embargo, este modelo presentaba una potencia estadística baja, con un área bajo la curva ROC de 0.546. En el experimento II, se crearon modelos a través de machine learning, encontrando el antecedentes de ictus como el mejor predictor de trombosis de dispositivo. Estos modelos presentaban áreas bajo la curva muy buenas de 0.797 en el de regresión logística y de 1.0 en los otros dos. No obstante, estos resultados deben tomarse con cautela, ya que no se realizó validación externa ni técnicas de remuestreo por lo que lo más probable es que se haya cometido un fenómeno de sobreajuste. Por lo tanto, posteriormente se realizaron dos experimentos con técnicas de remuestreo mediante validación cruzada o k-fold y shuffle-split. De esta forma se conseguían 10 modelos diferentes que fueron analizados. En el experimento III, se realizó un análisis multivariable, y se observó el HASBLED como predictor de trombosis en 8 de los 10 modelos creados. Sin embargo, la potencia estadística continuaba siendo pobre, con un área bajo la curva ROC de 0.517. En cuanto al experimento IV, se observó gran variabilidad en los predictores hallados en cada modelo, y únicamente 3 variables aparecieron consistentemente como predictores en los 10 modelos (HASBLED, enfermedad arterial coronaria previa y tratamiento previo con fármacos antivitamina K). La potencia predictiva de estos modelos también era limitada, ya que las áreas bajo la curva ROC eran siempre inferiores a 0.6. Con estos resultados, encontramos que no existen diferencias significativas entre ambos tipos de modelos, encontrándose posibles nuevos predictores de trombosis, pero siempre presentaban una baja potencia predictiva. En segundo lugar, se realizó un estudio para valorar si una plataforma como KOOPA ML puede facilitar la adopción y uso de estos nuevo métodos de ML por parte de profesionales del ámbito sanitario. Esta plataforma se ha desarrollado para implementar modelos de predicción mediante ML de una forma sencilla incluso para usuarios sin apenas conocimientos en IA o ML. Se evaluó la capacidad de los participantes para realizar dos ejercicios diferentes en los que se instaba a crear dos modelos de predicción a partir de una base de datos ya cumplimentada. Se dividió a los participantes en dos grupos, unos que recibirían durante la prueba recomendaciones y otros que no dispondrían de ellas, y se compararon los resultados. Se observó que los formación sobre el tema de la IA y el ML era escasa, dificultando así la creación de modelos de predicción mediante ML a pesar de utilizar una plataforma como KOOPA ML diseñada para ello. Esta dificultad para crear los modelos no difería dependiendo del grupo en el que se incluyeran los participantes, evidenciando que las recomendaciones no mejoraban los resultados. Sin embargo, se detectó que aquellos con más conocimientos eran capaces de resolver mejor los ejercicios. Incluso, cabe destacar que la plataforma es sencilla, ya que los participantes, conforme avanzaban en las tareas solicitadas mejoraban sus resultados y su fluidez con la plataforma. Conclusiones - En un registro europeo sobre trombosis de dispositivo de cierre de orejuela, los métodos de ML no identificaron variables clínicas, analíticas o ecocardiográficas predictoras de nuevos eventos de trombosis del dispositivo con una potencia predictora al menos moderada. Los modelos de predicción realizados presentan áreas bajo la curva de ROC inferiores al 0,6. - En nuestro experimento, los modelos de aprendizaje automático no mejoran aquellos modelos realizados a través de métodos estadísticos clásicos para la predicción de la trombosis sobre el dispositivo de cierre de orejuela. - La formación en temas sobre inteligencia artificial y machine learning en los profesionales sanitarios es escasa, a pesar del incremento de su uso en este ámbito en los últimos años. Este escaso conocimiento del tema implica una mayor dificultad para crear modelos de predicción incluso a través de plataformas sencillas, a pesar de que se realicen recomendaciones técnicas y/o teóricas durante el proceso. - Aplicaciones como KoopaML que facilitan el uso del machine learning por parte de gente escasamente experimentada pueden ayudar a los sanitarios a mejorar sus conocimientos y a expandir su uso entre ellos. Incluso sin una formación en IA avanzada y con escasa práctica con herramientas de ML, los participantes mejoraron su rendimiento durante los ejercicios para crear modelos de predicción conforme aumentaba el tiempo de uso de la plataforma.