En la reciente cumbre de Saturdays.AI en Asturias, el grupo 2 hizo la presentación de un proyecto innovador que aplica técnicas de machine finding out al estudio de la metástasis cerebral. Este proyecto, desarrollado por un grupo talentoso de personas, busca predecir el tiempo de supervivencia de los pacientes y anticipar las recaídas de la enfermedad, proporcionando herramientas valiosas para mejorar la calidad de vida de los afectados. Aquí, comparto un resumen detallado de este fascinante proyecto y su relevancia en el campo de la medicina moderna.
El equipo detrás de este proyecto está compuesto por cinco entusiastas de la inteligencia artificial y la medicina:
- Adrián Aguado García
- Arturo Linares Muñiz
- Mateo Rodríguez Suárez
- Olumayowa Onabanjo
- Raquel Martínez Martínez
Este equipo ha trabajado arduamente para combinar sus conocimientos en machine finding out y oncología para abordar uno de los problemas más desafiantes en el tratamiento del cáncer.
La metástasis cerebral ocurre cuando las células cancerosas de otras partes del cuerpo migran al cerebro. Este tipo de cáncer es particularmente agresivo y difícil de tratar, ya que implica la invasión de células malignas en el tejido cerebral. La detección temprana y los tratamientos avanzados son cruciales para mejorar la calidad de vida de los pacientes. Sin embargo, conocer el tiempo de supervivencia y predecir recaídas son aspectos que pueden marcar una gran diferencia en la planificación del tratamiento y el apoyo emocional a los pacientes y sus familias.
El proyecto tiene dos objetivos principales:
- Predecir el tiempo de supervivencia: Utilizando datos clínicos y medidas morfológicas, el equipo ha desarrollado modelos que pueden estimar con precisión cuánto tiempo le queda a un paciente.
- Predecir recaídas: Identificar cuándo es potential que un paciente experimente una recaída, lo que puede ayudar a los médicos a planificar intervenciones más eficaces y personalizadas.
El equipo trabajó con el MOLAB Thoughts Metastasis Dataset, un conjunto de datos que incluye resonancias magnéticas, datos clínicos y medidas morfológicas de 75 pacientes. Este dataset es elementary para el entrenamiento de los modelos de machine finding out debido a su riqueza y detalle.
Datos clínicos:
Los datos clínicos incluyen variables como la edad, el sexo, el tipo de tumor primario, los tratamientos recibidos, y el seguimiento de resonancias magnéticas a lo largo del tiempo. Estos datos permiten crear un perfil detallado de cada paciente, esencial para el análisis predictivo.
Medidas morfológicas:
Las medidas morfológicas abarcan las dimensiones y características de los tumores, como el volumen full, el espesor de las secciones y el espacio entre cortes. Estos datos son cruciales para entender cómo evoluciona el tumor y cómo puede afectar al paciente.
La preparación y análisis de datos fue un proceso meticuloso que incluyó la limpieza de datos, la resolución de celdas vacías y problemas de formato. El equipo utilizó una variedad de diagramas y gráficos para entender las relaciones entre las variables y determinar las mejores técnicas de machine finding out a aplicar.
Enfoque de predicción:
La selección del enfoque de predicción fue un desafío para el equipo del proyecto, dado el pequeño tamaño del dataset y la variabilidad de los tumores. El equipo optó por enfoques tanto binarios como multiclase para comparar el rendimiento del modelo.
Modelos utilizados:
El equipo del proyecto probó varios métodos de machine finding out, incluyendo:
- Árboles de decisión
- Regresión logística
- Redes neuronales
- Bosques aleatorios
- XGBoost
Cada uno de estos modelos tiene sus propias fortalezas y debilidades, y el equipo evaluó su desempeño en función de la precisión y la capacidad de generalización.
Objetivo 1: Predecir el tiempo de supervivencia
Utilizando el modelo de XGBoost, el equipo logró una precisión de hasta el 75% en la predicción del tiempo de supervivencia de los pacientes. Otros modelos, como la regresión logística y los árboles de decisión, también mostraron buenos resultados, aunque con menor precisión.
Objetivo 2: Predecir la recaída de la lesión
Los resultados para la predicción de recaídas fueron más variados debido a la alta variabilidad en el crecimiento tumoral. Sin embargo, los árboles de decisión y XGBoost mostraron el mejor rendimiento entre los modelos probados, con una precisión que osciló entre el 47% y el 59%.
Uno de los aspectos más destacados del proyecto es su enfoque en la transparencia. El equipo utilizó valores SHAP (SHapely Additive exPlanations) para explicar el impacto de cada variable en los resultados del modelo, haciendo que las predicciones sean más comprensibles y confiables tanto para los médicos como para los pacientes.
El equipo identificó varias áreas para futuras investigaciones, incluyendo:
- Predicción de la causa de muerte.
- Ajuste del umbral de crecimiento tumoral para definir recaídas.
- Incremento del tamaño del dataset mediante el uso de redes generativas adversariales.
- Explorar nuevas divisiones de datos para mejorar la precisión del modelo.
El proyecto demostró ser prometedor en la predicción del tiempo de supervivencia, aunque la predicción de recaídas aún requiere mejoras y más datos. A pesar de las limitaciones del tamaño del dataset, los resultados obtenidos son un buen punto de partida para futuros estudios y aplicaciones en la medicina.
La aplicación de machine finding out en la medicina, y específicamente en el estudio de la metástasis cerebral, abre nuevas posibilidades para mejorar el tratamiento y la calidad de vida de los pacientes. Este proyecto no solo muestra el potencial de la inteligencia artificial en la predicción médica, sino que también resalta la importancia de la colaboración interdisciplinaria y la transparencia en la investigación científica.
Para aquellos interesados en profundizar más en este proyecto, aquí están algunos recursos útiles: