El grupo eSalud del Instituto de Investigación Sanitaria Biogipuzkoa, ha desarrollado y comprobado una estrategia de integración de distintos tipos de datos que puede mejorar el manejo del cáncer de mama. Este trabajo ha sido posible gracias a Aurora Sucre, Xabier Calle Sánchez, Laura Valeria Pérez-Herrera, María Jesús García-González, Karen López-Linares y Alba Garin-Muga y los resultados se han publicado en la revista científica internacional Computational and Structural Biotechnology Journal.

 

En la práctica clínica actual, el pronóstico del cáncer de mama se basa principalmente en marcadores individuales y estadios tumorales. Sin embargo, en el ámbito de la investigación, ya existen numerosos esfuerzos para integrar múltiples factores (datos ómicos, clínicos, imagen médica) buscando una visión más completa de la enfermedad. A pesar de estos avances, en investigación existe una gran heterogeneidad, ya que no hay consenso sobre la estrategia de integración óptima para datos tan heterogéneos, ni sobre qué datos tienen mayor relevancia sobre el pronóstico y supervivencia en pacientes con cáncer de mama. Por todo ello, el objetivo de este nuevo trabajo fue superar las limitaciones de las propuestas actuales, no solo integrando datos multiómicos, también realizando una comparativa de distintas estrategias de fusión para identificar la arquitectura computacional más robusta y estable que permita predecir la supervivencia de los pacientes de la forma más precisa.

 

En este trabajo se ha diseñado un ecosistema computacional para el análisis de supervivencia en cáncer de mama suficientemente versátil para ser utilizado a futuro con otras enfermedades. No se limita a crear un modelo predictivo, sino que se desarrolla una plataforma integral que abarca desde el preprocesamiento de datos masivos hasta la optimización automática de redes neuronales, y posterior interpretación biológica de los resultados. Utilizando la base de datos pública TCGA se pusieron a prueba diferentes aproximaciones de fusión temprana y tardía para ver cuál era capaz de predecir la supervivencia de las pacientes con mayor rigor y precisión. Como resultado, se demostró que la estrategia de fusión tardía (donde cada tipo de dato se procesa en una sub-red especializada antes de combinarse en la red final) supera a los modelos individuales, a la fusión temprana y a los modelos actuales. El modelo que integra datos clínicos y ómicos de forma tardía superó en capacidad discriminatoria, de calibración y de generalización al resto de modelos, asegurando que las predicciones sean fiables independientemente de pequeñas variaciones en los datos.

 

La conclusión fundamental de este estudio es que, en la medicina de precisión, la arquitectura del modelo es tan crítica como la calidad de los datos de entrada. El grupo de investigación comprobó que la fusión tardía es la estrategia más eficaz para mitigar el ruido (resultados no fiables) y capturar la complejidad biológica del cáncer de mama. Además, confirmaron que la combinación de datos clínicos y moleculares ofrece una capacidad predictiva mucho mayor que cualquier modalidad por separado, permitiendo identificar patrones biológicos asociados a los subtipos más agresivos de cáncer de mama.

 

El valor fundamental de este trabajo para las pacientes, reside en haber demostrado que la integración de datos multiómicos y clínicos mediante una arquitectura de fusión tardía es la estrategia más eficaz para capturar la verdadera complejidad del cáncer de mama. Este estudio confirma que combinar distintas fuentes de información biológica de forma inteligente no solo aumenta la precisión del pronóstico, sino que ofrece mayor capacidad de interpretación. No se trata solo de predecir un resultado, sino de entender qué rutas moleculares y factores genéticos están determinando la evolución de la enfermedad en cada caso. Este avance es clave para la medicina de precisión, ya que sienta las bases para que, en el futuro, las y los oncólogos puedan identificar con mayor antelación el nivel de riesgo de cada paciente, permitiendo un seguimiento mucho más estrecho y personalizado según su perfil biológico único.

 

El equipo de investigación reconoce que “estamos muy contentos con el trabajo realizado para este artículo. Es gratificante haber podido aportar evidencia metodológica en un área con tanta variabilidad, ayudando a clarificar qué estrategias de diseño parecen ser más eficaces y fiables. Nuestra esperanza es que este trabajo sirva como una referencia útil para otros investigadores que trabajan con datos complejos, tanto en cáncer de mama como en otras patologías. Al liberar nuestro código y nuestros resultados en una plataforma web, buscamos que este conocimiento sea compartido y accesible, con la intención de que nuestra propuesta de fusión tardía pueda ser una pieza más en la construcción de futuras herramientas de apoyo al diagnóstico que, tras mucho más trabajo y validación, logren algún día beneficiar directamente a pacientes en la consulta médica.

 

Este trabajo se enmarca en el proyecto ELKARTEK BG24 (KK-2024/00019) donde Vicomtech colaboró con CIC Biogune en la integración de inteligencia artificial para la mejora predictiva en la supervivencia del cáncer de mama, específicamente desarrollando modelos multimodales que integran datos ómicos, clínicos y de imagen patológica.