Investigadores del grupo e-Salud del Instituto de Investigación Sanitaria Biogipuzkoa y Vicomtech, ha combinado la generación de datos sintéticos y el aprendizaje federado para facilitar la investigación de la Leucemia Mieloide Aguda. Los investigadores Imanol Isasa, Andoni Beristain y Gorka Epelde (actualmente, Coordinador de datos del IIS Biogipuzkoa) han participado en este trabajo, junto a profesionales de Vicomtech y EHU, y los resultados del mismo se han publicado en la revista científica internacional JMIR Medical Informatics.
La Leucemia Mieloide Aguda (LMA) es un tipo de cáncer de médula ósea que, aunque es la leucemia más común en adultos, se clasifica como una enfermedad rara debido a su baja incidencia en la población. Esto genera dos grandes obstáculos para la investigación médica, dado que, por un lado, existe una escasez de datos, por la baja incidencia y por otro, existe dispersión y hay que tener en cuenta la privacidad, ya que los datos están repartidos en distintos centros, y debido las leyes de protección de datos (como el RGPD), es difícil compartirlos para estudios a gran escala. Teniendo en cuenta estos obstáculos, el grupo de investigadores se propuso evaluar la viabilidad de combinar dos tecnologías de vanguardia para colaborar en la investigación de la LMA sin comprometer la privacidad de los datos de los pacientes. Estas tecnologías fueron la generación de datos sintéticos, es decir, datos de pacientes artificiales creados por inteligencia artificial (IA); y el aprendizaje federado, la construcción de modelos de IA de forma distribuida evitando que los datos salgan de cada hospital.
Empleando una base de datos pública centralizada, proveniente de una investigación patrocinada por la Universidad de Cardiff, se simularon varios escenarios de dispersión de los datos entre múltiples hospitales que colaboran, para “enseñar” a una IA cómo es un paciente con LMA. Durante este proceso, los hospitales comparten el “conocimiento” que la IA va adquiriendo, pero en ningún momento se comparten los datos reales de los pacientes (aprendizaje federado). Así, en este trabajo, se lograron crear datos sintéticos (datos de “pacientes imaginarios” que se comportan como los reales) de alta calidad. Además, se confirmó que la privacidad es máxima, ya que las pruebas de seguridad demostraron que es prácticamente imposible identificar a un paciente real a partir de los datos artificiales generados. Por último, el sistema es escalable a múltiples hospitales. Las pruebas realizadas indican que, aunque hay una pequeña disminución en la fidelidad de los datos derivada del uso de aprendizaje federado (hospitales distribuidos) respecto a una configuración centralizada (datos compartidos o un único hospital), añadir más hospitales a la red no empeora de forma significativa la calidad de los resultados. Por lo tanto, la combinación de estas tecnologías es una vía viable y segura para la investigación biomédica en enfermedades raras. Esta aproximación permite superar el problema de los silos de datos “atrapados” en diferentes instituciones, creando un entorno de colaboración global que respeta estrictamente la confidencialidad de los pacientes.
Gracias a la combinación de estas tecnologías, los pacientes con LMA se pueden beneficiar de una investigación más rápida. Al crear datos sintéticos que combinan el conocimiento de múltiples hospitales sin que la información real tenga que salir, y al ser datos artificiales, pueden compartirse con la comunidad científica global, eliminando barreras burocráticas y permitiendo entrenar modelos de IA mucho más precisos para combatir la LMA. Además, la privacidad se ve reforzada, ya que se refuerza el compromiso con la privacidad del paciente, asegurando que su contribución al avance médico se realice de la forma más protegida posible.
Como reconocen los investigadores “Sentimos la satisfacción de abrir una puerta tecnológica que puede derribar los denominados ‘silos de datos’ en medicina. Esperamos que estos resultados sirvan de base para crear redes de colaboración reales entre centros sanitarios internacionales, permitiendo que la inteligencia artificial ayude a personalizar tratamientos en enfermedades donde cada dato cuenta.”
Esta investigación ha sido posible gracias a la financiación por el Programa de Investigación e Innovación Horizonte Europa de la Unión Europea bajo el proyecto SYNTHEMA (subvención número 101095530).





