El grupo eSalud del Instituto de Investigación Sanitaria Biogipuzkoa junto a sus compañeras y compañeros de Vicomtech, Universidad de Deusto y Universidad del País Vasco (EHU), ha desarrollado DeltaTrace, una plataforma para monitorización continua y fenotipado digital que procesa los datos de principio a fin, garantizando auditabilidad y reproducibilidad, en línea con las necesidades clínicas y las directrices europeas de gobernanza del dato. El trabajo, cuyos resultados se han publicado en la revista científica internacional JMIR Medical Informatics, ha sido realizado por las y los investigadores Ander Cejudo, Yone Tellechea, Amaia Calvo, Aitor Almeida, Cristina Martín y Andoni Beristain.

 

El uso combinado de big data e inteligencia artificial (IA) está transformando el análisis de datos en salud, permitiendo procesar grandes volúmenes de información de forma escalable e incluso en tiempo real a partir de múltiples fuentes de datos. En este escenario, la trazabilidad adquiere un valor especialmente alto: en salud no basta con generar una alerta o una predicción; también es necesario saber qué datos se usaron, cómo se transformaron y con qué versión del conjunto de datos y del modelo se obtuvo un resultado. Esta capacidad es clave para la reproducibilidad, la auditoría y la confianza clínica. Además, en Europa crece la necesidad de alinear las infraestructuras de datos con el Espacio Europeo de Datos Sanitarios, que impulsa una gobernanza más sólida y un uso secundario del dato más controlado y reutilizable.

 

Teniendo en cuenta todo lo anterior, el objetivo de este nuevo trabajo fue diseñar y evaluar una plataforma de datos para el ámbito de la salud, en la que la trazabilidad fuese un elemento central. La propuesta, llamada DeltaTrace, busca sostener requisitos operativos exigentes, como la escalabilidad y el procesamiento en tiempo real, y a la vez incorporar control de versiones y la reconstrucción completa del recorrido del dato a lo largo de todo el flujo, incluyendo su uso en modelos de IA. La pregunta que guio la investigación fue saber si una arquitectura con estas características puede ofrecer analítica sanitaria distribuida y en tiempo real garantizando auditabilidad y reproducibilidad, en línea con las necesidades clínicas y las directrices europeas de gobernanza del dato.

 

Como resultado se desarrolló DeltaTrace, una plataforma para monitorización continua y fenotipado digital que procesa los datos de principio a fin. La plataforma recoge información de wearables y de cuestionarios, prepara esa información para su análisis mediante limpieza y agregación, aplica métodos de detección de anomalías y muestra los resultados en paneles de visualización. Un punto clave es que todo el proceso queda trazado, de modo que se puede reconstruir qué datos se usaron, qué transformaciones se aplicaron y con qué versión del modelo se generó cada resultado, facilitando la auditoría y la reproducibilidad.

 

Para probar la plataforma en condiciones cercanas al uso real, se evaluó su rendimiento en un entorno que simulaba la recepción continua de datos de wearables de 1500 usuarios, ejecutándose en un único servidor con los requisitos mínimos de hardware para operar la plataforma. En este escenario, los tiempos totales de procesamiento de extremo a extremo se mantuvieron por debajo de 10 minutos desde la ingesta hasta la agregación y la detección de anomalías, lo que permite un uso cercano al tiempo real. Cabe destacar que el procesamiento fue completo y trazable de extremo a extremo, las agregaciones y detección de anomalías fue en tiempo real, que los resultados fueron reproducibles y auditables, adecuados para entornos sanitarios, y que el diseño es abierto y modular, por lo que es aplicable también fuera del ámbito de la salud.

 

La principal conclusión del trabajo fue que una plataforma de datos sanitarios puede incorporar la trazabilidad como principio central de diseño y, al mismo tiempo, mantener un procesamiento escalable y cercano al tiempo real para la monitorización continua. DeltaTrace demuestra que es posible mantener un control verificable sobre las versiones de los datos, los modelos y las transformaciones a lo largo de todo el ciclo de vida, lo que refuerza la auditabilidad y la reproducibilidad en entornos de salud digital. Además, al basarse en tecnologías abiertas y un diseño modular, se presenta como una base técnica sólida para desarrollar infraestructuras de datos alineadas con el Espacio Europeo de Datos Sanitarios, favoreciendo un uso del dato más transparente y mejor gobernado tanto en atención como en investigación.

 

Aspectos en relación a los beneficios para las y los pacientes

Los beneficios para las y los pacientes se pueden dividir en tres aspectos. Primero, el seguimiento continuo de la salud y detección precoz. Plataformas como DeltaTrace permiten analizar de forma continua datos de wearables y cuestionarios clínicos validados, lo que ayuda a identificar cambios relevantes en el estado de salud antes de que se conviertan en problemas graves. Esto facilita intervenciones más tempranas y un seguimiento más personalizado, especialmente en personas mayores o pacientes con enfermedades crónicas.

 

Segundo, los resultados son más fiables y transparentes. Al registrar de forma completa cómo se usan y transforman los datos y qué modelos generan cada resultado, se facilita que los sistemas de análisis en salud sean más auditables, reproducibles y confiables. Esto es especialmente importante cuando las decisiones clínicas pueden apoyarse en herramientas de IA.

 

Por último, un uso más seguro y responsable de los datos de salud. Al integrar mecanismos de trazabilidad y gobernanza del dato, estas plataformas favorecen un uso más controlado y transparente de la información sanitaria, alineado con las iniciativas europeas de datos sanitarios. Esto contribuye a impulsar la investigación y la mejora de los servicios de salud, manteniendo la protección y el buen uso de los datos de los pacientes.

 

El grupo de investigación reconoce que “sentimos que con este trabajo se ha dado un paso importante hacia plataformas de datos sanitarios más transparentes y fiables. Proponemos una solución de big data que integra la trazabilidad como principio central y se apoya en tecnologías de código abierto, lo que favorece su adopción y evolución dentro de la comunidad. Además, el enfoque se alinea con las iniciativas europeas orientadas a mejorar la gobernanza y el uso responsable de los datos de salud. Esperamos que estos resultados sirvan como base para futuros proyectos de investigación y desarrollo, facilitando la adopción de este tipo de plataformas y su adaptación a casos de uso reales en salud digital, desde la monitorización de pacientes hasta el análisis reproducible de datos clínicos”.

 

Las y los autores de este trabajo agradecen la colaboración de Markel Arrojo, Naroa Méndez y Daniel R. Torres de Vicomtech. Este estudio ha sido financiado por parte del Gobierno Vasco (proyecto ZE-2021/00003) y ha utilizado el conjunto de datos LifeSnaps, un dataset público con información longitudinal de wearables y cuestionarios, además de datos sintéticos generados para las pruebas de rendimiento.