El grupo de Neuroinmunología del Instituto de Investigación Sanitaria Biogipuzkoa ha analizado cuál es la estrategia informática más robusta para estudiar la microbioma a partir de ARN mensajero. Este trabajo ha sido posible gracias a Alex M. Ascensión, Miriam Gorostidi-Aicua, Ane Otaegui-Chivite, Ainhoa Alberro, Rocio del Carmen Bravo-Miana, Tamara Castillo-Triviño, Laura Moles y David Otaegui y ha sido publicado en la revista científica internacional Frontiers in Microbiology.

El microbioma es el conjunto de microorganismos que conviven en un organismo. En el caso de los humanos, el microbioma es clave para entender la salud y varias enfermedades. Por lo tanto, realizar un análisis correcto de los microorganismos es clave para hacer los estudios de manera adecuada. Para estudiar el material genético de los microorganismos, se emplea un método que recupera las moléculas de ARN mensajero (ARNm), que todos los seres vivos usan para comunicar mensajes sobre qué construir en las células, y son éstas moléculas las que se analizan en las muestras que se recogen. Como cada microorganismo tiene un material genético diferente, se puede ver a qué organismo pertenece cada molécula de ARNm detectada.

Por otro lado, el grupo de investigación estaba interesado en observar ese material en un contexto más concreto: las vesículas extracelulares. Estas vesículas son como gotas de grasa muy pequeñas que tienen proteínas, ARNm y otras moléculas; y que viajan por la sangre, sirviendo para comunicar mensajes entre distintas células del cuerpo. Lo más interesante es que las bacterias y otros microorganismos en el cuerpo humano también crean vesículas extracelulares. Es por ello que, si se extrae el material genético de esas vesículas, puede observarse qué microorganismos se están comunicando en el cuerpo humano.

Uno de los mayores retos que conlleva este tipo de análisis, según lo observado hasta ahora, es que resulta muy complejo conocer exactamente qué microorganismos hay en una muestra en la que se miran moléculas de ARNm. Existen varias razones para esta dificultad, siendo la más importante que, como el entorno en el que trabajamos no es estéril, las muestras pueden contaminarse de material genético de microorganismos que están presentes en la piel humana o de los aparatos que se usan para analizar dichas muestras.

Además, cuando se realiza el análisis de los datos obtenidos mediante programas bioinformáticos (las secuencias de ARNm extraídas de las muestras), se ve que también hay una variabilidad muy grande por diferentes razones. Para el grupo de investigación dos aspectos fueron los más intrigantes. Por un lado, hay grupos de investigación que filtran primero las secuencias de ARNm en el material genético de humano, porque en teoría puede haber secuencias de humano que sean similares a las de microorganismos; mientras que otros grupos no hacen esa búsqueda previa. Por otro lado, existen diferentes programas para asignar esas secuencias de ARNm a los microorganismos y, además, cada programa tiene parámetros que los hacen más o menos sensibles, es decir, que asignan más o menos secuencias que pueden ser dudosas.

Teniendo en cuenta todo lo anterior, el grupo de investigación se planteó dar respuesta a tres preguntas: cómo de necesario es filtrar antes las secuencias en el genoma humano, qué combinación de parámetros es mejor para los programas de asignación y cómo de importante es utilizar controles para disminuir el efecto de la contaminación.

El procedimiento seguido para dar respuesta a estas preguntas consistió en extraer vesículas extracelulares de plasma sanguíneo de personas con esclerosis múltiple, así como de individuos sanos. Además, se prepararon dos muestras de control utilizando vesículas extracelulares obtenidas de cultivos de dos bacterias comunes: Lactobacillus acidophilus y Bifidobacterium lactis, que sirven para identificar posibles contaminantes. Si se encuentran secuencias de ARNm de otros microorganismos, no se puede concluir que las secuencias de las muestras provengan del propio plasma, sino que también de la contaminación por el procesamiento.

Además, se generó un archivo de secuencias artificiales, de 60 especies distintas, cuyas secuencias genéticas es conocida. Esto permite evaluar la eficacia de los programas de asignación y detectar posibles sesgos en sus parámetros. Por ejemplo, si se emplean parámetros muy estrictos, se puede observar que se asigna una cantidad de secuencias mucho menor de la esperada.

Una vez obtenidos todos los datos, el grupo de investigación diseñó un procedimiento en el que analizaron cinco programas de asignación con nueve configuraciones de parámetros cada uno. Así, se evaluaron diversas maneras de procesar, comparar y combinar los resultados para obtener un análisis robusto. Gracias a ello, el estudio logró dar respuesta a las 3 preguntas planteadas.

Por un lado, se observó que incluir el genoma humano para hacer la asignación como paso previo, era de ayuda, pero no tanto como se podría esperar. Para algunos programas, la asignación de especies de microorganismos aumentó, pero no drásticamente.  Por otro lado, al descartar combinaciones de parámetros extremas (que sean muy sensibles o muy poco sensibles), en general los programas son estables a la hora de asignar secuencias. Aunque hay algunos programas que son mejores y otros peores, en este caso se comprobó que, juntando los resultados de cada programa por separado, los resultados eran aún más robustos. Esto sucede porque si bien cada programa tiene su sesgo (por ejemplo, la preferencia por un tipo de secuencia) al juntar los resultados, se asigna teniendo en cuenta lo que es común a todos los programas. Finalmente, observaron la importancia de incluir los controles derivados de cultivos de bacterias, ya que, de los 151 microorganismos detectados en las vesículas extracelulares de plasma sanguíneo, 67 quedan excluidos en base a este criterio. Es decir, esos 67 microorganismos pueden estar presentes en plasma, pero no se puede afirmarlo sin lugar a dudas, así que es preferible descartar que estén presentes. Algunos de estos microorganismos son comunes en la piel (Cutibacterium, Dermococcus, Malassezia); otros están presentes en el intestino, pero aparecen también en el ambiente (Escherichia, Enterobacter); y otros se han visto en los kits de procesamiento de muestras (Acinetobacter). Aun así, esto no significa que se puedan descartar directamente, porque algunos de estos microorganismos, como Malassezia, se han visto asociados con la esclerosis múltiple en otros tipos de análisis. Por último, se analizó qué organismos estaban más presentes en las muestras de personas con esclerosis múltiple con respecto a personas sin la condición. En general no se detectaron organismos con diferencias claras, aunque sí con tendencias, como Xanthomonas, Blautia y Suterella.

Con este estudio, se puede concluir que analizar datos de ARNm de microorganismos requiere un análisis más complejo que el que se suele utilizar, y que es muy importante incluir controles para reducir la incertidumbre sobre la detección de organismos contaminantes. Este estudio también es útil para informar a profesionales que tengan dudas sobre cómo analizar este tipo de datos, y así hacer un análisis que tenga mayor calidad. Siendo un trabajo de investigación básica, tiene un impacto indirecto sobre los pacientes, pero permite desarrollar investigaciones con menos sesgos, más robustas, que puedan ser útiles para encontrar diferencias en el microbioma de pacientes. Esto puede servir para realizar estudios complementarios o para buscar maneras para equilibrar desbalances en el microbioma que pueda mejorar la salud de las y los pacientes.

Según el grupo investigador “El trabajo de este artículo nos ha ayudado a aportar luz a un campo que tiene mucha incertidumbre. El análisis del microbioma es muy complicado y, por tanto, realizar un estudio más sistemático sobre cómo analizar este tipo de datos nos da confianza, ya que esperamos que estudios futuros que se basen en este análisis muestren resultados menos sesgados, y por tanto puedan contribuir al conocimiento científico de una mejor manera.”

Este estudio ha recibido apoyo financiero del Programa de Becas de Investigación Postdoctoral ECTRIMS, Gobierno Vasco (POS_2020_1_0008), Instituto de Salud Carlos III (CD20/00095), Universidad del País Vasco, Departamento de Educación del Gobierno Vasco (IKUR-Nanoneuro) e Instituto de Salud Carlos III (proyectos PI23/00903 y PI20/00327), cofinanciado por la Unión Europea.