Investigadores de la Universidad Rovira i Virgili (URV), en España, han logrado predecir mutaciones del covid-19 mediante computación, análisis de datos masivos y redes neuronales artificiales.
El grupo de investigación Quimioinformática y Nutrición de la URV, liderado por Santi Garcia y Gerard Pujadas, ha diseñado un sistema de aprendizaje automático que predice mutaciones recurrentes de los coronavirus, una información que, según los investigadores, permitirá adelantarse en el desarrollo de fármacos.
Garcia explicó que los virus infecciosos se instalan en células vivas para reproducirse y fuerzan a los mecanismos celulares reproductores a sintetizar la información genética del propio virus.
En el caso del covid-19, las instrucciones necesarias para reproducirse están en su núcleo en forma de ácido ribonucleico (ARN).
Mientras el ADN humano presenta una estructura de doble hélice, el ARN está formado por una sola cadena, que codifica la información mediante cuatro componentes: adenina, guanina, citosina y uracilo.
Cuando existen errores en el proceso de replicación –cambios en el orden en que se presentan estas cuatro bases– aparecen las mutaciones.
Según Garcia, si bien se creía que estos desórdenes en las cadenas de ARN eran totalmente aleatorios, investigaciones anteriores detectaron que existían errores más frecuentes que otros, concretamente algunas enzimas —sustancias orgánicas que catalizan reacciones químicas— propias del huésped tendían a convertir la citosina del ARN del virus en uracilo.
En este contexto, los investigadores han diseñado un sistema de aprendizaje automático basado en una red neuronal artificial que es capaz de predecir las mutaciones del virus, derivadas del contacto de la información genética con ciertas enzimas del huésped del virus.
Una vez analizada la evolución del virus teniendo en cuenta sus mutaciones, entrenaron una red neuronal artificial con datos de más de 800 mil genomas del virus para que esta aprendiera a predecir qué mutaciones recurrentes se darían de cara al futuro.
Una red neuronal artificial es un sistema computacional de aprendizaje automático que conecta múltiples nodos llamados neuronas artificiales que, cuando se entrenan para realizar una tarea en particular, son capaces de trabajar conjuntamente para procesar grandes volúmenes de datos.
Estos sistemas aprenden por sí solos y pueden moldearse a sí mismos para conseguir un determinado resultado, a petición de los investigadores.
El procedimiento consiste en utilizar una parte del genoma para crear la red y reservar una parte, suficientemente amplia, para testearla y corregir su funcionamiento si fuera necesario.
En este caso, el equipo reservó cuatro genes, uno de los cuales contiene la información de la proteína que permite al virus entrar en las células para infectarlas, a fin de focalizar el estudio en esta dirección.
Según la URV, este sistema, que nunca se había aplicado en la predicción de mutaciones del virus, ha permitido a los investigadores adelantarse a los cambios recurrentes del virus, catalizados por las enzimas propias del cuerpo humano.
El sistema también identifica aquellas partes del virus que no pueden cambiar, puesto que si lo hacen el agente infeccioso es incapaz de reproducirse.
Toda esta información permitiría a los investigadores adelantarse en el diseño de fármacos y hacerlos más efectivos de cara a la eliminación del virus, utilizando las debilidades detectadas para dificultar su reproducción.
"Esta investigación aporta información relevante para la comunidad científica, y queda aquí para que se pueda consultar", dijo Santi Garcia, que ha asegurado que la metodología es replicable en futuras pandemias, especialmente si las causa un coronavirus.
MO