El algoritmo que revolucionó la ciencia: hace en segundos lo que lleva meses en el laboratorio
Un modelo de IA de Google logra en tiempo récord predecir la estructura tridimensional de las proteínas. Qué avances médicos permitirá la plataforma que está abierta a todos los científicos
El avance en sí mismo no es una novedad, ya tiene unos dos años y fue ampliamente difundido, pero recientemente la plataforma de IA fue utilizada por científicos de todo el mundo que lograron predecir las estructuras de unas 200 millones de proteínas de 1 millón de especies diferentes lo que, se estima, significaría todas o la mayor parte de las proteínas conocidas por los seres humanos.
El llamado “problema de plegamiento de proteínas” es algo que los biólogos hace décadas intentan descifrar y el modelo de IA AlphaFold fue fundamental en este trabajo. Se trata de un producto de DeepMind, la empresa de inteligencia artificial con sede en Londres que fue adquirida en 2014 por Google, que la transformó en Alphabet.
Qué son las proteínas
Las proteínas son moléculas grandes y complejas que desempeñan muchas funciones críticas en el cuerpo. Realizan la mayor parte del trabajo en las células y son necesarias para la estructura, función y regulación de los tejidos y órganos del cuerpo, según lo define MedlinePlus.
Las proteínas están formadas por cientos o miles de unidades más pequeñas llamadas aminoácidos, que se unen entre sí en largas cadenas. Hay 20 tipos diferentes de aminoácidos que se pueden combinar para formar una proteína. La secuencia de aminoácidos determina la estructura tridimensional única de cada proteína y su función específica.
De esta forma, las proteínas son los impulsores biológicos de todo, desde los virus hasta los seres humanos. Comienzan como cadenas de compuestos químicos antes de doblarse en formas tridimensionales únicas. Esas formas y los aminoácidos que las componen, definen qué pueden hacer las proteínas y cómo se pueden usar.
Si los biólogos logran predecir la forma que adquirirá una proteína pueden comprender mejor su función y sus vínculos con otros procesos moleculares. Por ejemplo, muchos fármacos se desarrollan usando información de proteínas y predecir su plegamiento podría acelerar el descubrimiento de medicamentos.
El problema aquí no es comprender cómo funcionan en forma general las proteínas y sus aminoácidos y para qué se utilizan, sino la velocidad con que los científicos pueden identificar la estructura final de una proteína, ya que esto generalmente lleva muchos años de trabajo de laboratorio.
Ante esto, los expertos necesitaban un algoritmo de inteligencia artificial que pudiera identificar rápidamente la forma que adoptará una proteína.
El logro de la IA
AlphaFold es un modelo de inteligencia artificial diseñado para predecir la estructura tridimensional de las proteínas. Si bien no es el único sistema puesto a disposición para este desafío si, puede decirse, es el que ganó la partida en un desafío bienal de predicción de estructura de proteínas a fines de 2020, con un desempeño casi tan bueno como el trabajo experimental estándar, pero mucho más rápido.
AlphaFold predice estructuras de proteínas a través de una red neuronal de aprendizaje profundo que se entrenó en miles de proteínas conocidas y sus estructuras. El modelo usó esas conexiones conocidas para aprender a predecir rápidamente la forma de otras proteínas y predecir lo que viene después.
El sistema de IA fue reconocido por la revista Science como el avance del año de 2021, superando a otros candidatos como las píldoras antivirales COVID-19 y la aplicación de la edición de genes CRISPR en el cuerpo humano.
El nuevo avance
El último anuncio se realizó el 28 de julio, cuando DeepMind anunció que investigadores de todo el mundo utilizaron AlphaFold para predecir las estructuras de unos 200 millones de proteínas de 1 millón de especies, cubriendo casi todas las proteínas conocidas por los seres humanos.
Los datos, dijo la plataforma, pueden ser usados por cualquier investigador en forma gratuita accediendo a la base de datos creada por DeepMind y el Instituto Europeo de Bioinformática del Laboratorio Europeo de Biología Molecular.
“Esencialmente, (se) puede pensar que cubre todo el universo de proteínas”, dijo el CEO de DeepMind, Demis Hassabis, en una conferencia de prensa. “Estamos al comienzo de una nueva era de biología digital”.
El uso de la base de datos es sencillo, ya que funciona esencialmente como una búsqueda de Google. Es decir, los científicos pueden escribir la proteína conocida y recuperar su estructura a futuro, lo que ahorra a los investigadores semanas e incluso meses de trabajo de laboratorio.
Esta velocidad, se estima, permitirá reducir también los costos de las investigaciones. Kathryn Tunyasuvunakool, científica investigadora de DeepMind, dijo a la prensa que AlphaFold requirió solo de 10 a 20 segundos para hacer cada predicción de proteína. Eso podría ser especialmente útil para los investigadores que trabajan en enfermedades desatendidas como la leishmaniasis y la enfermedad de Chagas, que siempre carecen de fondos porque afectan principalmente a las personas pobres.
El científico estadounidense Eric Topol dijo el día del anuncio sobre la predicción de las estructuras de más de 200 millones de proteínas que era “un gran día para la IA en las ciencias de la vida”.
Los usos de la IA
Los extraordinarios avances de la IA para distintos usos es innegables, pero aún está lejos de ser confiable para los usuarios comunes.
Un ejemplo del enorme desarrollo son los asistentes de voz creados por Apple y Amazon. Uno de los problemas que aparecen como más evidentes son los sesgos de equidad, es decir las omisiones que se hacen de algunas minorías o sectores marginados, aunque este es un problema en el que debe intervenir la política. También han comenzado a surgir las advertencias en torno de los usos negativos y dañinos que pueden darse a desarrollos como el de la predicción de las estructuras de las proteínas que pueden servir tanto para producir medicamentos que salven vidas, como toxinas que las afecten.
DeepMind admitió que analizó los peligros potenciales de abrir su base de datos al público, pero al consultar con más de 30 expertos en bioseguridad y ética, concluyó que los beneficios, incluida la aceleración del desarrollo de defensas efectivas contra amenazas biológicas, superaron cualquier riesgo.
“La acumulación de conocimiento humano es solo un gran beneficio”, dijo Ewen Birney, director del Instituto Europeo de Bioinformática, a los periodistas. “Y es probable que las entidades que podrían ser riesgosas sean un puñado muy pequeño”.
Aseguró que AlphaFold es una herramienta altamente efectiva que puede hacer cosas que los humanos no pueden hacer fácilmente. En el proceso, puede hacer que esos biólogos humanos sean aún más efectivos en sus trabajos.