La investigadora Noelia Ferruz Capapey (Zaragoza, 1988) es una de las grandes figuras de la bioinformática molecular de nuestro país, un campo que hace poco era «ciencia-ficción», pero que con el decidido desarrollo de la Inteligencia Artificial aplicada a la biología y la síntesis de biomoléculas hoy es una espectacular realidad.
Noelia Ferruz es la líder del Grupo Ramón y Cajal en el Institut de Biologia Molecular de Barcelona (IBMB-CSIC), y el año pasado recibió el premio L’Oréal-Unesco por su investigación sobre cómo aplicar la AI -un programa similar al ChatGPT- al diseño de proteínas artificiales «a la carta», un área de enormes implicaciones en muchísimos campos de la medicina: oncología, terapia celular, vacunas, enfermedades raras.
Recientemente el grupo de inteligencia artificial para el diseño de proteínas en el Institut de Biología Molecular de Barcelona (IBMB-CSIC) se ha unido a un consorcio que busca diseñar y producir partículas virales que puedan ser usados como vectores para modificar determinadas células del organismo, in vivo, de forma que expresen proteínas diseñadas «a la carta».
Concretamente, persiguen una manera de realizar in vivo la terapia celular. Hace tiempo que es posible extraer determinadas células del organismo y modificarlas genéticamente in vitro para que expresen una proteína deseada. Este es el caso de la terapia de CAR-T cells en inmunooncología, que se está desarrollando de manera espectacular y esperanzadora. Pero es complejo: hay que extraer las células por aféresis, hay que multiplicarlas y volverlas a infundir en el paciente. Lo que esta investigación persigue es un atajo, modificar tipos celulares específicos en el propio organismo. mediante vectores virales.
En este proyecto utilizan la IA en varios niveles. Usan un programa similar al ChatGPT para diseñar proteínas sintéticas, «a la carta», con formas específicas para que cumplan funciones deseadas, incluso nuevas funciones de proteínas que antes no eran factibles. También se usa la IA para generar las secuencias de ADN que se traducirán en las proteínas deseadas. Por último, se usa la IA para diseñar vectores virales capaces de dirigirse de manera selectiva sólo a un tipo muy concreto de célula diana, para descargar allí y sólo allí su carga genética.
No es el futuro, es el presente. Las “proteínas a la carta” ya están en el menú de la biotecnología.
.
Su grupo se ha unido a un consorcio de diferentes empresas biotecnológicas y centros de investigación nacionales para un proyecto que suena a ciencia-ficción: diseñar proteínas “a la carta” mediante inteligencia artificial.
Así es. Somos un consorcio de seis grupos, tres empresas y tres grupos de investigación, y cada uno hace una parte bastante diferente. Nosotros nos dedicamos a la ingeniería informática, a implementar modelos de lenguaje informático, y entrenar a una Inteligencia Artificial para producir proteínas. Son programas muy parecidos al ChatGPT que cuando se entrenan en secuencias de proteínas son capaces de diseñar nuevas proteínas con capacidades y funciones que el usuario define. Esto tiene muchas, muchísimas aplicaciones, y uno de los proyectos en lo que lo vamos a aplicar es en este consorcio. Nuestro grupo hace la primera parte del proyecto, que tiene como seis pasos. Una vez que hemos «entrenado» un modelo, lo entregamos al siguiente partner.
¿Cuál es el potencial biomédico de diseñar proteínas a la carta?
Inmenso. Tiene muchísimas, muchísimas aplicaciones. Sobre todo nosotros trabajamos con enzimas, que son proteínas que catalizan reacciones bioquímicas dentro del organismo, que aceleran esas reacciones y lo hacen de una manera sostenible, sin requerir elementos tóxicos o condiciones muy extremas como altas presiones o temperaturas muy elevadas. Son moléculas muy atractivas desde el punto de vista biotecnológico o industrial, porque podrían acelerar y facilitar procesos químicos que actualmente son muy caros, difíciles o contaminantes, haciéndolos más baratos, asequibles y limpios.
Las “proteínas a la carta” ya están en el menú
Otra cosa para lo que se puede utilizar el diseño de proteínas por IA es para muchísimas terapias, proteínas que curen o bloqueen enfermedades. Por ejemplo, hay enfermedades que se provocan porque un paciente no produce cantidad suficiente de una proteína, o no la puede producir en absoluto; con lo que podemos hacer un reemplazamiento.
O muchos cánceres se tratan con inmunoterapia: conociendo los marcadores celulares, las proteínas específicas de la superficie de la célula maligna, podemos diseñar los anticuerpos que se unan específicamente a esos marcadores y los designen para ser destruidos por el sistema inmune, evitando que el cáncer prolifere.
Pero hay que advertir que aunque estamos haciendo muchos avances, este campo está aún en una fase muy básica. Que se diseñe una proteína y que pase todos los controles clínicos y que llegue a poder ser usada en una terapia es aún muy difícil, pocas llegan a ese nivel.
El único caso que conozco de una proteína diseñada por Inteligencia Artificial que ha llegado a ser usada clínicamente es una vacuna contra el Covid desarrollada durante la pandemia por un grupo de Seattle en EEUU, diseñaron varias proteínas para ser usadas como espículas del coronavirus con capacidad inmunogénica, y se aprobó y se comercializó en Corea del Sur. Como te digo aún hay pocos ejemplos de proteínas diseñadas por IA que hayan sido aprobadas por las agencias sanitarias.
Pero las posibilidades son enormes y con el tiempo llegarán más. Si conseguimos control total y afinado sobre este proceso, se abren muchísimos caminos para la biomedicina que no son factibles a día de hoy. Las proteínas hacen todas las funciones imaginables, son máquinas moleculares que hacen cosas muy variadas. Aprender a diseñarlas a la carta para que hagan las tareas deseadas es un enorme salto en la biotecnología.
Las proteínas hacen casi todas las funciones imaginables
No sólo están las aplicaciones a la medicina, sino a resolver gravísimos problemas medioambientales. En una entrevista, usted ha afirmado que diseñar proteínas a la carta podría usarse para eliminar el plástico de los océanos. ¿Es posible diseñar una enzima que degrade el PET, por ejemplo?
Exacto, gracias por mencionarlo. Efectivamente, hay grupos de investigación que encontraron en una zona cerca de Japón bacterias que estaban alimentándose de plástico residual en el océano, algo muy interesante. Aislaron la enzima que es capaz de digerir, de romper los enlaces del polímero plástico. Y ahí comenzó una carrera por ver quién conseguía una versión mejorada de esta enzima que se pudiera usar a nivel industrial.
En uno de los trabajos más conocidos usaron un modelo de inteligencia artificial, para provocar cambios, mutaciones aquí y allá, en la proteína buscando sus mejoras, para que se pueda usar a temperaturas más elevadas, que sea útil durante más tiempo, más eficiente, más rápida… Esto también está en sus primeras etapas, pero es un avance enorme, abre la puerta a una vía sostenible para hidrolizar el plástico, para lidiar con el grave problema de la contaminación por plásticos y microplásticos en las aguas.
Las posibilidades son enormes
Pero entonces, ¿ya se puede usar un programa como el ChatGPT y decirle: «quiero una enzima que degrade plástico, y que funcione a 40ºC”, y el ordenador te genera una secuencia?
Depende del ‘training set’ del que dispongas, de la lista de aprendizaje que tiene la IA. Si se han identificado suficientes ejemplos en la naturaleza de una secuencia que genere un centro activo enzimático capaz de degradar un tipo de plástico como para poder aprender de ellas, entonces el programa es capaz de generar enzimas que degraden ese polímero, incluso nuevas proteínas que no tengan que ver con las anteriores, muy diferentes a las naturales.
Lo de la temperatura es mucho más difícil. Se puede entrenar a la IA para que genere proteínas más termorresistentes, pero es más difícil, hace falta investigar más.
Y luego, creo que de aquí a cinco años tendremos una interfaz de esta IA para proteínas para interactuar con ella con órdenes verbales, con lenguaje humano, como lo hace ChatGPT, pero todavía no disponemos de eso. Me parece que hay una empresa en EEUU que ya tiene algo así. De momento le damos órdenes por códigos: yo le escribo «4-2-2-1», eso significa «anhidrasa carbónica» y genera ese tipo de enzima, pero aún no le puedo dar órdenes habladas.
Desde Foros 21 entrevistamos hace poco a Alfonso Valencia, pionero de la biocomputación en España, que nos contaba cómo el Barcelona Supercomputing Center – Centro Nacional de Supercomputación (BSC-CNS), está construyendo un nuevo superordenador, el Mare Nostrum 5, capaz de ejecutar 200.000 billones de operaciones por segundo. ¿Este vertiginoso desarrollo tecnológico está haciendo dar grandes saltos a este campo, no?
Totalmente. Mira, para entrenar la IA que nosotros usamos necesitamos muchísimos recursos. Para el primero que entrené usé 128 tarjetas gráficas, muchísimas, durante una semana entera. Me dejaron un cluster [granjas de computadoras trabajando al unísono] durante toda la navidad. Y cada tarjeta gráfica de este tipo cuesta entre 10.000 y 40.000 dólares.
Cluster de más de 100 ordenadores hay pocos, pero el Barcelona Supercomputing Center creo que ya tiene más de mil, y por eso es de las supercomputadoras más rápidas y potentes del mundo. Se ha convertido en un clúster superpuntero en Europa y en todo el mundo, y esto va a ayudar muchísimo a todos los equipos que como el mio están desarrollando la IA para la biotecnología, para que se entrenen más modelos de este equipo.
Vivimos un momento muy espectacular en esta área
Porque además Barcelona es ahora mismo un centro muy destacado en el desarrollo de la biomedicina, la biotecnología y la bioinformática en toda España y toda Europa…
Desde luego, aquí en Barcelona hay varios parques de investigación, y además tenemos una buena incubadora de start-ups, están saliendo muchas empresas muy interesantes con aplicación biomédica. Así que la verdad que sí, es un sitio muy interesante para desarrollar este campo. Vivimos un momento muy espectacular en esta área del conocimiento y la tecnología, donde todas las semanas hay un avance nuevo.