César de la Fuente (UPenn): “Las alucinaciones de la IA pueden ayudar a descubrir nuevos atntibióticos”

antibióticos
El investigador español César de la Fuente, dirige desde la Universidad de Pensilvania, el proyecto de descubrimiento antibióticos más grande de la historia.

El gallego César de la Fuente lleva más de una década trabajando en la idea de usar la capacidad de las máquinas para acelerar el descubrimiento de nuevos compuestos antibacterianos. Hizo el doctorado en la Universidad de Columbia Británica en Canadá, y el postdoctorado en el Massachusetts Institute of Technology (MIT). Allí fue donde por primera vez consiguió demostrar que algo diseñado con inteligencia artificial podía ser efectivo en modelos de ratón. La Universidad de Pennsylvania le reclutó y desde hace seis años dirige un laboratorio en Philadelphia en el que investiga en la intersección entre los antibióticos y la IA.

Pregunta: Durante la redacción del capítulo sobre “Inteligencia artificial (IA) aplicada al descubrimiento de antibióticos”, del informe INTEC 2025 de la Cátedra Ciencia y Sociedad de la Fundación Rafael del Pino, empiezo a leer informes y papers en los que no deja de aparecer el nombre de César de la Fuente. Ya habías sido incluido en listados de prestigio como los 35 Under 35 del MIT, eres reconocido en nuestro país, pero verte en Bulletin of Atomic Scientists fue ya demasiado.

Respuesta: Es una revista que empezaron Oppenheimer, Einstein y gente así, es muy curiosa. Se inició en la época del Proyecto Manhattan. Me invitaron a escribir sobre algo en lo que llevo mucho tiempo trabajando: la aplicación de herramientas computacionales, incluido el machine learning, para el descubrimiento y diseño de antibióticos.

Pregunta: En el artículo de Atomic Scientists dices que muchas empresas han registrado sus antibióticos para ir a la quiebra directamente. ¿Cómo es posible en un mundo que ha sido capaz de reaccionar tan rápido a la pandemia del Covid-19 y con la amenaza de las bacterias súper resistentes?

Respuesta: Uno de los problemas grandes es que no hay mercado, porque los antibióticos tradicionalmente han sido tan baratos que realmente es muy difícil hacer dinero con ellos. Las compañías ni siquiera llegan al break even al final de todo el proceso. Cuando Elon Musk lanzó Tesla, la industria del automóvil era tremendamente conservadora, pero al menos había un mercado. En este caso, es muy difícil penetrar ahí y obviamente hacer dinero es imposible. Los mercados económicos no funcionan en el caso de los antibióticos.

"Pensar en la biología como código y conseguir nuevos antibióticos"

Pregunta: Desde los años 80 no se registra una nueva familia de antibióticos, es un dato brutal. Cuando comenzaste, no existía la tecnología de transformers que ha hecho posible el estallido de la IA generativa.

Respuesta: Empezamos aplicando métodos de programación evolutiva para tomar moléculas que existían y optimizarlas. Después nos metimos más en redes neuronales, deep learning, y ahora en modelos de lenguaje grandes (LLM). Cuando propusimos usar la IA y los ordenadores para diseñar antibióticos, la gente decía que era imposible, porque muy pocos lo habían intentado.

En el ámbito de la biología, el consenso era que tenía demasiadas variables y que, con una serie de algoritmos, no se podía hacer mucho. Lo demostramos experimentalmente, sintetizamos de manera química antibióticos y demostramos que podían reducir infecciones en ratones. Hace unos años se nos ocurrió que podíamos pensar en la biología como un montón de código, si lo conceptualizas de esa manera, podemos desarrollar algoritmos para explorar esta gran fuente de información y encontrar moléculas codificadas o escondidas que pueden ser potenciales de antibióticos.

Y acabasteis buscando a lo largo de la evolución.

Sí, miramos a nuestros antepasados más cercanos, neandertales y mamuts y encontramos información ahí también, con un modelo de machine learning.

Una de las grandes aportaciones del nuevo ciclo de la IA va a ser su capacidad de iluminar partes de la realidad que estaban oscuras, de acceder a nuevas fuentes de datos.

Sí, antes era imposible hacer esto a escala. Uno de los objetivos de mi laboratorio es llevar la biología al ámbito digital, en vez de tener que hacer todo en el mundo físico. Estos algoritmos, estas herramientas, nos permiten encontrar cosas que jamás hubieran sido posibles. Millones de potenciales antibióticos en la biología de hoy y en la biología ancestral, que hemos minado gracias a un modelo de IA nuevo que creamos en laboratorio, llamado Apex.

Descubrir antibióticos con métodos tradicionales puede tardar 6 o 7 años, y hoy en día, en unas horas, podemos encontrar cientos de miles de compuestos. Es una aceleración dramática. Obviamente, eso no quiere decir que esas moléculas vayan a ser un antibiótico mañana, porque todavía tienen que ir a fase clínica, pero hemos demostrado que a fase preclínica podemos llevar muchos de ellos ya.

"Patentar compuestos diseñados por la IA"

Leo que la tendencia de la IA generativa a alucinar puede ser una ventaja para el descubrimiento de fármacos. Lo que faltaba.

Puede ser útil en el sentido de que una alucinación se puede pensar como un proceso creativo. La IA crea algo nuevo diferente en cuanto a su distribución a lo que se ha usado para entrenar el modelo. Realmente podemos sintetizar casi cualquier molécula, incluso aunque el modelo alucine, con lo cual no estamos restringidos en ese sentido. Puede ser algo positivo, puede traer un elemento de creatividad al proyecto. De hecho, tenemos un modelo que publicamos ya hace años de programación evolutiva que fue capaz de diseñar moléculas con un mecanismo de acción completamente nuevo para matar bacterias.

Por cierto, ¿cómo se gestiona el tema de la propiedad intelectual?

Si el compuesto ha sido diseñado por la IA, lo sintetizas y lo demuestras in vitro o en experimentos en vivo en ratones, puede ser patentable. Si solo demuestras que has usado un software para crear una molécula, en general no puedes patentarlo. Hay que demostrarlo más allá de la IA.

Como usuario de la IA, al igual que muchas empresas hoy, ¿cuál es la clave para sacar el máximo partido a la herramienta?

Hace más de siete años ya, para probar mi hipótesis disponía de bases de datos estándar. Tenía muy claro que, en el ámbito de la biología, para que los modelos de IA fueran exitosos y útiles, había que generar mejores datos con los que alimentarlos. Llevamos años alimentando nuestra propia base de datos para entrenar modelos. Con la publicación de Apex, por primera vez demostramos que esa hipótesis es correcta, que, si realmente se generan datos a nivel experimental usando métodos estandarizados completamente desde el principio, los modelos que puedes entrenar son los mejores del mundo. Pero claro, requiere un montón de esfuerzo.

"Hemos encontrado casi un millón de moléculas nuevas"

¿Generación de datos en el laboratorio o mediante programación?

En el laboratorio, a nivel experimental todo. Si tomas bases de datos públicas, no sabes cómo se han generado los datos, hay mucha heterogeneidad y al final los modelos no van a ser tan buenos y robustos. Pensar en la biología como una fuente de información nos ha ayudado mucho para llegar al nivel donde estamos ahora. Hace 12 años, cuando propusimos esto, no era obvio, la gente estaba usando la IA para reconocer patrones de sonidos y caras, pero no para aplicarla a algo tan multidimensional como el mundo biológico, que es obviamente super caótico, con elementos no sólo de biología, sino también de química, estadística, matemáticas, física.

Al convertir la biología en una fuente de información, de alguna forma esa investigación se equipara a las de otros ámbitos de conocimiento. ¿Qué lecciones de la experiencia acumulada en el laboratorio podrían extenderse más allá de la biología?

Si quieres usar la IA y que tenga éxito, genera tus propios datos desde cero. Eso va a requerir que las fuentes de financiación apoyen no solo proyectos dirigidos por hipótesis, sino también proyectos de ingeniería en los que se generen bases de datos útiles para un problema en concreto. Asimismo, incorporar conceptos de otros campos, como en mi caso el de la información, puede ser útil para avanzar en ámbitos que quizás están un poco atascados.

Habéis creado un recurso web abierto, accesible, en el que se pueden consultar muchos de los descubrimientos realizados.

Es el proyecto de descubrimiento antibióticos más grande de la historia, nos ha permitido encontrar casi un millón de moléculas nuevas gracias a la exploración de más de 90.000 genomas microbianos y más de 60.000 metagenomas microbianos. Hemos liberado toda esa información en una página web, es decir, todo el mundo tiene acceso a todas estas moléculas. Decidimos hacerlo con el objetivo de poder acelerar el proceso de descubrimiento y desarrollo de nuevos antibióticos. Eso es lo interesante, hemos actuado al margen de presiones para hacer dinero con todo esto y hemos liberado al mundo toda esta información, todas esas moléculas, esos compuestos.

Especiales

Ajustes
Innovación española

A través del presente Panel de Configuración, puede aceptar o rechazarlas en su totalidad o puede seleccionar qué tipo de cookies quiere aceptar y cuáles quiere rechazar.

Para obtener más información, acceda a nuestra Política de Cookies

Cookies técnicas

Las cookies técnicas que son estrictamente necesarias y permanecen siempre activas son para que el usuario acceda y navegue en INNOVASPAIN.COM.

Cookies de Preferencias o personalización

Utilizamos cookies de personalización que son aquellas que, tratadas por nosotros o por terceros, nos permiten recordar información para que el usuario acceda al servicio con determinadas características que pueden diferenciar su experiencia de la de otros usuarios.

Si desactivas esta cookie no podremos guardar tus preferencias. Esto significa que cada vez que visites esta web tendrás que activar o desactivar las cookies de nuevo.

Cookies Analíticas

Utilizamos cookies de análisis o medición que son aquellas que, tratadas por nosotros o por terceros, nos permiten el seguimiento y análisis del comportamiento de los usuarios de los sitios web a los que están vinculadas, incluida la cuantificación de los impactos de los anuncios.