El gallego César de la Fuente lleva más de una década trabajando en la idea de usar la capacidad de las máquinas para acelerar el descubrimiento de nuevos compuestos antibacterianos. Hizo el doctorado en la Universidad de Columbia Británica en Canadá, y el postdoctorado en el Massachusetts Institute of Technology (MIT). Allí fue donde por primera vez consiguió demostrar que algo diseñado con inteligencia artificial podía ser efectivo en modelos de ratón. La Universidad de Pennsylvania le reclutó y desde hace seis años dirige un laboratorio en Philadelphia en el que investiga en la intersección entre los antibióticos y la IA.
Pregunta: Durante la redacción del capítulo sobre “Inteligencia artificial (IA) aplicada al descubrimiento de antibióticos”, del informe INTEC 2025 de la Cátedra Ciencia y Sociedad de la Fundación Rafael del Pino, empiezo a leer informes y papers en los que no deja de aparecer el nombre de César de la Fuente. Ya habías sido incluido en listados de prestigio como los 35 Under 35 del MIT, eres reconocido en nuestro país, pero verte en Bulletin of Atomic Scientists fue ya demasiado.
Respuesta: Es una revista que empezaron Oppenheimer, Einstein y gente así, es muy curiosa. Se inició en la época del Proyecto Manhattan. Me invitaron a escribir sobre algo en lo que llevo mucho tiempo trabajando: la aplicación de herramientas computacionales, incluido el machine learning, para el descubrimiento y diseño de antibióticos.
Pregunta: En el artículo de Atomic Scientists dices que muchas empresas han registrado sus antibióticos para ir a la quiebra directamente. ¿Cómo es posible en un mundo que ha sido capaz de reaccionar tan rápido a la pandemia del Covid-19 y con la amenaza de las bacterias súper resistentes?
Respuesta: Uno de los problemas grandes es que no hay mercado, porque los antibióticos tradicionalmente han sido tan baratos que realmente es muy difícil hacer dinero con ellos. Las compañías ni siquiera llegan al break even al final de todo el proceso. Cuando Elon Musk lanzó Tesla, la industria del automóvil era tremendamente conservadora, pero al menos había un mercado. En este caso, es muy difícil penetrar ahí y obviamente hacer dinero es imposible. Los mercados económicos no funcionan en el caso de los antibióticos.
"Pensar en la biología como código y conseguir nuevos antibióticos"
Pregunta: Desde los años 80 no se registra una nueva familia de antibióticos, es un dato brutal. Cuando comenzaste, no existía la tecnología de transformers que ha hecho posible el estallido de la IA generativa.
Respuesta: Empezamos aplicando métodos de programación evolutiva para tomar moléculas que existían y optimizarlas. Después nos metimos más en redes neuronales, deep learning, y ahora en modelos de lenguaje grandes (LLM). Cuando propusimos usar la IA y los ordenadores para diseñar antibióticos, la gente decía que era imposible, porque muy pocos lo habían intentado.
En el ámbito de la biología, el consenso era que tenía demasiadas variables y que, con una serie de algoritmos, no se podía hacer mucho. Lo demostramos experimentalmente, sintetizamos de manera química antibióticos y demostramos que podían reducir infecciones en ratones. Hace unos años se nos ocurrió que podíamos pensar en la biología como un montón de código, si lo conceptualizas de esa manera, podemos desarrollar algoritmos para explorar esta gran fuente de información y encontrar moléculas codificadas o escondidas que pueden ser potenciales de antibióticos.
Y acabasteis buscando a lo largo de la evolución.
Sí, miramos a nuestros antepasados más cercanos, neandertales y mamuts y encontramos información ahí también, con un modelo de machine learning.
Una de las grandes aportaciones del nuevo ciclo de la IA va a ser su capacidad de iluminar partes de la realidad que estaban oscuras, de acceder a nuevas fuentes de datos.
Sí, antes era imposible hacer esto a escala. Uno de los objetivos de mi laboratorio es llevar la biología al ámbito digital, en vez de tener que hacer todo en el mundo físico. Estos algoritmos, estas herramientas, nos permiten encontrar cosas que jamás hubieran sido posibles. Millones de potenciales antibióticos en la biología de hoy y en la biología ancestral, que hemos minado gracias a un modelo de IA nuevo que creamos en laboratorio, llamado Apex.
Descubrir antibióticos con métodos tradicionales puede tardar 6 o 7 años, y hoy en día, en unas horas, podemos encontrar cientos de miles de compuestos. Es una aceleración dramática. Obviamente, eso no quiere decir que esas moléculas vayan a ser un antibiótico mañana, porque todavía tienen que ir a fase clínica, pero hemos demostrado que a fase preclínica podemos llevar muchos de ellos ya.
"Patentar compuestos diseñados por la IA"
Leo que la tendencia de la IA generativa a alucinar puede ser una ventaja para el descubrimiento de fármacos. Lo que faltaba.
Puede ser útil en el sentido de que una alucinación se puede pensar como un proceso creativo. La IA crea algo nuevo diferente en cuanto a su distribución a lo que se ha usado para entrenar el modelo. Realmente podemos sintetizar casi cualquier molécula, incluso aunque el modelo alucine, con lo cual no estamos restringidos en ese sentido. Puede ser algo positivo, puede traer un elemento de creatividad al proyecto. De hecho, tenemos un modelo que publicamos ya hace años de programación evolutiva que fue capaz de diseñar moléculas con un mecanismo de acción completamente nuevo para matar bacterias.
Por cierto, ¿cómo se gestiona el tema de la propiedad intelectual?
Si el compuesto ha sido diseñado por la IA, lo sintetizas y lo demuestras in vitro o en experimentos en vivo en ratones, puede ser patentable. Si solo demuestras que has usado un software para crear una molécula, en general no puedes patentarlo. Hay que demostrarlo más allá de la IA.
Como usuario de la IA, al igual que muchas empresas hoy, ¿cuál es la clave para sacar el máximo partido a la herramienta?
Hace más de siete años ya, para probar mi hipótesis disponía de bases de datos estándar. Tenía muy claro que, en el ámbito de la biología, para que los modelos de IA fueran exitosos y útiles, había que generar mejores datos con los que alimentarlos. Llevamos años alimentando nuestra propia base de datos para entrenar modelos. Con la publicación de Apex, por primera vez demostramos que esa hipótesis es correcta, que, si realmente se generan datos a nivel experimental usando métodos estandarizados completamente desde el principio, los modelos que puedes entrenar son los mejores del mundo. Pero claro, requiere un montón de esfuerzo.
"Hemos encontrado casi un millón de moléculas nuevas"
¿Generación de datos en el laboratorio o mediante programación?
En el laboratorio, a nivel experimental todo. Si tomas bases de datos públicas, no sabes cómo se han generado los datos, hay mucha heterogeneidad y al final los modelos no van a ser tan buenos y robustos. Pensar en la biología como una fuente de información nos ha ayudado mucho para llegar al nivel donde estamos ahora. Hace 12 años, cuando propusimos esto, no era obvio, la gente estaba usando la IA para reconocer patrones de sonidos y caras, pero no para aplicarla a algo tan multidimensional como el mundo biológico, que es obviamente super caótico, con elementos no sólo de biología, sino también de química, estadística, matemáticas, física.
Al convertir la biología en una fuente de información, de alguna forma esa investigación se equipara a las de otros ámbitos de conocimiento. ¿Qué lecciones de la experiencia acumulada en el laboratorio podrían extenderse más allá de la biología?
Si quieres usar la IA y que tenga éxito, genera tus propios datos desde cero. Eso va a requerir que las fuentes de financiación apoyen no solo proyectos dirigidos por hipótesis, sino también proyectos de ingeniería en los que se generen bases de datos útiles para un problema en concreto. Asimismo, incorporar conceptos de otros campos, como en mi caso el de la información, puede ser útil para avanzar en ámbitos que quizás están un poco atascados.
Habéis creado un recurso web abierto, accesible, en el que se pueden consultar muchos de los descubrimientos realizados.
Es el proyecto de descubrimiento antibióticos más grande de la historia, nos ha permitido encontrar casi un millón de moléculas nuevas gracias a la exploración de más de 90.000 genomas microbianos y más de 60.000 metagenomas microbianos. Hemos liberado toda esa información en una página web, es decir, todo el mundo tiene acceso a todas estas moléculas. Decidimos hacerlo con el objetivo de poder acelerar el proceso de descubrimiento y desarrollo de nuevos antibióticos. Eso es lo interesante, hemos actuado al margen de presiones para hacer dinero con todo esto y hemos liberado al mundo toda esta información, todas esas moléculas, esos compuestos.






