ai-chemistry-instructions-build-molecule
Esta IA lee tus instrucciones químicas y encuentra la mejor manera de construirte una molécula
Investigadores de la EPFL crearon un marco que permite a los químicos describir lo que desean en lenguaje sencillo y que la IA revise miles de rutas de síntesis para encontrar la adecuada.
2026-05-06 Fuente:decrypt.co

En resumen

  • Synthegy, desarrollado en la EPFL, utiliza LLM para clasificar rutas de síntesis según objetivos definidos por químicos, coincidiendo con juicios expertos el 71.2% de las veces.
  • El marco fue validado con 36 químicos independientes a través de 368 evaluaciones.
  • Los experimentos alcanzaron tasas de alineación comparables a la concordancia entre expertos.

Diseñar una molécula desde cero es uno de los problemas más difíciles de la química. No se trata solo de saber qué átomos conectar, sino de conocer el orden correcto de las reacciones, cuándo proteger partes sensibles de la molécula y cómo evitar callejones sin salida que podrían arruinar meses de trabajo de laboratorio.

Tradicionalmente, ese conocimiento reside en las mentes de químicos experimentados. Ahora, un equipo de la EPFL quiere incorporarlo a un modelo de lenguaje.

Investigadores dirigidos por Philippe Schwaller publicaron esta semana un artículo en Matter que describe Synthegy, un marco que utiliza grandes modelos de lenguaje (LLM) como motores de razonamiento para la planificación de síntesis químicas. La clave es sutil pero importante: en lugar de pedirle a la IA que genere moléculas, el equipo utiliza la IA para evaluar las rutas de síntesis que el software tradicional ya produce.

Así es como funciona: Un químico introduce un objetivo en lenguaje natural, algo como "formar el anillo de pirimidina en las primeras etapas". El software de retrosíntesis existente, que funciona dividiendo las moléculas objetivo en piezas más simples, genera docenas o cientos de posibles rutas de síntesis.

Synthegy convierte cada ruta en texto y la entrega a un LLM, que puntúa cada ruta según lo bien que se ajusta a la instrucción del químico. Las mejores ascienden a la cima, con explicaciones escritas de por qué.

"Al crear herramientas para químicos, la interfaz de usuario es muy importante, y las herramientas anteriores se basaban en filtros y reglas engorrosos", afirmó Andres M. Bran, autor principal del estudio, en un comunicado de la EPFL.

El sistema fue validado en un estudio doble ciego con 36 químicos independientes que revisaron 368 pares de rutas. Sus selecciones coincidieron con las de Synthegy el 71.2% de las veces, un número que está aproximadamente en línea con la frecuencia con la que los químicos expertos están de acuerdo entre sí. Los investigadores senior (profesores y científicos de investigación) coincidieron con Synthegy más a menudo que los estudiantes de doctorado, lo que sugiere que el sistema captura las mismas intuiciones estratégicas que vienen con la experiencia.

Los investigadores probaron varios modelos de IA, incluidos GPT-4o, Claude y DeepSeek-r1. La IA ha estado avanzando en el descubrimiento de fármacos durante años, pero la mayoría de los enfoques se centran en modelos entrenados de forma restringida para tareas específicas. Synthegy está diseñado para ser modular: puede conectarse a cualquier motor de retrosíntesis en el backend y a cualquier LLM capaz en el lado del razonamiento. Gemini-2.5-pro obtuvo la puntuación más alta en el punto de referencia, mientras que DeepSeek-r1 parece ser una alternativa de código abierto sólida que puede ejecutarse localmente.

El marco también aborda un segundo problema: la elucidación del mecanismo de reacción. Esta es la cuestión de por qué ocurre una reacción química, qué movimientos de electrones tienen lugar en cada paso. Synthegy descompone las reacciones en movimientos elementales y hace que el LLM evalúe cada paso candidato en cuanto a su plausibilidad química. En reacciones simples como las sustituciones nucleofílicas, los mejores modelos lograron una precisión casi perfecta.

Los posibles casos de uso son amplios. El descubrimiento de fármacos es el más obvio. La IA ya ha demostrado ser prometedora en la predicción de resultados de tratamientos contra el cáncer, pero el mismo enfoque se aplica en cualquier lugar donde los químicos necesiten diseñar nuevos materiales u optimizar reacciones industriales. Un detalle práctico: evaluar 60 rutas candidatas con Synthegy lleva aproximadamente 12 minutos y cuesta entre 2 y 3 dólares en tarifas de API.

El artículo reconoce las limitaciones actuales. Los LLM a veces malinterpretan la dirección de una reacción en su representación textual, lo que lleva a evaluaciones de viabilidad incorrectas. Los modelos más pequeños no obtienen mejores resultados que el azar. Las rutas de más de 20 pasos son más difíciles de seguir coherentemente.

El código y los benchmarks están disponibles públicamente en github.com/schwallergroup/steer.