
Thiết kế một phân tử từ đầu là một trong những vấn đề khó khăn nhất của hóa học. Đó không chỉ là việc biết cách kết nối các nguyên tử – đó là việc biết đúng thứ tự phản ứng, thời điểm bảo vệ các phần nhạy cảm của phân tử và cách tránh những ngõ cụt có thể phá hỏng hàng tháng làm việc trong phòng thí nghiệm.
Theo truyền thống, kiến thức đó nằm trong đầu của các nhà hóa học giàu kinh nghiệm. Giờ đây, một nhóm tại EPFL muốn đưa nó vào một mô hình ngôn ngữ.
Các nhà nghiên cứu do Philippe Schwaller dẫn đầu đã công bố một bài báo trên tạp chí Matter tuần này mô tả Synthegy, một khung sử dụng các mô hình ngôn ngữ lớn làm công cụ lý luận cho việc lập kế hoạch tổng hợp hóa học. Quan điểm chính rất tinh tế nhưng quan trọng: thay vì yêu cầu AI tạo ra các phân tử, nhóm sử dụng AI để đánh giá các lộ trình tổng hợp mà phần mềm truyền thống đã tạo ra.
Cách hoạt động như sau: Một nhà hóa học nhập một mục tiêu bằng tiếng Anh đơn giản, chẳng hạn như "tạo vòng pyrimidine ở giai đoạn đầu." Phần mềm đảo tổng hợp (retrosynthesis) hiện có – hoạt động bằng cách chia các phân tử mục tiêu thành các phần đơn giản hơn – sau đó tạo ra hàng chục hoặc hàng trăm lộ trình tổng hợp khả thi.
Synthegy chuyển đổi mỗi lộ trình thành văn bản và đưa cho một LLM, LLM này sẽ chấm điểm mỗi lộ trình dựa trên mức độ phù hợp với hướng dẫn của nhà hóa học. Những lộ trình tốt nhất sẽ nổi lên hàng đầu, kèm theo giải thích bằng văn bản về lý do.
"Khi tạo công cụ cho các nhà hóa học, giao diện người dùng rất quan trọng, và các công cụ trước đây dựa vào các bộ lọc và quy tắc cồng kềnh," Andres M. Bran, tác giả chính của nghiên cứu, cho biết trong một tuyên bố từ EPFL.
Hệ thống đã được xác thực trong một nghiên cứu mù đôi (double-blind study) với sự tham gia của 36 nhà hóa học độc lập, những người đã xem xét 368 cặp lộ trình. Các lựa chọn của họ khớp với Synthegy 71,2% số lần, một con số xấp xỉ với tần suất các nhà hóa học chuyên gia đồng ý với nhau. Các nhà nghiên cứu cấp cao (giáo sư và nhà khoa học nghiên cứu) đồng ý với Synthegy thường xuyên hơn các nghiên cứu sinh tiến sĩ, cho thấy hệ thống nắm bắt được những trực giác chiến lược tương tự có được từ kinh nghiệm.
Các nhà nghiên cứu đã thử nghiệm một số mô hình AI, bao gồm GPT-4o, Claude và DeepSeek-r1. AI đã thâm nhập vào lĩnh vực khám phá thuốc trong nhiều năm, nhưng hầu hết các phương pháp tiếp cận tập trung vào các mô hình được đào tạo chuyên biệt cho các nhiệm vụ cụ thể. Synthegy được thiết kế theo mô-đun – nó có thể cắm vào bất kỳ công cụ đảo tổng hợp nào ở phần phụ trợ, và bất kỳ LLM có khả năng nào ở phía lý luận. Gemini-2.5-pro đạt điểm cao nhất trong tiêu chuẩn, trong khi DeepSeek-r1 dường như là một lựa chọn mã nguồn mở mạnh mẽ có thể chạy cục bộ.
Khung này cũng giải quyết một vấn đề thứ hai: làm sáng tỏ cơ chế phản ứng. Đây là câu hỏi về lý do tại sao một phản ứng hóa học xảy ra – những chuyển động electron nào diễn ra ở mỗi bước. Synthegy chia các phản ứng thành các bước cơ bản và yêu cầu LLM đánh giá từng bước ứng cử viên về tính hợp lý hóa học. Đối với các phản ứng đơn giản như thế nucleophilic, các mô hình tốt nhất đạt được độ chính xác gần như hoàn hảo.
Các trường hợp sử dụng tiềm năng rất rộng. Phát hiện thuốc là điều hiển nhiên. AI đã cho thấy hứa hẹn trong việc dự đoán kết quả điều trị ung thư, nhưng cách tiếp cận tương tự cũng áp dụng ở bất cứ nơi nào các nhà hóa học cần thiết kế vật liệu mới hoặc tối ưu hóa các phản ứng công nghiệp. Một chi tiết thực tế: đánh giá 60 lộ trình ứng cử viên với Synthegy mất khoảng 12 phút và chi phí khoảng 2–3 đô la phí API.
Bài báo thừa nhận những giới hạn hiện tại. LLM đôi khi đọc sai hướng của một phản ứng trong biểu diễn văn bản của nó, dẫn đến các đánh giá khả thi sai. Các mô hình nhỏ hơn không hoạt động tốt hơn việc đoán ngẫu nhiên. Các lộ trình dài hơn 20 bước khó theo dõi một cách mạch lạc hơn.
Mã nguồn và các điểm chuẩn được công khai tại github.com/schwallergroup/steer.