Tổng hợp tin tức về crypto theo thẻ và nội dung theo chủ đề

ai-chemistry-instructions-build-molecule

Trí Tuệ Nhân Tạo Này Đọc Hướng Dẫn Hóa Học Của Bạn và Tìm Ra Cách Tốt Nhất Để Xây Dựng Phân Tử Cho Bạn

Các nhà nghiên cứu tại EPFL đã xây dựng một khung làm việc cho phép các nhà hóa học mô tả những gì họ muốn bằng ngôn ngữ đơn giản — và để AI sàng lọc hàng nghìn con đường tổng hợp để tìm ra con đường phù hợp.

2026-05-06 Nguồn:decrypt.co

Mô hình Ngôn ngữ Lớn Hóa học

Tổng hợp Hóa học AI

Lập kế hoạch Phân tích tổng hợp ngược

Tóm tắt

Synthegy, được phát triển tại EPFL, sử dụng các LLM để xếp hạng các lộ trình tổng hợp dựa trên mục tiêu do nhà hóa học định nghĩa, khớp với đánh giá của chuyên gia 71,2% số lần.
Khung này đã được xác thực với 36 nhà hóa học độc lập qua 368 lần đánh giá.
Các thử nghiệm đạt tỷ lệ phù hợp tương đương với sự đồng thuận giữa các chuyên gia.

Thiết kế một phân tử từ đầu là một trong những vấn đề khó khăn nhất của hóa học. Đó không chỉ là việc biết cách kết nối các nguyên tử – đó là việc biết đúng thứ tự phản ứng, thời điểm bảo vệ các phần nhạy cảm của phân tử và cách tránh những ngõ cụt có thể phá hỏng hàng tháng làm việc trong phòng thí nghiệm.

Theo truyền thống, kiến thức đó nằm trong đầu của các nhà hóa học giàu kinh nghiệm. Giờ đây, một nhóm tại EPFL muốn đưa nó vào một mô hình ngôn ngữ.

Các nhà nghiên cứu do Philippe Schwaller dẫn đầu đã công bố một bài báo trên tạp chí Matter tuần này mô tả Synthegy, một khung sử dụng các mô hình ngôn ngữ lớn làm công cụ lý luận cho việc lập kế hoạch tổng hợp hóa học. Quan điểm chính rất tinh tế nhưng quan trọng: thay vì yêu cầu AI tạo ra các phân tử, nhóm sử dụng AI để đánh giá các lộ trình tổng hợp mà phần mềm truyền thống đã tạo ra.

Cách hoạt động như sau: Một nhà hóa học nhập một mục tiêu bằng tiếng Anh đơn giản, chẳng hạn như "tạo vòng pyrimidine ở giai đoạn đầu." Phần mềm đảo tổng hợp (retrosynthesis) hiện có – hoạt động bằng cách chia các phân tử mục tiêu thành các phần đơn giản hơn – sau đó tạo ra hàng chục hoặc hàng trăm lộ trình tổng hợp khả thi.

Synthegy chuyển đổi mỗi lộ trình thành văn bản và đưa cho một LLM, LLM này sẽ chấm điểm mỗi lộ trình dựa trên mức độ phù hợp với hướng dẫn của nhà hóa học. Những lộ trình tốt nhất sẽ nổi lên hàng đầu, kèm theo giải thích bằng văn bản về lý do.

"Khi tạo công cụ cho các nhà hóa học, giao diện người dùng rất quan trọng, và các công cụ trước đây dựa vào các bộ lọc và quy tắc cồng kềnh," Andres M. Bran, tác giả chính của nghiên cứu, cho biết trong một tuyên bố từ EPFL.

Hệ thống đã được xác thực trong một nghiên cứu mù đôi (double-blind study) với sự tham gia của 36 nhà hóa học độc lập, những người đã xem xét 368 cặp lộ trình. Các lựa chọn của họ khớp với Synthegy 71,2% số lần, một con số xấp xỉ với tần suất các nhà hóa học chuyên gia đồng ý với nhau. Các nhà nghiên cứu cấp cao (giáo sư và nhà khoa học nghiên cứu) đồng ý với Synthegy thường xuyên hơn các nghiên cứu sinh tiến sĩ, cho thấy hệ thống nắm bắt được những trực giác chiến lược tương tự có được từ kinh nghiệm.

Các nhà nghiên cứu đã thử nghiệm một số mô hình AI, bao gồm GPT-4o, Claude và DeepSeek-r1. AI đã thâm nhập vào lĩnh vực khám phá thuốc trong nhiều năm, nhưng hầu hết các phương pháp tiếp cận tập trung vào các mô hình được đào tạo chuyên biệt cho các nhiệm vụ cụ thể. Synthegy được thiết kế theo mô-đun – nó có thể cắm vào bất kỳ công cụ đảo tổng hợp nào ở phần phụ trợ, và bất kỳ LLM có khả năng nào ở phía lý luận. Gemini-2.5-pro đạt điểm cao nhất trong tiêu chuẩn, trong khi DeepSeek-r1 dường như là một lựa chọn mã nguồn mở mạnh mẽ có thể chạy cục bộ.

Khung này cũng giải quyết một vấn đề thứ hai: làm sáng tỏ cơ chế phản ứng. Đây là câu hỏi về lý do tại sao một phản ứng hóa học xảy ra – những chuyển động electron nào diễn ra ở mỗi bước. Synthegy chia các phản ứng thành các bước cơ bản và yêu cầu LLM đánh giá từng bước ứng cử viên về tính hợp lý hóa học. Đối với các phản ứng đơn giản như thế nucleophilic, các mô hình tốt nhất đạt được độ chính xác gần như hoàn hảo.

Các trường hợp sử dụng tiềm năng rất rộng. Phát hiện thuốc là điều hiển nhiên. AI đã cho thấy hứa hẹn trong việc dự đoán kết quả điều trị ung thư, nhưng cách tiếp cận tương tự cũng áp dụng ở bất cứ nơi nào các nhà hóa học cần thiết kế vật liệu mới hoặc tối ưu hóa các phản ứng công nghiệp. Một chi tiết thực tế: đánh giá 60 lộ trình ứng cử viên với Synthegy mất khoảng 12 phút và chi phí khoảng 2–3 đô la phí API.

Bài báo thừa nhận những giới hạn hiện tại. LLM đôi khi đọc sai hướng của một phản ứng trong biểu diễn văn bản của nó, dẫn đến các đánh giá khả thi sai. Các mô hình nhỏ hơn không hoạt động tốt hơn việc đoán ngẫu nhiên. Các lộ trình dài hơn 20 bước khó theo dõi một cách mạch lạc hơn.

Mã nguồn và các điểm chuẩn được công khai tại github.com/schwallergroup/steer.

Tin nổi bật

ETF Bitcoin Ghi Nhận Chuỗi Mua Liên Tiếp 5 Tuần Khi Các Vị Thế Phòng Ngừa Giảm, Nhu Cầu Tổ Chức Quay Trở Lại

14 giờ trước

Nhà Trắng Đặt Mục Tiêu Thông Qua Đạo Luật Minh Bạch Vào Ngày 4 Tháng 7: Cố Vấn Crypto

15 giờ trước

Bản tin sáng: Morgan Stanley đang nhắm đến Coinbase

15 giờ trước

Bài viết khác

JPMorgan cho biết chiến lược mua bitcoin có thể đạt 30 tỷ USD trong năm nay với tốc độ hiện tại

3 giờ trước

Cuộc bùng nổ ETF Crypto tiếp tục với quỹ đầu tiên theo dõi Canton ra mắt