ai-chemistry-instructions-build-molecule
AI Ini Membaca Instruksi Kimia Anda dan Menemukan Cara Terbaik untuk Membangun Molekul Anda
Para peneliti di EPFL membangun sebuah kerangka kerja yang memungkinkan ahli kimia mendeskripsikan apa yang mereka inginkan dalam bahasa yang sederhana—dan membiarkan AI menyaring ribuan jalur sintesis untuk menemukan yang tepat.
2026-05-06 Sumber:decrypt.co

Secara singkat

  • Synthegy, yang dikembangkan di EPFL, menggunakan LLM untuk memberi peringkat rute sintesis berdasarkan tujuan yang ditentukan ahli kimia, dengan kesesuaian 71,2% dengan penilaian ahli.
  • Kerangka kerja ini divalidasi terhadap 36 ahli kimia independen melalui 368 evaluasi.
  • Eksperimen mencapai tingkat keselarasan yang sebanding dengan kesepakatan antar-ahli.

Mendesain molekul dari awal adalah salah satu masalah tersulit dalam kimia. Ini bukan hanya tentang mengetahui atom mana yang harus dihubungkan—ini tentang mengetahui urutan reaksi yang tepat, kapan harus melindungi bagian-bagian sensitif molekul, dan bagaimana menghindari jalan buntu yang dapat merusak pekerjaan laboratorium berbulan-bulan.

Secara tradisional, pengetahuan tersebut ada di benak para ahli kimia berpengalaman. Sekarang, tim di EPFL ingin memasukkannya ke dalam model bahasa.

Para peneliti yang dipimpin oleh Philippe Schwaller menerbitkan makalah minggu ini di Matter yang menjelaskan Synthegy, sebuah kerangka kerja yang menggunakan model bahasa besar sebagai mesin penalaran untuk perencanaan sintesis kimia. Wawasan utamanya halus namun penting: alih-alih meminta AI untuk menghasilkan molekul, tim menggunakan AI untuk mengevaluasi rute sintesis yang sudah dihasilkan oleh perangkat lunak tradisional.

Begini cara kerjanya: Seorang ahli kimia mengetikkan tujuan dalam bahasa Inggris sederhana, seperti "membentuk cincin pirimidin pada tahap awal." Perangkat lunak retrosintesis yang ada—yang bekerja dengan memecah molekul target menjadi bagian-bagian yang lebih sederhana—kemudian menghasilkan puluhan atau ratusan rute sintesis yang mungkin.

Synthegy mengubah setiap rute menjadi teks dan menyerahkannya ke LLM, yang menilai setiap rute seberapa baik kesesuaiannya dengan instruksi ahli kimia. Yang terbaik akan muncul ke permukaan, disertai penjelasan tertulis mengapa.

"Ketika membuat alat untuk ahli kimia, antarmuka pengguna sangat penting, dan alat sebelumnya mengandalkan filter dan aturan yang rumit," kata Andres M. Bran, penulis utama studi tersebut, dalam sebuah pernyataan dari EPFL.

Sistem ini divalidasi dalam studi double-blind yang melibatkan 36 ahli kimia independen yang meninjau 368 pasang rute. Pilihan mereka cocok dengan Synthegy 71,2% dari waktu, angka yang kira-kira sejalan dengan seberapa sering ahli kimia setuju satu sama lain. Peneliti senior (profesor dan ilmuwan peneliti) lebih sering setuju dengan Synthegy daripada mahasiswa PhD, menunjukkan bahwa sistem ini menangkap intuisi strategis yang sama yang datang dengan pengalaman.

Para peneliti menguji beberapa model AI, termasuk GPT-4o, Claude, dan DeepSeek-r1. AI telah membuat terobosan dalam penemuan obat selama bertahun-tahun, tetapi sebagian besar pendekatan berfokus pada model yang dilatih secara sempit untuk tugas-tugas tertentu. Synthegy dirancang modular—ia dapat terhubung ke mesin retrosintesis apa pun di bagian belakang, dan LLM yang mampu di sisi penalaran. Gemini-2.5-pro mencetak skor tertinggi dalam benchmark, sementara DeepSeek-r1 tampaknya menjadi alternatif open-source yang kuat yang dapat berjalan secara lokal.

Kerangka kerja ini juga menangani masalah kedua: penjernihan mekanisme reaksi. Ini adalah pertanyaan mengapa reaksi kimia terjadi—pergerakan elektron apa yang terjadi di setiap langkah. Synthegy memecah reaksi menjadi langkah-langkah dasar dan meminta LLM menilai setiap langkah kandidat untuk kemungkinan kimiawi. Pada reaksi sederhana seperti substitusi nukleofilik, model terbaik mencapai akurasi mendekati sempurna.

Kasus penggunaan potensialnya luas. Penemuan obat adalah yang paling jelas. AI telah menunjukkan potensi dalam memprediksi hasil pengobatan kanker, tetapi pendekatan yang sama berlaku di mana pun ahli kimia perlu merancang bahan baru atau mengoptimalkan reaksi industri. Satu detail praktis: mengevaluasi 60 rute kandidat dengan Synthegy membutuhkan waktu sekitar 12 menit dan biaya sekitar $2–3 dalam biaya API.

Makalah ini mengakui batasan saat ini. LLM terkadang salah membaca arah reaksi dalam representasi teksnya, yang menyebabkan panggilan kelayakan yang salah. Model yang lebih kecil tidak berkinerja lebih baik daripada tebakan acak. Rute yang lebih panjang dari 20 langkah lebih sulit dilacak secara koheren.

Kode dan benchmark tersedia untuk umum di github.com/schwallergroup/steer.