ai-chemistry-instructions-build-molecule
هذا الذكاء الاصطناعي يقرأ تعليمات الكيمياء الخاصة بك ويجد أفضل طريقة لبناء جزيء لك
طور باحثون في EPFL إطار عمل يتيح للكيميائيين وصف ما يريدونه بلغة بسيطة—ويتيح للذكاء الاصطناعي تصفح آلاف طرق التخليق للعثور على الطريقة المناسبة.
2026-05-06 المصدر:decrypt.co

باختصار

  • تستخدم Synthegy، التي طُورت في المعهد الفدرالي السويسري للتكنولوجيا في لوزان (EPFL)، نماذج اللغة الكبيرة (LLMs) لترتيب مسارات التخليق الكيميائي بناءً على الأهداف التي يحددها الكيميائيون، وتتطابق مع أحكام الخبراء بنسبة 71.2% من الوقت.
  • تم التحقق من صحة الإطار مقابل 36 كيميائيًا مستقلًا عبر 368 تقييمًا.
  • وصلت التجارب إلى معدلات توافق مماثلة للاتفاق بين الخبراء.

يُعد تصميم جزيء من الصفر أحد أصعب المشاكل في الكيمياء. فالأمر لا يتعلق فقط بمعرفة الذرات التي يجب ربطها، بل بمعرفة الترتيب الصحيح للتفاعلات، ومتى يجب حماية الأجزاء الحساسة من الجزيء، وكيفية تجنب الطرق المسدودة التي قد تُفسد أشهرًا من العمل المخبري.

تقليديًا، تعيش هذه المعرفة في رؤوس الكيميائيين ذوي الخبرة. والآن، يرغب فريق في المعهد الفدرالي السويسري للتكنولوجيا في لوزان (EPFL) في وضعها ضمن نموذج لغوي.

نشر باحثون بقيادة فيليب شوالر ورقة بحثية هذا الأسبوع في مجلة Matter تصف Synthegy، وهو إطار عمل يستخدم نماذج اللغة الكبيرة كمحركات استدلال لتخطيط التخليق الكيميائي. تكمن الفكرة الرئيسية، الدقيقة ولكن المهمة، في أن الفريق لا يطلب من الذكاء الاصطناعي توليد الجزيئات، بل يستخدم الذكاء الاصطناعي لتقييم مسارات التخليق التي تنتجها البرامج التقليدية بالفعل.

إليك كيفية عمله: يكتب الكيميائي هدفًا باللغة الإنجليزية البسيطة، مثل "تشكيل حلقة البيريميدين في المراحل المبكرة". ثم تقوم برامج التخليق الرجعي (retrosynthesis) الحالية — التي تعمل عن طريق تقسيم الجزيئات المستهدفة إلى أجزاء أبسط — بتوليد عشرات أو مئات من مسارات التخليق الممكنة.

تقوم Synthegy بتحويل كل مسار إلى نص وتقديمه لنموذج لغوي كبير (LLM)، والذي يقيم كل مسار بناءً على مدى مطابقته لتعليمات الكيميائي. تظهر أفضل المسارات في الأعلى، مع تفسيرات مكتوبة لسبب تفضيلها.

"عند صنع أدوات للكيميائيين، فإن واجهة المستخدم مهمة للغاية، وكانت الأدوات السابقة تعتمد على مرشحات وقواعد مرهقة"، قال أندريس إم بران، المؤلف الرئيسي للدراسة، في بيان صادر عن EPFL.

تم التحقق من صحة النظام في دراسة مزدوجة التعمية شملت 36 كيميائيًا مستقلًا قاموا بمراجعة 368 زوجًا من المسارات. تطابقت اختياراتهم مع Synthegy بنسبة 71.2% من الوقت، وهو رقم يتماشى تقريبًا مع معدل اتفاق الكيميائيين الخبراء فيما بينهم. اتفق الباحثون الكبار (الأساتذة وعلماء الأبحاث) مع Synthegy بوتيرة أعلى من طلاب الدكتوراه، مما يشير إلى أن النظام يلتقط نفس الحدس الاستراتيجي الذي يأتي مع الخبرة.

اختبر الباحثون عدة نماذج للذكاء الاصطناعي، بما في ذلك GPT-4o و Claude و DeepSeek-r1. لقد حقق الذكاء الاصطناعي تقدمًا في اكتشاف الأدوية لسنوات، لكن معظم الأساليب تركز على نماذج مدربة بشكل ضيق لمهام محددة. تم تصميم Synthegy ليكون معياريًا — يمكن توصيله بأي محرك تخليق رجعي في الواجهة الخلفية، وبأي نموذج لغوي كبير قادر على جانب الاستدلال. حقق Gemini-2.5-pro أعلى الدرجات في المعيار، بينما يبدو DeepSeek-r1 بديلاً قويًا مفتوح المصدر يمكن تشغيله محليًا.

يتعامل الإطار أيضًا مع مشكلة ثانية: توضيح آلية التفاعل. هذا هو السؤال عن سبب حدوث التفاعل الكيميائي — ما هي حركات الإلكترونات التي تحدث في كل خطوة. تقوم Synthegy بتقسيم التفاعلات إلى حركات أساسية ويجعل نموذج اللغة الكبير (LLM) يقيم كل خطوة مرشحة من حيث المعقولية الكيميائية. في التفاعلات البسيطة مثل الاستبدالات النيوكليوفيلية، حققت أفضل النماذج دقة شبه مثالية.

تطبيقات الاستخدام المحتملة واسعة. اكتشاف الأدوية هو المجال الأكثر وضوحًا. لقد أظهر الذكاء الاصطناعي بالفعل وعدًا في التنبؤ بنتائج علاج السرطان، ولكن نفس النهج ينطبق في أي مكان يحتاج فيه الكيميائيون إلى تصميم مواد جديدة أو تحسين التفاعلات الصناعية. تفصيل عملي واحد: يستغرق تقييم 60 مسارًا مرشحًا باستخدام Synthegy حوالي 12 دقيقة ويكلف حوالي 2-3 دولارات في رسوم واجهة برمجة التطبيقات (API).

تقر الورقة بالقيود الحالية. أحيانًا تُسيء نماذج اللغة الكبيرة (LLMs) قراءة اتجاه التفاعل في تمثيلها النصي، مما يؤدي إلى تقديرات خاطئة للجدوى. النماذج الأصغر لا تؤدي أفضل من التخمين العشوائي. المسارات التي تزيد عن 20 خطوة يصعب تتبعها بشكل متماسك.

الكود والمعايير متاحة للجمهور على github.com/schwallergroup/steer.

العملات المشفرة الشائعة
سجل الآن ولا تفوّت أي تحديثات!