StartseiteLBank Newscenter
Diese KI liest Ihre Chemieanweisungen und findet den besten Weg, Ihnen ein Molekül zu bauen
ai-chemistry-instructions-build-molecule
Diese KI liest Ihre Chemieanweisungen und findet den besten Weg, Ihnen ein Molekül zu bauen
Forscher an der EPFL haben ein Framework entwickelt, das Chemikern ermöglicht, ihre Wünsche in einfacher Sprache zu beschreiben – und KI durch tausende Syntheserouten zu durchsuchen, um die passende zu finden.
2026-05-06 Quelle:decrypt.co

Kurz gesagt

  • Synthegy, entwickelt an der EPFL, nutzt LLMs, um Syntheserouten anhand von vom Chemiker definierten Zielen zu bewerten, wobei es in 71,2 % der Fälle mit Expertenurteilen übereinstimmt.
  • Das Framework wurde von 36 unabhängigen Chemikern in 368 Evaluierungen validiert.
  • Die Experimente erreichten Übereinstimmungsraten, die mit der Übereinstimmung zwischen Experten vergleichbar sind.

Ein Molekül von Grund auf zu entwerfen, ist eines der schwierigsten Probleme der Chemie. Es geht nicht nur darum zu wissen, welche Atome verbunden werden müssen – es geht darum, die richtige Reihenfolge der Reaktionen zu kennen, empfindliche Teile des Moleküls zu schützen und Sackgassen zu vermeiden, die monatelange Laborarbeit zunichtemachen könnten.

Traditionell existiert dieses Wissen in den Köpfen erfahrener Chemiker. Nun will ein Team der EPFL es in ein Sprachmodell integrieren.

Forscher unter der Leitung von Philippe Schwaller veröffentlichten diese Woche in Matter eine Arbeit, die Synthegy beschreibt, ein Framework, das große Sprachmodelle als Denkmaschinen für die chemische Syntheseplanung einsetzt. Die zentrale Erkenntnis ist subtil, aber wichtig: Anstatt die KI zu bitten, Moleküle zu generieren, nutzt das Team die KI, um Syntheserouten zu bewerten, die traditionelle Software bereits erstellt.

So funktioniert es: Ein Chemiker gibt ein Ziel in einfachem Englisch ein, etwa „den Pyrimidinring in den frühen Phasen bilden“. Bestehende Retrosynthese-Software – die Zielmoleküle in einfachere Bestandteile zerlegt – generiert dann Dutzende oder Hunderte möglicher Syntheserouten.

Synthegy wandelt jede Route in Text um und übergibt sie einem LLM, das jede Route danach bewertet, wie gut sie der Anweisung des Chemikers entspricht. Die besten Routen steigen nach oben, mit schriftlichen Erklärungen, warum.

„Bei der Entwicklung von Werkzeugen für Chemiker spielt die Benutzeroberfläche eine große Rolle, und frühere Werkzeuge verließen sich auf umständliche Filter und Regeln“, sagte Andres M. Bran, Hauptautor der Studie, in einer Erklärung der EPFL.

Das System wurde in einer doppelblinden Studie validiert, an der 36 unabhängige Chemiker teilnahmen, die 368 Routenpaare überprüften. Ihre Auswahlen stimmten in 71,2 % der Fälle mit denen von Synthegy überein, eine Zahl, die ungefähr der Häufigkeit entspricht, mit der sich Experten-Chemiker untereinander einig sind. Höhere Forscher (Professoren und wissenschaftliche Mitarbeiter) stimmten Synthegy häufiger zu als Doktoranden, was darauf hindeutet, dass das System die gleichen strategischen Intuitionen erfasst, die mit Erfahrung einhergehen.

Die Forscher testeten mehrere KI-Modelle, darunter GPT-4o, Claude und DeepSeek-r1. KI hat seit Jahren Fortschritte in der Arzneimittelentwicklung gemacht, aber die meisten Ansätze konzentrieren sich auf eng trainierte Modelle für spezifische Aufgaben. Synthegy ist modular aufgebaut – es kann an jede Retrosynthese-Engine im Backend und jedes fähige LLM auf der Denkseite angeschlossen werden. Gemini-2.5-pro erzielte die höchsten Werte im Benchmark, während DeepSeek-r1 eine starke Open-Source-Alternative zu sein scheint, die lokal ausgeführt werden kann.

Das Framework bewältigt auch ein zweites Problem: die Aufklärung von Reaktionsmechanismen. Dies ist die Frage, warum eine chemische Reaktion abläuft – welche Elektronenbewegungen bei jedem Schritt stattfinden. Synthegy zerlegt Reaktionen in elementare Schritte und lässt das LLM jeden Kandidatenschritt auf chemische Plausibilität bewerten. Bei einfachen Reaktionen wie nukleophilen Substitutionen erreichten die besten Modelle eine nahezu perfekte Genauigkeit.

Die potenziellen Anwendungsfälle sind vielfältig. Die Arzneimittelentwicklung ist der offensichtlichste. KI hat bereits vielversprechende Ergebnisse bei der Vorhersage von Krebsbehandlungsergebnissen gezeigt, aber der gleiche Ansatz gilt überall dort, wo Chemiker neue Materialien entwerfen oder industrielle Reaktionen optimieren müssen. Ein praktisches Detail: Die Bewertung von 60 Kandidatenrouten mit Synthegy dauert etwa 12 Minuten und kostet etwa 2–3 $ an API-Gebühren.

Die Arbeit erkennt aktuelle Grenzen an. LLMs interpretieren die Richtung einer Reaktion in ihrer Textdarstellung manchmal falsch, was zu falschen Machbarkeitsbewertungen führt. Kleinere Modelle erzielen keine besseren Ergebnisse als zufälliges Raten. Routen, die länger als 20 Schritte sind, sind schwerer kohärent zu verfolgen.

Der Code und die Benchmarks sind öffentlich unter github.com/schwallergroup/steer verfügbar.