University of Missouri veröffentlicht PSBench-Benchmark für Proteinmodelle zur KI-gestützten Arzneimittelentwicklung
Forscher der University of Missouri haben mit PSBench eine Datenbank mit 1,4 Millionen annotierten und von unabhängigen Experten verifizierten Proteinstrukturmodellen veröffentlicht. Die Ressource soll die Bewertung KI-basierter Proteinmodelle verbessern und damit die datengetriebene Entwicklung biologischer Arzneimittel unterstützen.
Forscher der University of Missouri haben PSBench veröffentlicht, eine Datenbank mit 1,4 Millionen annotierten Proteinstrukturmodellen, eine neue Ressource, die die Arzneimittelentwicklung für Krankheiten wie Alzheimer und Krebs beschleunigen könnte. Die Modelle wurden von unabhängigen Experten verifiziert und sollen Wissenschaftlern dabei helfen, präzisere Systeme der künstlichen Intelligenz zur Bewertung der Qualität von Proteinstrukturmodellen zu entwickeln. Jüngste Fortschritte in der KI, darunter Werkzeuge wie AlphaFold, haben die Vorhersage von Proteinstrukturen deutlich verbessert, doch kein einzelnes KI-Tool ist für jeden Proteintyp durchgängig präzise.
Die Datenbank liefert Wissenschaftlern Informationen, mit denen sie beurteilen können, ob vorhergesagten Proteinmodellen vertraut werden kann, was für die Entwicklung künftiger medizinischer Behandlungen entscheidend ist. Proteine steuern jeden biologischen Prozess im menschlichen Körper, und ihre dreidimensionalen Formen bestimmen, wie sie funktionieren. Selbst kleine strukturelle Veränderungen können zu Krankheiten führen.
Die Ressource PSBench wurde unter Nutzung hausinterner und gemeinschaftsweiter Ressourcen aufgebaut, die im Rahmen des Critical Assessment of protein Structure Prediction (CASP) entstanden sind, das weithin als internationaler Goldstandard für die Bewertung computergestützter Methoden zur Proteinvorhersage gilt. Der alle 2 Jahre stattfindende Wettbewerb wurde geschaffen, um Computermodelle unabhängig zu testen, die vorhersagen, wie sich Proteinketten in die 3D-Formen falten, die sie für ihre Funktion benötigen.
Diese Fortschritte spiegeln einen breiteren Wandel in der Erforschung biologischer Arzneimittel wider: weg von einem langsamen, experimentellen Prozess hin zu einer datengetriebenen Ingenieursdisziplin. Fortschritte im Deep Learning – von Protein-Sprachmodellen, die die Grammatik von Sequenzen interpretieren, über Strukturprädiktoren bis hin zu generativen Modellen der nächsten Generation – ermöglichen es Forschern, komplexe biologische Moleküle mit beispielloser Präzision zu entschlüsseln, vorherzusagen und zu erzeugen. Indem diese Systeme aus umfangreichen biologischen Datensätzen lernen, können sie Muster aufdecken, die Sequenz, Struktur und Funktion miteinander verknüpfen, und das Feld von zufallsgetriebenen Entdeckungen hin zu rationaler, designorientierter Innovation verschieben.
KI kann neue Proteine, Antikörper, Peptide und Nukleinsäuren mit maßgeschneiderten Funktionen entwerfen und dabei Eigenschaften wie Bindungsaffinität, Stabilität und Herstellbarkeit optimieren. Generative Ansätze, darunter Diffusionsmodelle und autoregressive Architekturen, ermöglichen es Wissenschaftlern, riesige Bereiche des molekularen Designraums zu erkunden, die durch konventionelles Screening oder gerichtete Evolution nicht zugänglich wären. Parallel dazu verbessert maschinelles Lernen Verabreichungsstrategien wie Lipidnanopartikel, virale Vektoren und Antikörper-Wirkstoff-Konjugate, indem es die Leistung vorhersagt, die Formulierung steuert und neue Komponenten vorschlägt.
Frühe KI-entwickelte Biologika, darunter Peptidtherapeutika, Antikörper und mRNA-basierte Kandidaten, treten in die klinische Bewertung ein. Gleichzeitig beschleunigt die KI-gestützte Optimierung die Affinitätsreifung und das Stabilitäts-Engineering, verringert den Bedarf an umfangreichem experimentellem Screening und verkürzt die Entwicklungszeiten.
Aktuelle Modelle sind häufig hervorragend bei der Vorhersage molekularer Strukturen, haben jedoch Schwierigkeiten, die Komplexität biologischer Systeme zu erfassen, wodurch eine Lücke zwischen in silico-Vorhersagen und in vivo-Ergebnissen entsteht. Immunogenität, Pharmakokinetik und der zelluläre Kontext lassen sich weiterhin nur schwer präzise modellieren, und der Fortschritt wird durch den begrenzten Zugang zu hochwertigen, aufgabenspezifischen Datensätzen sowie durch die Schwierigkeit eingeschränkt, mehrere Arzneimitteleigenschaften gleichzeitig ohne Zielkonflikte zu optimieren. Die Autoren eines aktuellen Reviews erklärten, dass eine engere Integration von Berechnung und Experiment – insbesondere durch geschlossene, KI-gesteuerte Workflows, in denen automatisierte Experimente kontinuierlich Daten erzeugen, um Modelle zu verfeinern – dazu beitragen könnte, die Lücke zwischen Vorhersage und tatsächlicher Leistung zu schließen.