Proteine sind Hochleistungsbiomaschinen: Eiweiße finden sich in jeder Zelle und spielen im menschlichen Körper eine wichtige Rolle, etwa bei der Blutgerinnung oder als Hauptbestandteil von Haaren oder Muskeln. Welche Funktion die molekularen Werkzeuge jeweils erfüllen, lässt sich an ihrer Gestalt erkennen. Forscherinnen und Forscher des Karlsruher Instituts für Technologie (KIT) haben eine neue Methode entwickelt, diese Proteinstruktur mittels Künstlicher Intelligenz vorherzusagen.
Proteine können mit anderen Molekülen durch Eindringen oder Umschließen interagieren, je nach Form. Diese lässt sich – anders als beim Blick in den heimischen Werkzeugkasten – nicht ohne weiteres feststellen, sondern nur mit teuren und aufwendigen Experimenten. Forscherinnen und Forscher des Steinbuch Centre for Computing (SCC), dem Rechenzentrum des KIT, haben dafür zunächst Datenbanken für Proteinsequenzen durchkämmt und gleiche Proteine unterschiedlicher Spezies verglichen. „Hämoglobin, das in unserem Körper für den Sauerstofftransport zuständig ist, gibt es auch beim Insekt, bei der Feldmaus und beim Schimpansen“, erklärt Markus Götz, Datenanalyst beim SCC. Den Aufbau eines Proteins kann man sich dabei wie eine Perlenkette vorstellen, an der Proteinteile, die Aminosäuren, aufgereiht sind. Seine dreidimensionale Struktur – und damit seine Eigenschaften – erhält es, indem sich manche weit voneinander entfernte „Perlen“ zu Paaren zusammenschließen und das Protein so falten. Bei verschiedenen Organismen können sich diese Paarungen unterscheiden, die Eigenschaften des Proteins bleiben aber dennoch gleich. „Schädliche Mutationen wurden im Laufe der Evolution ausgefiltert“, sagt Götz.
Das Team um Götz hat nun einer Künstlichen Intelligenz (KI) beigebracht, welche Kopplungen in bekannten Proteinsequenzen evolutionär erfolgreich waren. „Wir erwarten, dass das System so auch Rückschlüsse auf den Aufbau unbekannter Proteinsequenzen ziehen kann“, so Götz. Der Nutzen: „Es ist sehr einfach zu bestimmen, aus welchen Aminosäuren eine Proteinkette besteht. Proteinstrukturen direkt experimentell zu bestimmen, ist aber sehr aufwendig und kostet Millionen“, ergänzt Alexander Schug vom SCC.
Der Ansatz, Kontakte in Proteinen von einer KI vorhersagen zu lassen, ist nicht ganz neu. „Aktuell werden dafür vor allem Methoden aus der Bildverarbeitung eingesetzt“, sagt Götz. Solche Neuronalen Netzwerke könnten Muster gut erkennen. Bei der Proteinstruktur spielten aber besonders jene Kontakte von Proteinteilen eine Rolle, die besonders weit auseinander liegen, weil sie beim Falten einen stärkeren Einfluss auf die Form haben als solche, die nahe beieinander liegen. „Daher verfolgen wir stattdessen einen Ansatz aus der automatisierten Sprachübersetzung. Wir betrachten die Aminosäureketten als Sätze, die in eine andere Sprache übersetzt werden.“ Sogenannte „Self-Attention Neural Networks“ kommen in populären Übersetzungsprogrammen zum Einsatz. Sie können erkennen, welche Teile des Satzes miteinander in Beziehung stehen oder – im Proteinkontext – welche Aminosäuren miteinander einen Kontakt bilden.
Weitere Materialien:
Das Video zeigt, wie sich das „Zellkleber“-Protein Fibronektin aus dem funktionalen Zustand entfaltet und dann wieder faltet (Animation: Ines Reinartz, KIT):
Details zum KIT-Zentrum Information · Systeme · Technologien (in englischer Sprache): http://www.kcist.kit.edu
Im Dialog mit der Gesellschaft entwickelt das KIT Lösungen für große Herausforderungen – von Klimawandel, Energiewende und nachhaltigem Umgang mit natürlichen Ressourcen bis hin zu Künstlicher Intelligenz, technologischer Souveränität und demografischem Wandel. Als Die Universität in der Helmholtz-Gemeinschaft vereint das KIT wissenschaftliche Exzellenz vom Erkenntnisgewinn bis zur Anwendungsorientierung unter einem Dach – und ist damit in einer einzigartigen Position, diese Transformation voranzutreiben. Damit bietet das KIT als Exzellenzuniversität seinen mehr als 10 000 Mitarbeitenden sowie seinen 22 800 Studierenden herausragende Möglichkeiten, eine nachhaltige und resiliente Zukunft zu gestalten. KIT – Science for Impact.
