Forschungsdatenmanagement Mehr Durchblick im Datendschungel der Materialwissenschaft
Big Data – der Begriff klingt im ersten Moment stets wie eine Verheißung. Viele Daten bringen aber nichts, wenn nicht irgendjemand für Struktur sorgt. Jemand wie Markus Stricker.
Die Entschlüsselung des menschlichen Genoms hat der Biologie vor vielen Jahren einen neuen Forschungszweig beschert – die Bioinformatik. Ein ähnlicher Trend lässt sich derzeit in der Materialwissenschaft beobachten. Noch ist Prof. Dr. Markus Stricker, Leiter der Bochumer Arbeitsgruppe für Materialinformatik und Datenwissenschaft, mit seinem Forschungsgebiet ein Exot in Deutschland. Warum das in Zukunft vermutlich nicht so bleiben wird und welches Potenzial die Materialinformatik mit sich bringt, erzählt er im Interview.
Herr Professor Stricker, Sie forschen in der Materialinformatik – ein noch junges Forschungsgebiet, oder?
Den Begriff gibt es seit 2005 in der wissenschaftlichen Literatur. Er steht für die Idee, Informatik und Materialforschung zusammenzubringen. Auslöser war Big Data. Es wurde klar, dass man ein Konzept braucht, wie man mit den vielen Daten umgeht. Auch wenn es Hochdurchsatzverfahren für Synthese und Charakterisierung, wie Alfred Ludwig sie in Bochum beispielsweise schon lange einsetzt, bereits eine Weile gibt, etablieren sich die Verfahren erst seit einigen Jahren in der Breite. Jetzt wird die Anzahl der Daten ein Problem.
Professuren wie Ihre, die auf die Datenwissenschaft in der Verbindung mit Materialien spezialisiert sind, gibt es vermutlich bislang wenige.
Neben meiner Juniorprofessur hier in Bochum war mir in Deutschland nur in Jülich noch eine weitere Professur bekannt, deren Schwerpunkt auf der Materialinformatik liegt. Seit April dieses Jahres gibt es mit Miquel Marques am Interdisciplinary Centre for Advanced Materials Simulation, ICAMS, eine weitere Professur, die Daten, Künstliche Intelligenz und Materialien als Fokus hat. Sonst ist das eher eine Zusatzaufgabe. Natürlich könnte sich auch herausstellen, dass das Thema allein nicht tragfähig für eine Professur ist. Aktuell sieht es aber nicht danach aus.
Ist der Forschungsbereich also ein Risiko für Sie?
Die Juniorprofessur ist eine große Chance für mich, über die ich mich sehr freue. Ich habe in der Vergangenheit viele Charakterisierungsmethoden kennengelernt und weiß, welche unterschiedlichen Daten bei den Experimenten anfallen und welche Parameter man dokumentieren muss. Zudem habe ich Erfahrung mit der Verwendung und den Ergebnissen vieler Simulationsmethoden. Ich finde es spannend, nun alles zusammenzubringen – und an der Etablierung eines neuen Felds mitwirken zu können!
Die Materialwissenschaft hat das Potenzial, drängende Fragen unserer Zeit zu beantworten.
Warum halten Sie das Feld für zukunftsfähig?
Weil die Materialwissenschaft das Potenzial hat, drängende Fragen unserer Zeit zu beantworten. Energie, Transport, Nachhaltigkeit – all das sind letztendlich Materialfragen. Die Entwicklung eines Werkstoffs dauert mit klassischen Verfahren typischerweise 10 bis 20 Jahre. Wenn wir erst 2050 Antworten auf die Probleme von heute finden, ist der Drops gelutscht. Wir müssen die Verfahren beschleunigen.
Und das geht mit der Materialinformatik?
Mithilfe von Maschinellem Lernen können wir die Werkstoffentwicklung beschleunigen. Um einen neuen Werkstoff zu erzeugen, kombiniert man verschiedene Elemente in einem bestimmten Mischungsverhältnis. Das ist nicht immer im Gleichgewichtszustand möglich und so benötigt man für manche Elementkombinationen besondere Verfahren, diese zu einem Material zu kombinieren. Es gibt aber sehr viele Elemente und damit praktisch unendlich viele Möglichkeiten für Elementkombinationen in verschiedensten Zusammensetzungen. Sie alle herzustellen und zu charakterisieren, um die besten Eigenschaften zu finden, ist unmöglich. Mithilfe von Algorithmen können wir basierend auf wenigen Messungen, Prognosen für die Eigenschaften von neuen Elementkombinationen machen. So kann man eingrenzen, in welche Richtung man sinnvollerweise weiter suchen sollte.
Dazu müssen Sie viele Daten aus unterschiedlichen Quellen zusammenbringen.
Ja, und sie sind sehr unterschiedlich – das ist eine Herausforderung. Es gibt viele verschiedene Mess-, Simulations- und Dokumentationsmethoden. Derzeit hat quasi jede Forscherin und jeder Forscher ein eigenes Datenablagesystem, das auch ordentlich geführt wird. Aber wenn eine verantwortliche Person geht, sind die Daten in der Regel nicht mehr oder nur mit großem Aufwand wieder verwendbar, weil andere das System oft nicht verstehen. Daher ist es wichtig, dass wir Standards für die Ablage und Dokumentation von Daten erarbeiten, mit denen wir Daten über Arbeitsgruppen hinweg und für die Nutzung in Algorithmen verwendbar machen und halten können.
In so einem Umfeld macht die Forschung richtig Spaß.
Wie sieht die Zusammenarbeit mit Ihren Kolleginnen und Kollegen aus?
Ich bin sehr froh, wie offen und wertschätzend meine Kolleginnen und Kollegen an der Ruhr-Universität sind – in so einem Umfeld macht die Forschung richtig Spaß. Der Materialinformatikteil meiner Forschung ist in vielen Projekten oft der einzige Beitrag, der – platt gesagt – keine eigenen Daten erzeugt, sondern die Daten von anderen benötigt. Ich werde hier in viele Projekte von Anfang an einbezogen, um den datenwissenschaftlichen Teil mitzudenken. Später werden dann die anderen von meiner Forschung profitieren können, wenn meine Ergebnisse dazu beitragen, die Entwicklung neuer Werkstoffe zu beschleunigen.