Machine Learning and Artificial Intelligence (MLI)
Kaum ein Schlagwort ist in den letzten Jahren so sehr Bestandteil des menschlichen Alltags geworden wie „Künstliche Intelligenz“ – von der Sprachassistenz über autonomes Fahren bis hin zu generativen Modellen, die ausgehend von einer Textbeschreibung beeindruckende Bilder unterschiedlicher künstlerischer Stilrichtungen erstellen können. Die Wissenschaft indes beschäftigt sich schon seit langem mit den Methoden, die hinter dem Schlagwort stecken. Daran arbeitet die MLI Gruppe, die im September 2022 am HITS gegründet wurde.
Die Gruppe beschäftigt sich mit der Entwicklung von neuartigen Algorithmen und Verfahren des maschinellen Lernens. Besondere Schwerpunkte sind hierbei dateneffiziente Lernverfahren, sowie die Entwicklung von Algorithmen für bessere Generalisierbarkeit und interpretierbare Repräsentationen.
Die entwickelten Methoden des dateneffizienten Lernens erlauben es, ein an einem großen Datensatz vortrainiertes Modell an eine neuartige Anwendung anzupassen. Der Datensatz, der für dieses sogenannte „Fine-Tuning“ verwendet wird, kann dabei deutlich kleiner sein, als es ohne das Vortrainieren des Modells möglich wäre. Dadurch reduziert sich der Zeit- und Kostenaufwand zum Erstellen der Trainingsdaten, und maschinelle Lernverfahren können in dafür bisher unzugänglichen Anwendungsfeldern verwendet werden.
Ein Schwerpunkt der Forschung ist hierbei insbesondere die Entwicklung von Lernverfahren für eine bessere Generalisierbarkeit der Modelle. Hierdurch wird der Fehler minimiert, der bei der Verwendung eines an einen kleinen Datensatz angepassten Modells zu erwarten ist. Dabei werden Erkenntnisse aus der Lerntheorie mit Methoden der konvexen und nicht-konvexen Optimierung kombiniert.
Ein weiterer Schwerpunkt liegt in interpretierbaren Repräsentationen, mit dem Ziel, die Modelle interpretierbar und somit besser verständlich zu machen, und um grundlegende Zusammenhänge in Daten zu veranschaulichen. So lassen sich mit entsprechenden Lernalgorithmen den Daten zugrunde liegende Faktoren und teilweise sogar die kausalen Zusammenhänge von beobachteten Daten ableiten. Insbesondere in den Naturwissenschaften ergeben sich dadurch interessante Anwendungen. Zur Anwendung kommen hierbei Methoden der variationellen Inferenz, statistische Verfahren der Faktoranalyse, sowie Graph-Neural-Networks.