ChatGPT & Co – wie wird Faktenwissen in großen Sprachmodellen gespeichert?

26.08.2024

Der Vortrag von HITS-Gruppenleiter Jan Stühmer (Machine Learning and Artificial Intelligence) über Large Language Models ist jetzt auf YouTube.

Wie wird Faktenwissen in großen Sprachmodellen wie ChatGPT gespeichert? Wie kann es zu den sogenannten Halluzinationen kommen? Und welche aktuellen Forschungsansätze gibt es, um Faktenwissen in Sprachmodelle zu integrieren? Diese Fragen behandelt HITS-Gruppenleiter Jun.-Prof. Dr. Jan Stühmer in seinem Vortrag. Er leitet seit September 2022 die Forschungsgruppe für Maschinelles Lernen und Künstliche Intelligenz am HITS und ist zugleich Juniorprofessor am Karlsruher Institut für Technologie (KIT). Der Vortrag wurde beim Tag der offenen Tür des HITS am 13. Juli 2024 aufgezeichnet.

Über das HITS

Das HITS (Heidelberger Institut für Theoretische Studien) wurde 2010 von dem Physiker und SAP-Mitbegründer Klaus Tschira (1940-2015) und der Klaus Tschira Stiftung als privates, gemeinnütziges Forschungsinstitut gegründet. Es betreibt Grundlagenforschung in den Naturwissenschaften, der Mathematik und der Informatik. Zu den Hauptforschungsrichtungen zählen komplexe Simulationen auf verschiedenen Skalen, Datenwissenschaft und -analyse sowie die Entwicklung rechnergestützter Tools für die Forschung. Die Anwendungsfelder reichen von der Molekularbiologie bis zur Astrophysik. Ein wesentliches Merkmal des Instituts ist die Interdisziplinarität, die in zahlreichen gruppen- und disziplinübergreifenden Projekten umgesetzt wird. Die Grundfinanzierung des HITS wird von der Klaus Tschira Stiftung bereitgestellt.

Zur englischen Seite wechseln oder auf dieser Seite bleiben.