Christian Stump hat mit Kolleginnen und Kollegen aktuellen Large Language Models mathematische Übungsaufgaben gestellt.

© RUB, Marquard

Mathematik

Large Language Models lösen Übungsaufgaben auf höchstem Niveau

In einem Benchmark haben 49 internationale Forschende die Künstliche Intelligenz mit 100 Aufgaben auf die Probe gestellt. Nur wenige blieben ungelöst.

Mit 100 Fragen hat eine Gruppe von 49 internationalen Mathematikern und Mathematikerinnen aktuellen Large Language Models auf den Zahn gefühlt: Welche Übungsaufgaben auf höchstem Niveau können sie lösen? Welche noch nicht? „Die Ergebnisse haben uns beeindruckt”, berichtet Prof. Dr. Christian Stump von der Ruhr-Universität Bochum, Initiator der Aktion. „Nur zwei Aufgaben blieben ungelöst. Das zeigt, dass die mathematischen Problemlösungsfähigkeiten von Künstlichen Intelligenzen sich stark verbessert haben.“

Veröffentlicht

Dienstag
09. Juni 2026
11:07 Uhr

Teilen