Neuroinformatik In der Fahrschule für Computer
Um realistische Bilder von Verkehrsschildern zu erzeugen, lassen Forscher zwei Algorithmen aufeinander los.
Wenn Autos eines Tages sicher autonom durch die Straßen fahren sollen, müssen sie Verkehrsschilder erkennen können. Auch bei Nacht, im Regen, im Schnee oder wenn sie bemoost, verschmutzt oder halb zugewachsen sind. Um das zu lernen, brauchen sie eine Menge Beispiele aller Verkehrszeichen aus den verschiedensten Jahres- und Tageszeiten und Wetterlagen. „Diese vielen Zeichen alle irgendwo zu fotografieren, wäre sehr aufwändig“, erklärt Prof. Dr. Sebastian Houben vom Institut für Neuroinformatik der RUB. „Zumal es ja auch seltene Schilder gibt.“
Bei der Erkennung sind Computer besser als Menschen
Gemeinsam mit Dominic Spata und Daniela Horn entwickelte er daher eine Methode, um Bilder von Verkehrszeichen automatisch zu generieren, mit denen Computer danach das Sehen üben können.
Ausgangspunkt der Arbeit waren dann aber doch Bilder von echten Verkehrszeichen: Schon 2011 machte das Team Videoaufnahmen von 43 in Deutschland genormten Verkehrszeichen, die Forscher sprechen von Klassen. Aus den Videos machten sie rund 50.000 Einzelbilder der Schilder aus verschiedenen Perspektiven. Maschinelle Verfahren können die Zeichen auf diesen Bildern übrigens unterm Strich besser erkennen als Menschen: Während letztere im Schnitt 98,8 Prozent richtig erkannten, identifiziert eine Bilderkennungssoftware bis zu 99,7 Prozent korrekt.
Aber darum geht es heute nicht mehr. „Wir wollten dahin kommen, dass ein Algorithmus selbst lernt, Bilder von Verkehrszeichen zu generieren, anhand derer andere Programme ihre Erkennungsfähigkeit trainieren können“, verdeutlicht Sebastian Houben.
Die beiden Algorithmen sind Sparringspartner.
Sebastian Houben
Dazu nutzt das Forschungsteam zwei Algorithmen: Der eine bekommt die Piktogramme der amtlichen Verkehrsschilder und die Aufgabe, daraus fotoähnliche Bilder zu erzeugen, aus denen er selbst später allerdings wieder in der Lage sein muss, das ursprüngliche Zeichen zu erkennen. „Damit verhindern wir, dass der Algorithmus das Bild des Zeichens einfach so stark verfremdet, dass gar keine Ähnlichkeit mehr mit dem Verkehrszeichen gegeben ist“, erklärt Daniela Horn.
Der zweite Algorithmus hat die Aufgabe zu entscheiden, ob es sich bei dem so entstandenen Bild um ein echtes Foto handelt oder nicht. Ziel ist es, dass der zweite Algorithmus nicht mehr unterscheiden kann, um was es sich handelt. „Der zweite Algorithmus gibt außerdem Hinweise an den ersten, wie es noch schwieriger gewesen wäre, die richtige Wahl zu treffen“, so Sebastian Houben. „Die beiden sind also Sparringspartner.“
Nach zwei oder drei Tagen schauen wir mal rein.
Daniela Horn
Zu Anfang eines solchen Trainingsprozesses funktioniert das Ganze noch nicht gut. Wenn das Bild eines Vorfahrtstraßenschildes die richtige Farbe hat und annähernd quadratisch ist, ist das schon ein gutes Ergebnis. Aber es wird fortlaufend besser. „Nach zwei oder drei Tagen schauen wir mal rein, was für Bilder der Verkehrszeichen herauskommen“, erzählt Daniela Horn. „Wenn die Bilder dann für unser menschliches Auge nicht gut aussehen, wandeln wir den Algorithmus etwas ab.“
Unklar ist, wann der Prozess abgeschlossen ist, denn es gibt kein sicheres Maß für die Qualität der Bilder. Menschliche Probanden lassen sich bei guten Bilderzeugungsverfahren trotzdem nur von durchschnittlich zehn Prozent der Bilder täuschen. In den meisten Fällen erkennen Menschen genau, welche Bilder echte Fotos sind und welche nicht. „Das kann ganz einfache Gründe haben“, so Daniela Horn. „Wir hatten zum Beispiel mal den Fall, dass der Algorithmus immer die Stange weggelassen hat, auf der ein Schild montiert ist.“
Es geht nicht darum, Menschen zu täuschen
Für Menschen ein klares Kriterium, für ein Computersehsystem gar nicht so wichtig. „Es geht bei diesem Verfahren nicht darum, Menschen zu täuschen“, unterstreicht der Neuroinformatiker. Bei Bilderkennungssoftwares war das Ergebnis der beiden Algorithmen auch erfolgreicher als bei Menschen: Nach einem Training mit einer vergleichbaren Anzahl künstlicher Bilder schnitt ein Computersehsystem bei der Erkennung echter Schilderfotos nur um zehn Prozentpunkte schlechter ab als nach dem Training mit den echten Bildern.
Eine Vorliebe für Waldhintergrund
Mit Tricks arbeitete das Forschungsteam außerdem daran, den Bilderzeugungsalgorithmus zu verbessern. „Er neigte zum Beispiel dazu, eine Vorliebe für Waldhintergründe zu entwickeln, vermutlich, weil sich der Bilderkennungsalgorithmus davon gut täuschen lässt“, erzählt der Forscher. Dieser Schwierigkeit versuchte das Team beizukommen, indem es die Hintergrundfarbe der Ursprungspiktogramme änderte. „Wir können nur durch den anfänglichen Input und durch Änderungen am Algorithmus Einfluss auf den Prozess nehmen“, so Sebastian Houben. Die Entscheidungen, die die Algorithmen anschließend treffen, liegen außerhalb der Kontrolle der Forscher – ein Charakteristikum der künstlichen Intelligenz.