Zwei vom siegreichen Team: Benedikt Bönninghoff (links) und Julian Rupp
© RUB, Marquard

Künstliche Intelligenz Welche Person verbirgt sich hinter dem Text?

Ein RUB-Team hat den internationalen PAN-Wettbewerb zur automatisierten Autorenerkennung gewonnen.

Ein Team der Ruhr-Universität Bochum (RUB) hat einen Algorithmus entwickelt, der besser als alle anderen feststellen kann, ob zwei Texte von derselben Person stammen. Mit dem Verfahren hat das Team um Benedikt Bönninghoff, Doktorand im Forschungskolleg Sec-Human, den Wettbewerb des PAN-Workshops 2020 gewonnen. PAN steht für Plagiarism Analysis, Authorship Identification, and Near-Duplicate Detection.

Textbasierte Straftaten

Die Bedeutung automatisierter Verfahren zur Erkennung der Autorschaft wächst. „Wir erleben zurzeit neue digitale Formen rein textbasierter Straftaten oder Handlungen, die gegen Gesetze verstoßen“, verdeutlicht Benedikt Bönninghoff. „Durch Hassrede, Fake-Reviews, Cyber-Mobbing, Spear-Phishing, eine spezielle Form des E-Mail-Phishings, oder die Verbreitung von Fake News entsteht ein hohes Schadenspotenzial.“

PAN-Workshops


PAN hat sich zu einer der bedeutendsten Veranstaltungen für den Bereich der Autorschaftsanalyse entwickelt. Seit 2007 werden unterschiedliche Wettbewerbe im Bereich der digitalen Textforensik ausgetragen, bei denen Forschende sowie Praktikerinnen und Praktiker auf der ganzen Welt ihre Verfahren zur automatischen Analyse vergleichen.

Beim PAN-2020-Wettbewerb „Cross-Domain Authorship Verification“ ging es um den automatisierten Textvergleich: Es werden zwei Texte auf ihre Autorenschaft untersucht. „In unserem Fall entscheidet ein auf künstlicher Intelligenz basiertes System, ob zwei gegebene Texte von derselben Person verfasst wurden“, erläutert Bönninghoff. Die besondere Herausforderung war, dass die zu vergleichenden Texte unterschiedliche Themen behandelten. Ein themenspezifisches Vokabular übt einen erheblichen Einfluss auf die automatisierte Entscheidungsfindung aus. Ein Algorithmus sollte auf Basis des Schreibstils und nicht auf Basis von inhaltlichen Aussagen entscheiden.

Team gewinnt im Wettbewerb


Das siegreiche Deep-Learning-Verfahren wurde ursprünglich in Zusammenarbeit mit Steffen Hessler, dem Sec-Human-Tandempartner von Benedikt Bönninghoff aus der Germanistischen Linguistik, Prof. Dr. Robert Nickel von der Bucknell University, USA, und Prof. Dr. Dorothea Kolossa, Betreuerin von Benedikt Bönnighoff und Leiterin der Arbeitsgruppe Kognitive Signalverarbeitung an der RUB-Fakultät für Elektrotechnik und Informationstechnik, entwickelt. Für den PAN-Wettbewerb erweiterte das Team mit Unterstützung von Julian Rupp das bestehende Verfahren.

Veröffentlicht

Mittwoch
15. Juli 2020
09:49 Uhr

Teilen