Digital Humanities Wie Partikel unsere Kommunikation verändern
Die Computer-Linguistin Tatjana Scheffler analysiert unsere sprachlichen Ausdrucksformen in den sozialen Medien.
Tatjana Scheffler hat die Juniorprofessur für Digitale Forensische Linguistik an der RUB inne. Im Interview erzählt sie, wie und wonach sie Sprachdaten analysiert.
Frau Scheffler, womit befasst sich die digitale Linguistik?
Die digitale Linguistik beschäftigt sich hauptsächlich mit Sprachdaten, die in digitaler Form vorliegen. Heutzutage ist es glücklicherweise so, dass die meisten sprachlichen Interaktionen digital ablaufen. Darüber hinaus konzentrieren wir uns in meiner Arbeitsgruppe auf Texte in geschriebener Form. Die Linguistik hat eigentlich immer sehr Sprachdaten-getrieben gearbeitet, und seit über 50 Jahren werden Computer eingesetzt, um diese zu analysieren und zu verarbeiten. Heute haben wir natürlich ganz andere Daten zur Verfügung, die nicht mehr ganz so durchgeplant sind, die keinem bestimmten Standard folgen, wie etwa Buchgenres oder Zeitungsberichte, sondern die spontaner und interaktiver sind. Ich beschäftige mich hauptsächlich mit Daten aus sozialen Medien, beispielsweise Forenbeiträge oder Tweets, und vergleiche sie mit dem, was wir über Zeitungskorpora oder die gesprochene Sprache wissen.
Im aktuellen Forschungsprojekt erforschen Sie Blogs und Twitter-Accounts: Welche Forschungsfragen treiben Sie um?
In meinem neuen Vorhaben analysiere ich 44 Eltern-Blogs, also Blogs von Müttern und Vätern, die über Elternschaft schreiben, sowie deren verknüpfte Twitter-Accounts, um der individuellen Variabilität unserer Sprache in den sozialen Medien auf die Spur zu kommen. Ich beschäftige mich mit Fragen wie: Wie drücken sich Sprecherinnen und Sprecher in unterschiedlichen Medien aus? Was passiert eigentlich mit unserer individuellen Ausdrucksweise, wenn wir das Medium wechseln? Passen wir unseren Stil an die neue Kommunikationssituation, das neue Medium an? Wie genau?
Was schauen Sie sich im Detail an?
Mein Augenmerk liegt dabei auf zwei Aspekten: Zum einen interessiere ich mich für den Gebrauch von sogenannten Partikeln, wie etwa „ja“, „doch“, „wohl“, die in der deutschen, informellen Sprache sehr verbreitet sind und genutzt werden, um zum Beispiel zu signalisieren, was meine Leserinnen und Leser vielleicht schon wissen. Diese mündlichkeitstypische Ausdrucksform tritt in den sozialen Medien ebenfalls häufig auf. Mich interessiert: Gibt es hier, je nach Medium, ganz persönliche Präferenzen, Lieblingspartikel etwa, die besonders häufig verwendet werden. Zum anderen schaue ich mir sogenannte Intensivierer an, wie etwa „krass“, „mega“, „sehr“, „unglaublich“, „wirklich“. Davon gibt es mehrere Hundert und sie werden, je nach sozialem Medium und Kontext, unterschiedlich eingesetzt.
Was konnten Sie bereits beobachten?
Die Blogs unterscheiden sich in der Art, in der sie gestaltet und verfasst sind, sehr voneinander. Bei einigen handelt es sich um spontane Niederschriften, andere sind professionalisierter. Es gibt also deutliche Stilunterschiede innerhalb des Mediums Blog zu beobachten. Im Vergleich dazu ermöglicht Twitter eine ganz andere Interaktivität, einen Austausch mit Userinnen und Usern. Unser Gebrauch von Partikeln scheint auf solch einer direkten Interaktion zu basieren. Auch Intensivierer werden deswegen je nach Medium unterschiedlich eingesetzt. In Blogs wählen die Nutzerinnen und Nutzer eher die formellen Intensivierer „wirklich“ oder „sehr“; bei Twitter fällt die Wahl auf „echt“ oder „mega“.
Wo finden solche Erkenntnisse praktisch Anwendung?
Eine Universität, die Forschungsergebnisse darstellen möchte, eine Firma, die Produkte präsentieren möchte, ein Podcast-Format – es gibt verschiedenste Anforderungen an unsere heutige Sprache. Unsere Forschung zu den Partikeln zeigt uns konkret, wie wir Sätze konstruieren können, damit sie besser verstanden werden, natürlicher zu lesen sind. Aktuell entwickele ich zum Beispiel gemeinsam mit zwei Partnerfirmen in Berlin, die in der Sprachverarbeitung angesiedelt sind, Methoden, die in der Lage sind, Texte an das jeweilige Medium anzupassen. Diese maschinellen Lernverfahren basieren auf unseren Erkenntnissen aus der Korpusanalyse.
Ein anderes Anwendungsbeispiel: Im Bereich der digitalen forensischen Linguistik entwickeln wir auf Künstlicher Intelligenz basierende Methoden, um sprachliche Charakteristika von schädlichen Kommunikationspraktiken wie Manipulation, Falschinformationen, Hassreden, Plagiate und so weiter in digitalen Texten aufzudecken. Auch hier sind individuelle sprachliche Merkmale relevant.
Die Methoden der Digital Humanities ermöglichen die Untersuchung von unterschiedlichsten Texten und Textsammlungen, und das aus unterschiedlichen fachlichen Perspektiven. Es wird immer zahlreiche Transfer- und Anwendungsoptionen geben, sei es in der Soziologie, der Politik- und Sprachberatung oder eben der Forensik.
Wie sieht die Zukunft der digitalen Linguistik aus?
Die digitale Linguistik gewinnt sowohl theoretisch als auch praktisch zunehmend an Bedeutung. Auf der theoretischen Seite erlauben uns digitale Daten und Zugänge zu Sprecherinnen und Sprechern, linguistische Theorien empirisch zu testen. Und praktisch eröffnen sich alle Anwendungsgebiete der Sprachverarbeitung, die unsere digitale Kommunikation begleiten – von automatischen Untertiteln bis zur Hassredeerkennung.