Lügen | Presse:
Wortbildung bei PEGIDA-Anhängern






comments: Kommentare deaktiviert für Lügen | Presse:
Wortbildung bei PEGIDA-Anhängern
tags: , , , , , ,

Ist die AfD eine populistische Partei? – Eine Analyse am Beispiel des Landesverbands Rheinland-Pfalz

Posted on 13th März 2016 in Allgemein, Extremismus, Politik

Die AfD wehrt sich heftig gegen die Zuschreibung, rechtspopulistisch zu sein. Sie sucht die Schuld dann bei den Medien, die zu bequem seien, sich mit den Inhalten auseinanderzusetzen, und scheut auch nicht vor persönlichen Diffamierungen von Wissenschaftlern zurück, die Inhalte und Politikstil der AfD als „populistisch“ bezeichnen. Für eine Tagung der Arbeitsgemeinschaft Sprache in der Politik habe ich die Sprache der AfD daraufhin untersucht, ob sich in ihr Merkmale finden, die es rechtfertigen, die AfD als populistische Partei zu bezeichnen oder ob die Zuschreibungen der Presse unbegründet sind.

In der politikwissenschaftlichen Debatte lassen sich grob zwei Traditionslinien der Definition von „Populismus“ ausmachen:

  1. Populismus ist ein Politikstil, der sich durch die Neigung, die „in einem politischen System festgelegten Spielregeln in Frage zu stellen und zu verletzen“ (Szacki 2005: 23) auszeichnet. Tabubrüche und Skandalisierung sind die Mittel dieses Stils.
  2. Populismus ist auch eine Ideologie, die durch mindestens zwei Merkmale bestimmt ist: den Rekurs auf das Volk, wobei der Begriff „Volk“ nicht im Sinne eines Staatsvolkes gebraucht sondern als homogene Einheit verstanden wird (bspw. als nationale Abstammungsgemeinschaft); sowie eine ausgeprägte Frontstellung gegen die gesellschaftlichen Eliten (Geden 2006: 19, 26).



Datengrundlage

Die Datengrundlage für die im folgenden kurz zusammengefassten Ergebnisse, waren die Pressemitteilungen und Wahlprogramme von sieben Parteien, die sich um Mandate im Landtag in Rheinland-Pfalz bewerben.

Das Korpus der Wahlprogramme setzte sich wie folgt zusammen:

Partei wordcount
AFD Wahlprogramm 9863
CDU Regierungsprogramm 28322
FDP Landtagswahlprogramm 36163
Grüne Landtagswahlprogramm 44582
Die Linke Landtagswahlprogramm 21523
NPD „10 Punkte“ 1727
SPD Regierungsprogramm 21746


Neben Wahlprogrammen habe ich auch die auf den Webseiten der Parteien veröffentlichten Pressemitteilungen und Stellungnahmen analysiert, die als autorisierte Meinungsäußerungen ebenfalls die Haltung des jeweiligen Landesverbands zu einem politischen Thema repräsentieren.

Partei wordcount no. of texts
AfD Rheinland-Pfalz 57964 237
CDU Rheinland-Pfalz 74283 261
FDP Rheinland-Pfalz 27648 73
Gruene Rheinland-Pfalz 241876 914
Die Linke Rheinland-Pfalz 154179 509
NPD Rheinland-Pfalz 63894 174
SPD Rheinland-Pfalz 22221 93



Skandalisierung

Um zu untersuchen, ob der Politikstil der AfD mehr als der anderer Parteien von Skandalisierungen geprägt ist, habe ich die Distribution einer Reihe von Merkmalen in den Pressemitteilungen aller Parteien gemessen und mit einander in Beziehung gesetzt. Im Einzelnen waren dies:

  • die Zahl negativ wertender Adjektive
  • die Zahl von Intensivierern aus dem absoluten, extrem hohen und sehr hohen Intensivierungsbereich; Intensivierer kodieren Emotionen und den Grad von Überzeugungen, bzw. der Rigorosität, mit der sie vertreten werden.
  • der Umfang des Gebrauchs skandalisierender Vokablen
  • die Zahl von Kommunikationsverben, die auf Konflikte verweisen

Für jede dieser funktional und semantisch definierten Wortklassen wurde die relative Frequenz in jedem Korpus berechnet und die Differenz zur relativen Häufigkeit in der Summe aller anderen Korpora bestimmt.


Die Analyse zeigt, dass bei der AfD alle untersuchten Indikatoren deutlich überdurchschnittlich häufiger auftreten als in der Summe der anderen Parteien. Keine andere Partei zeigt auf allen Indikatoren so gleichmäßige positive Ausprägungen. Dies erlaubt den Schluss, dass die Pressemitteilungen der AfD stärker emotionalisieren und skandalisieren als die aller anderen Parteien.



Rekurs auf das Volk

Die AfD in Rheinland-Pfalz vertritt — anders als andere Landesverbände — keine offen völkische Ideologie. Die Konstruktion einer deutschen Eigengruppe erfolgt durch die im Vergleich zu anderen Parteien überdurchschnittliche Thematisierung der Politikfelder Flüchtlinge, Asyl und Migration. Berechnet man beispielsweise, welche Substantive für die AfD RLP im Vergleich zu allen anderen Parteien signifikant sind, werden die thematischen Schwerpunkte deutlich (rot markierte Lexeme):


Die AfD tritt zudem für mehr plebiszitäre Elemente ein. Dies zeigt sich beispielsweise, wenn man die Komposita mit den lexikalischen Morphem /volk/ und /bürger/ in ihrem Wahlprogrammen untersucht. Abgesehen von „Volkswirtschaft“ thematisieren alle Komposita mit /volk/ größere Partizipationsmöglichkeiten der deutschen Staatsbürger.

Volksbeteiligung, Volksentscheid, Volkspartei, Volksbegehren, Volksherrschaft, Volksinitiative, Volksabstimmung, Volkssouveränität, Volkswirtschaft

Ähnlich sieht es bei Komposita mit dem lexikalischen Morphem /bürger/ aus:

Bürgergesellschaft, Mitbürger, Bürgerinteresse, Bürgerentscheid, Bürgertum, Bürgerbüro, Bürgerbeteiligung, Staatsbürgerschaft, bürgerlich, Bürgerbegehren, Normalbürger

Im Wahlprogramm der CDU finden sich dagegen gerade einmal drei Komposita, die mehr Beteiligung der Bürger thematisieren:

volkswirtschaftlich, Volksentscheid, Volksverhetzung, Volksinitiative, Bürgerschaft, Bürgerkrieg, Bürgerinitiative, Bürgerin, Bürgerbusse, Nicht-EU-Bürger, bürgerschaftlich, Bürgertickets, Staatsbürgerschaft, bürgernah, Bürgerbeteiligung, Bürgermeister

Die AfD erklärt damit den Volkswillen für zentral und konstruiert das „Volk“ in Abgrenzung zu Asylsuchenden und Migranten.



Frontstellung gegen das „Establishment“

Die Ablehnung des Establishment hat in der AfD zahlreiche Facetten. Einerseits unterstellt die Partei, Medien, Politik und sonstige Eliten hätten einen Verblendungszusammenhang konstruiert. Die AfD hingegen trete der allgegenwärtige Manipulation mit den Mitteln der Wahrheit und der Vernunft entgegen. Untersucht man, wie häufig Lexeme in den Pressemitteilungen Verwendung finden, die auf Lüge, Manipulation und einen allgegenwärtigen Verblendungszusammenhang verweisen, dann ergibt sich folgendes Bild:


In fast allen Kategorien weist die AfD eine deutlich überdurchschnittliche Referenz auf vermeintliche Manipulationen, Lügen oder verborgene Wahrheiten auf. Bei keiner anderen Partei — außer vielleicht der NPD — ist die Distribution über alle Klassen ähnlich kohärent und verweist somit auf eine Neigung zu Verschwörungstheorien.

Ebenso aufschlussreich ist die Analyse von metasprachlich markierten Ausdrücken. Setzt man Wörter in Anführungszeichen oder distanziert man sich von einer Bezeichnung, indem man ein „sogenannt“ davorsetzt, ist dies ein Indikator für implizite bzw. explizite Sprachkritik. Untersucht man, wie häufig alle Parteien sich solcher metasprachlicher Markierungen bedienen, ergibt sich folgendes Bild:

afd_rlp_sprachthematisierungen

Die AfD bedient sich weitaus häufiger als die anderen Parteien des demokratischen Spektrums metasprachlicher Markierungen und zeigt so ihre Distanz zur herrschenden Semantik. Sie weist eine ähnlich hohe Zahl an metasprachlichen Markierungen wie die NPD auf.

Untersucht man, welche Ausdrücke von der AfD metasprachlich markiert werden, wird die Distanz zum sog. Establishment deutlich. Neben Ausdrücken, die Migration thematisieren, sind dies von der AfD zu bloßer Ideologie verteufelte Wissenschaften sowie Wissenschaftler und sonstige Experten.

Flüchtlinge und Flüchtlingspolitik Gender, Diversity Experten und Akademiker
Flüchtling Gender-Mainstreaming Experte
Grenzschutz Gender Studies neue Akademiker
vorübergehend soziales Geschlecht akademisches Prekariat
Euro-Islam geschlechtergerechte Sprache Wissenschaftler
Asyl-Zuwanderung-über-alles Political Correctness Rechtsextremismusexperte
Völkerwanderung Gleichstellungsbeauftragte Elite
Parallelgesellschaften Gender Mainstreaming Diplom-Sozialwissenschaftler


Sucht man in den Pressmitteilungen der AfD nach Komposita mit dem lexikalischen Morphem /partei/, so findet man folgende Bezeichnungen für andere Parteien:

Parteienherrschaft, Altpartei, Alt-Partei, Kaderpartei, Blockparteienmanier, Altparteienpolitiker

Die Bezeichnung „Altpartei“ in allen Varianten ist dabei absolut dominant. Dass diese Bezeichnung von Joseph Goebbels und anderen Vertretern der NSDAP gerne benutzt wurde, scheint die AfD nicht weiter zu stören. Als Eigenbezeichnung verwendet die AfD gerne Komposita wie:

Volkspartei, Rechtsstaatspartei, Weckruf-Partei, Konfliktpartei, Mitmachpartei, Anti-Europartei, Oppositionspartei

Die Tatsache, dass die AfD den Rest des Parteiensystems pauschal als überkommene Institution abwertet, zeigt, wie sehr sie sich mit ihrer Rhetorik in traditionelle populistische Anti-Eliten-Diskurse einschreibt.



Zusammenfassung

Die Ergebnisse zur Rhetorik der AfD im Landtagswahlkampf in Rheinland-Pfalz lassen sich wie folgt zusammenfassen:

  1. Populismus als Politikstil: Die AfD skandalisiert wie keine andere Partei bei fast allen Indikatoren (negativ wertende Adjektive, Intensivierer, skandalisierende Wortschatz)
  2. Zentralität des Volkswillens: „Bürger“ und „Volk“ als zentrale Begriffe; Volksabstimmung, Homogenisierung des Volks anhand der Flüchtlingsthematik
  3. Ablehnung des Establishments: pauschale Kritik an anderen Parteien („Altparteien“), Kritik an akademische Eliten (insbesondere Sozialwissenschaften), Distanzierung von der herrschenden Semantik und von „politischer Korrektheit“, Konstruktion eines Manipulationszusammenhangs

Die Ergebnisse lassen den Schluss zu, dass der Landesverband der AfD in Rheinland-Pfalz mit einer populistische Kampagne um Wähler wirbt.



Literatur

  • Geden, Oliver (2006): Diskursstrategien im Rechtspopulismus. Wiesbaden: VS Verlag für Sozialwissenschaften.
  • Szacki, Jerzy (2005): Populismus und Demokratie. Versuch einer Begriffsklärung. In: Rudolf vonThaden / Anna Hofmann (Hrsg.): Populismus in Europa – Krise der Demokratie? Göttingen: Wallstein Verlag. S. 19-24.


Die Sterne lügen nicht — sie wiederholen sich aber ständig: Text-Re-use in Horoskopen

Posted on 15th Februar 2016 in Datengeleitete Analysen, n-Gramme, Off Topic, Textklassifikation

Kaum ein großes Online-Medium jenseits des Qualitätsjournalismus kommt ohne Horoskop aus. Und das, obwohl schon Adorno der Astrologie vor mehr als 50 Jahren bescheinigte, dass die sozialen und psychologischen Bedingungen, die sie ermöglichten, mit dem (damaligen) allgemeinen Aufklärungszustand unvereinbar seien.


Astrologie zwischen Rationalität und Irrationalität

Aus Sicht der Astrologie wirken Gestirnkonstellationen unmittelbar auf den irdischen Gang der Dinge. Sie vermittelt damit ein Weltbild, in dem jeder Mensch unter dem Einfluss objektiver, abstrakter und depersonalisierter Kräfte handelt. So objektiv mess- und berechenbar der Lauf der Gestirne auch sein mag, über die Art und Weise ihres (vermeintlichen) Einflusses auf die Schicksale der Menschen lässt die Astrologie uns im Dunkeln. Dieses Nebeneinander von Rationalität, Empirismus und Transzendenz hat Adorno im Oxymoron des naturalistischen Supranaturalismus gefasst. Folgt man Adorno, korrespondiert dieses Weltbild der Wahrnehmung vieler Menschen in funktional hochgradig differenzierten Gesellschaften: die Unübersichtlichkeit der Welt und die Sinnlosigkeit und Berdohlichkeit sozialer Prozesse wird durch den Glauben an eine Instanz kompensiert, die ein Versprechen auf rationale Begründbarkeit des ansonsten Unerklärlichen gibt. Auf diese Weise wirkt die Astrologie in doppelter Hinsicht stabilisierend auf die Gesellschaft, indem sie den herrschenden Rationalitätstyp bestätigt und die Irrationalitäten der sozialen Ordnung erklärbar macht.

Das Horoskop ist ein Text. Dieser Text leitet bestimmte Aspekte des Lebens einer Personengruppe, die über den Zeitpunkt ihrer Geburt definiert ist, aus einer aktuellen Gestirnkonstellation kausal ab; das klingt dann etwa so: „Unter dem aktuellen Jupiter-Uranus-Einfluss wird Ihr scharfer Zwillinge-Geist noch einmal geschärft.“ Je ausführlicher ein Horoskop ist, desto gründlicher wird die Gestirnkonstellation als argumentative Ressource genutzt. In den knappen Pressehoroskopen fällt sie dagegen sogar häufig zugunsten deutungsoffener und deshalb für jeden mit individuellem Sinn füllbarer Aussagen weg.

Sprachliche Analysen wie die von Katja Furthmann haben an Pressehoroskopen eine Reihe von Themen (Liebe, Beruf, Freizeit und Freundschaft, Gesundheit, Finanzen) und wiederkehrenden Topoi, die sich um den Metatopos des erfüllten, ausgeglichenen Lebens gruppieren („Sie haben hohe Ansprüche – gut so. Aber bitte verlangen Sie nichts Unmögliches“, „So schön die Sommerpartys auch sind, Sie sollten mal wieder richtig ausschlafen“), herausgearbeitet.


Reverse Engineering des Transzendenten mittels maschineller Textanalyse?

Wenn Horoskoptexte Übersetzungen von Gestirnkonstellationen in für den Einzelnen anschlussfähige Darstellungen künftigen Erlebens sind, dann müsste in der Analyse sprachlicher Muster von Horoskoptexten und ihrer Distribution die höhere Ordnung, die den Gang unserer aller Leben bestimmt, zumindest aufscheinen — so dachte ich. Vielleicht wäre es sogar möglich wie bei einem Reverse Engineering die Strukturen und Verhaltensweisen der Konstruktionselemente unserer Welt zu extrahieren. Ich machte mich also daran, Horoskope zu sammeln.

Das Sammeln der Horoskope gestaltete sich jedoch schwieriger als gedacht. Denn obwohl jedes größere Online-Medium täglich ein Horoskop veröffentlicht, werden die Horoskoptexte nicht archiviert. Meist ist nur das tagesaktuelle Horoskop verfügbar, selten noch das vom Tag vorher und die Horoskope weiterer Tage. Und fast immer stammen die Horoskope aus derselben Quelle, die mit lizensierten Astrologen, Content nach Maß und flexiblen Push- bzw. Pullservices wirbt.

Endlich wurde ich aber in den Tiefen und Oberflächen des Netzes fündig und konnte gemeinsam mit einem Kollegen für den Zweck der Erforschung von Textmustern 383 Tageshoroskope für jedes der zwölf Sternzeichen extrahieren. Eine simple datengeleitete Analyse gängiger Phrasen zeigte schon, dass die insgesamt 4596 Texte hochgradig rekurrent sind. Das ganze Ausmaß der Text-Re-use wurde mir aber erst deutlich, als ich die längste Überschneidung zwischen zwei Texten (longest common substring) berechnete. Mehrere Horoskoptexte waren völlig deckungsgleich. Und nicht nur das.


Im Himmel nichts Neues

Die 4596 Tageshoroskope wurden mit gerade einmal 894 unterschiedlichen Texten bestückt. Von diesen wurden 568 Texte, das sind 65.5%, mehrfach benutzt. 146 von ihnen sogar zehn mal und mehr. Der am häufigsten gebrauchte Text fand 88 mal Verwendung! Der Text besteht aus zwei Sätzen, die den Angehörigen der Zielgruppe am betreffenden Tag eine außerordentliche Selbstreflexion hinsichtlich ihrer Emotionen und Ziele voraussagt und ihnen auch einen erfüllten Kontakt mit ihren Mitmenschen prophezeit:

Sie sind sich Ihrer Gefühle, Wünsche und Bedürfnisse auf ungewöhnlich klare Weise bewusst und können entsprechend für Ihr Wohlbefinden sorgen. Auch für die Anliegen anderer sind Sie offen und begegnen ihnen mit einer menschlichen und warmen Herzlichkeit.

Positive Emotionen und herzliche Kontaktfreude sind durchweg die Themen der am häufigsten verwendeten Tageshoroskope, auch bei dem mit 72 mal am vierthäufigsten verwendeten Text:

Mehr als üblich sprechen Sie über Ihre Gefühle. Durch das Gespräch finden Sie leicht Kontakt und zeigen vermutlich auch Interesse für das Seelenleben anderer. Sie formulieren Ihre Gedanken nicht besonders sachlich und logisch, dafür umso menschlicher.

Der Traum vom Reverse-Engineering platzte endgültig, als ich die Distribution der Text über die Zeit und die Sternzeichen analysierte. Beim häufigsten Horoskoptext lässt diese Verteilung auf den ersten (und auch nicht auf den zweiten) Blick keine Muster erkennen.



Der Text streut unsystematisch über alle Sternzeichen und den gesamten Zeitraum. Einzige Restriktion: Der Text kann am selben Tag nicht bei zwei Sternzeichen gleichzeitig erscheinen. Dagegen ist es aber durchaus möglich, dass er beim gleichen Sternzeichen an zwei aufeinanderfolgenden Tagen erscheint, ja sogar an drei, wie das Beispiel des dritthäufigsten Textes belegt:



Die Analysen über das gesamte Sample zeigten keine nennenswerte Kovariation, der tiefere Sinn der Textwahl blieb ihnen ebenso verborgen wie die für den Uneingeweihten unsichtbaren Kräfte, die unsere Schicksale steuern.

Mein heutiges Horoskop lautet: „Sag es mit einem Lächeln! heißt Ihr Tagesmotto.“ Ich sei heute mitteilsam und kompromissbereit. Meine freundliche, friedfertige Stimmung werde mit mit vielen Menschen in Kontakt bringen und könne zwischen unterschiedlichen Meinungen vermitteln und eine gemeinsame Basis schaffen. Ein guter Tag, um endlich mal wieder zu bloggen, denke ich mir. Und mein heutiger Horoskoptext kommt in meinem Korpus sogar nur neun mal vor! Das ist gemessen an der sonstigen Wiederverwertungsorgie nachgerade ein individueller Text und wird ganz sicher stimmen. Wie alle Horoskope.


Literatur

Adorno, Theodor: Aberglaube aus zweiter Hand. In: Gesammelte Schriften. Band 8. Frankfurt am Main: Suhrkamp 1997, S. 142-167.

Aphek, Edna, Yishai Tobin: The Semiotics of Fortune Telling. Amsterdam u.a.: Benjamins 1989.

Furthmann, Katja: Die Sterne Lügen nicht. Eine linguistische Analyse der Textsorte Pressehoroskop. Göttingen: V&R unipress 2006.


Hackers in the House – Call for Participation: Datenspuren 2015

Posted on 16th Juni 2015 in Allgemein, Politik, Überwachung und Sicherheit

Dieses Jahr organisiere ich die Datenspuren des Chaos Computer Clubs Dresden (C3D2) mit. Sie werden am 24. + 25. Oktober 2015 in den Technische Sammlungen Dresden stattfinden. Im Folgenden der Call for Papers:


Girls and boys,
get up on your feet and make some noise,
because hackers are in the house!


Seit den Enthüllungen von Edward Snowden vergeht kaum ein Tag, an dem nicht Abhör- und Spionageskandale die Newsseiten der Print- und Online-Medien füllen. Diese Skandale schaffen ein neues Bewusstsein dafür, dass als selbstverständlich erachtete Rechte in der schönen neuen digitalen Welt gefährdet sind.

Wo „Jeder ist verdächtig“ das Mantra ist, das aus den vor neugierigen Blicken geschützten Fluren der Sicherheitsapparate bedrohlich nach außen dringt, dort scheint das für Demokratien so notwendige Grundvertrauen zwischen Bürgern und Staat gestört.

Wo die Digitalisierung den gläsernen Menschen schafft und Geheimhaltung ein Privileg des Staates bleiben soll, dort stellt sich die Frage, wie viel Geheimnis eine Demokratie braucht und wie viel sie verträgt.

Wo in immer mehr Lebensbereichen vernetzbare Daten entstehen und das vage Versprechen auf smarte Anwendungen schon genügt, das Beharren auf Datenschutz als obsolet und fortschrittsfeindlich zu diffamieren, dort muss die Frage diskutiert werden, wie viel Datenautonomie wir uns zugestehen wollen und wer diese garantiert.

Die Digitalisierung macht also eine umfassende Neubestimmung des Verhältnisses von Menschen, Staat und Ökonomie erforderlich. Und sie macht es erforderlich, dass die digitalen Avantgarden, die diese Entwicklung in den IT-Abteilungen großer Konzerne, an den Universitäten, in den Hackspaces oder in den Rechenzentren der Nachrichtendienste maßgeblich prägen und mitgestalten, ihre Rolle verstärkt reflektieren.

Der Chaos Computer Club Dresden lädt daher dazu ein, Vorschläge für technische, wissenschaftliche oder künstlerische Beiträge zu den Datenspuren 2015 einzureichen:

Themenfelder

  • Cryptowars damals und heute
  • Crypto-Usability
  • Formen Digitaler Selbstverteidigung
  • Computer Safety + Security
  • Chancen und Risiken von Smart Devices
  • Making you own devices (Maker + Breaker Scene)
  • Freie Software + Hardware
  • Hacking als Sub- und Gegenkultur
  • Informationsethik und Datenschutz
  • Datenkunst, Kunst und Elektronik

Einreichungsfrist

16. August 2015

Format

Kurzfassung (max. 300 Wörter) für Vortrag, Workshop, Installation/Performance, Junghackertrack

Einreichung

Vorträge und Workshops über das Konferenzsystem „frab“: https://frab.cccv.de/en/DS2015/cfp/session/new

Installationen, Junghackertrack usw. über die Mailingliste: datenspuren@lists.c3d2.de

Kontakt und Rückfragen

Organisationsteam: datenspuren@c3d2.de, Mailingliste: datenspuren@lists.c3d2.de

Benachrichtigung

Eine Benachrichtigung über die Annahme der Beiträge erfolgt bis zum 15. September 2015.


Die Datenspuren sind ein nichtkommerzieller Community-Event. Da wir weder Eintritt noch Teilnahmegebühren erheben ist es uns leider nicht möglich, Honorare zu zahlen. Auch die Bezuschussung von Reise- und Übernachtungskosten ist nur in Ausnahmefällen möglich. Anträge können gerne ans Orga-Team gestellt werden.


See you in da house!

comments: Kommentare deaktiviert für Hackers in the House – Call for Participation: Datenspuren 2015 tags: , , , , , ,

Content Mapping mit Topic Models

Posted on 18th Februar 2015 in ideology mapping, Inhaltswörter, Linguistische Kategorien

Liebe Freunde der Sicherheit,

in einem früheren Beitrag habe ich argumentiert, dass die „inhaltlichen Suchbegriffe“, die der BND beim „Filtern“ des Internet benutzt, über Topic Models oder ähnliche Verfahren dazu genutzt werden können, Kommunikation thematisch zu analysieren. Das „Filtern“ bei der strategischen Fernmeldeüberwachung wäre dann faktisch eine Analyse, für die das Bundesverfassungsgericht hohe Hürden gesetzt hat. Heute möchte ich zeigen, wie die Kombination von Topic Models und Metadaten dazu eingesetzt werden kann, thematische Profile von politischen Szenen zu berechnen.


Was sind Topic Models?

Topic Models sind Algorithmen zur Aufdeckung thematischer Strukturen in Texten. Sie gewichten und messen die Affinität von Inhaltswörtern in Textexemplaren eines Korpus. Häufig miteinander auftretende Wörter, die eine hohe Themenspezifizität aufweisen, werden als „Topics“ interpretiert. Diese Lexemcluster haben keine Namen; ihre Benennung ist ein Akt der Interpretation. Ebenso erfolgt die Ermittlung der Anzahl der Topics in den Standardverfahren nicht datengeleitet, sondern in Abhängigkeit von Festlegungen des Forschers.



Meinungsbilder aus dem Internet

Das Innenministerium ließ verlauten: „Wir brauchen eine belastbare Erfassung von Meinungs- und Stimmungslagen der Bevölkerung. Es liegt kein Eingriff in das allgemeine Persönlichkeitsrecht vor, wenn eine staatliche Stelle im Internet verfügbare Kommunikationsinhalte erhebt, die sich an jedermann oder zumindest an einen nicht weiter eingrenzbaren Personenkreis richten.“ Die Folge: alle Nachrichtendienste investieren in die open source intelligence.


Über welche Themen diskutieren linke Szenen?

Will man beispielsweise wissen, womit sich linke Szenen im deutschsprachigen Raum beschäftigen, kann man eine linke News-Site wie http://linkunten.indymedia.org auf ihre Topics hin analysieren. Auf der Subdomain von indymedia.org werden nach Meinungsverschiedenheiten in der Redaktion von Indymedia Deutschland und dem Bedürfnis nach einer engeren Verntezung süddeutscher Szenen Nachrichten veröffentlicht. Das Portal ist inzwischen aktiver als das deutschsprachige indymedia.org. Auch wenn grundsätzlich Nachrichten aus allen Regionen veröffentlicht werden, liegt ein spezieller Fokus auf dem südwestdeutschen Raum. Wendet man auf sämtliche dort publizierten Texten Topic Modelling an, ordnet sich der Wortschatz aufgrund seiner Distribution in folgende Gruppen, für die relativ leicht Namen gefunden werden können:



Themenschwerpunkte linker Szenen

Weil die Artikel auf http://linkunten.indymedia.org unter anderem nach Regionen verschlagwortet sind, ist es möglich, für einzelne linke Szenen Topic-Profile zu erstellen und die Intensität der Aktivitäten zu berechnen. Die unten stehende Grafik zeigt das Topic-Profil der Dresdner Szenen im Vergleich zu anderen Szenen in Deutschland. Sie zeigt die Differenz zum Durchschnitt der normalisierten relativen Auftretenshäufigkeiten der jeweiligen Topics im Gesamtkorpus.

topics_dresden

In Dresden wird demnach überdurchschnittlich häufig über Neonazis, rechte Parteien und Flüchtlinge berichtet, zu Demonstrationen aufgerufen und über Diskussionen in und außerhalb der Szene berichtet. Antimilitarismus und Hausbesetzungen spielen hingegen eine vergleichsweise geringe Rolle.

Interessiert man sich für einen Vergleich von Szenenprofilen, kann man die Themendistributionen in Spinnengrafiken übereinanderlegen, wie im folgenden Beispiel für Wien und Salzburg:

topic_wien_salzburg

Ebenso ist es möglich, die Affinität einzelner Szenen zu relevanten Topics zu analysieren. Von besonderem Interesse für Sicherheitsbehörden könnte ja beispielsweise das Topic „Revolutionärer Kampf“ sein. Eine Analyse der ortsspezifischen Frequenz dieses Topics im Korpus ergibt folgendes Städteranking:

topics_revolution_kampf

Topic Models sind ein eleganter Weg, um sich mit relativ einfachen Mitteln einen Überblick über die inhaltlichen Prägungen von Korpora zu verschaffen. Maßnahmen gegen Topic Models laufen ins Leere, außer man ist bereit, auf inhaltlich kohärente Diskussionen zu verzichten.


comments: Kommentare deaktiviert für Content Mapping mit Topic Models tags: , , , , , ,

31c3: Operative Kommunikation im digitalen Informationskrieg

Posted on 1st Januar 2015 in Informationskrieg

Der 31c3 war großartig! Danke an alle, die zu seinem Gelingen beigetragen haben! arche3000 und ich haben auf einen Vortrag mit dem Titel „Mein Bot der Kombattant: Operative Kommunikation im digitalen Informationskrieg“ gehalten. In dem Vortrag haben wir uns mit der Frage beschäftigt, wie sich der Informationskrieg in digitalen Medien, speziell in sozialen Medien wandelt und welche demokratietheoretischen und informationsethischen Fragen sich daraus ergeben. Eine Aufzeichnung des Vortrags findet sich hier:

31c3_arche3000_josch

  • Die FAZ berichtet darüber: Der Hacker als Künstler und Aktivist (27.12.2014, Morten Freidel).
  • Kurz der Deutschlandfunk: Diskussion mit Propaganda-Bots (27.12.2014, Peter Welchering im Gespräch mit Manfred Kloiber)
  • Einige Spezialexperten haben den Vortrag als informationskriegerischen Akt gegen Russland aufgefasst und haben gleich zu den Waffen gegriffen. Ihr habt’s wirklich verstanden! Der Informationskrieg tendiert ins Totale: alles, wirklich alles, kann als Teil des Infokriegs aufgefasst werden. Und ihr seid schon mittendrin.


comments: Kommentare deaktiviert für 31c3: Operative Kommunikation im digitalen Informationskrieg tags: , , , , , , ,

Looking Into Black Boxes #2

Posted on 20th September 2014 in Digitale Revolution, Meta

Das Team von „Looking into Black Boxes“ hat mich für die #2 ihrer Serie zum Thema Sprachdialogsysteme und Callcenter interviewt.





Was ich zum Einfluss der Digitalisierung auf die Sprache zu sagen habe, habe ich kürzlich auch für dieses Blog aufgeschrieben. Vielen Dank an Dirk Herzog, Fiona Krakenbürger und Jan Rödger für das interessante Gespräch und den gut gemachten Film!


comments: Kommentare deaktiviert für Looking Into Black Boxes #2 tags: ,

Die Zukunft der deutschen Sprache (im digitalen Zeitalter)

Posted on 11th September 2014 in Digitale Revolution, Meta

Wenn man Texte über die Zukunft der deutschen Sprache liest, dann werden immmer wieder drei Tendenzen genannt:

  • wir werden in Zukunft noch mehr Wörter und Wendungen aus dem Englischen entlehnen
  • die Tendenz von synthetischen Formen zu analytischen Konstruktionen wird sich fortsetzen
  • (Multi-)Ethnolekte werden die Strukturen des Deutschen beeinflussen

So interessant und richtig diese Beobachtungen sein mögen, so scheint mir doch, dass die Zukunft der deutschen Sprache — und auch anderer Sprachen — am meisten davon beeinflusst wird, dass Computer einen immer größer werdenden Anteil an der Kommunikation haben. Aber nicht im trivialen Sinn, dass in der computervermittelten Kommunikation die Sprache verfällt. Computer sind vielmehr direkt oder indirekt immer tiefer in Transferprozesse im Medium der Sprache involviert. Und das hat Folgen in mindestens drei Bereichen:


1. Sprachliche Äußerungen werden nicht mehr nur von Menschen für Menschen produziert

Wenn Menschen früher geschrieben haben, dann haben sie das immer mit der Absicht und im Bewusstsein dessen getan, dass andere Menschen das Geschriebene lesen. Im digitalen vernetzten Zeitalter ist dies längst nicht mehr so. Viele Texte im Netz werden heute in dem Bewusstsein geschrieben, dass die Texte von Suchmaschinen durchsucht werden; und sie werden auf die Indexierungs- und Ranking-Algorithmen der Suchmaschinen hin optimiert. Die Adressaten bei suchmaschinenoptimierten Texten sind also nicht mehr nur die Menschen, sondern auch die Suchmaschine. Auf den Webseiten von „Textoptimierern“ liest sich das dann so: „Ob Blogbeitrag, Produktbeschreibungen, Artikel oder große Webprojekte zu den vielfältigsten Themen: NN ist der schnelle Weg für qualitativ hochwertigen Text-Content, der nicht nur Ihre User, sondern auch Suchmaschinen überzeugt.“ Und es gibt schon lange Texte, die ausschließlich für Suchmaschinen verfasst werden, viele Seiten in Webshops etwa werden nur für Google getextet. Hier ist es Usus, für jedes „Keyword“, also jedes Such-Lexem, das für den eigenen Geschäftsbereich relevant ist, und seine Kombinationen mit anderen Keywords eine eigenständige Landing Page mit „einzigartigem Content, der sich ausschließlich mit dem jeweiligen Keyword beschäftigt“ zu erstellen.

Parallel kommunizieren wir zunehmend natürlichsprachlich mit Computern und nicht mehr ausschließlich vermittelt über eigens für die Mensch-Maschine-Kommunikation entwickelte Sprachen, die wir mühsam erlernen müssen (vulgo: Programmiersprachen), oder von Sprache begleitet ikonische Systeme (vulgo: User Interfaces). Softwareunternehmen arbeiten vielmehr daran, dass wir unsere Anfragen und Befehle an Computer möglichst alltagssprachlich formulieren können, so dass wir den Eindruck bekommen, mit Computern wie mit Menschen interagieren zu können. Siri lässt grüßen.

Gleichzeitig produzieren Computer mehr und mehr auch natürlichsprachliche Texte: Sie verfassen Wikipedia-Artikel oder standardisierte Nachrichtentexte, formulieren Gutachten oder geben Antworten in Dialogsystemen. Und sie produzieren sogar natürlichsprachige Texte, die gar nicht für Menschen gemacht sind: Algorithmen der automatischen Textoptimierung schreiben menschliche Text so um, dass sie von Suchmaschinen höher gerankt werden, oder sie kompilieren die Texte gleich selbst aus natürlichsprachlichem Material. Computer schreiben für Computer.

Ob wir also Texte für Suchmaschinen optimieren, beim Schreiben von E-Mails oder im Chat bestimmte Schlagwörter vermeiden, um nicht in das Visier von Geheimdiensten oder Polizei zu geraten, oder einen Tweet mit einem Hashtag versehen: immer handeln wir im Bewusstsein dessen, dass Computer mitlesen, analysieren und ordnen, um Inhalte auffindbar zu machen. Aber Computer sind immer häufiger auch die Adressaten natürlichsprachiger Äußerungen und produzieren im Zuge dessen auch selbst natürlichsprachlich daherkommende Äußerungen und zwar für Menschen und Computer gleichermaßen. Vielleicht ist es noch nicht an der Zeit zu sagen, dass Sprache damit in letzter Konsequenz nicht mehr eine exklusive Eigenschaft der Spezies Mensch ist; denn Computer sind keine Spezies. Aber Computer haben einen wachsenden Einfluss, auch auf das soziale Konstrukt Sprache.


2. Die Mensch-Maschine-Kommunikation verlangt nach einer Standardisierung der Sprache

Immer dann, wenn Menschen direkt sprachlich mit Maschinen interagieren, sind sie gezwungen, ihre Sprache den Verarbeitungsmöglichkeiten des Computers anzupassen. Schon bei Speech-to-text-Anwendungen, wenn die Maschine nicht mehr ist als ein intelligentes Werkzeug, müssen sie deutlich sprechen oder zumindest auf die Art, wie sie die Maschine trainiert haben. Der adressatenspezifische Zuschnitt von Beiträgen zu einem Gespräch, das die Linguistik recipient design nennt, ist freilich nicht ungewöhnlich, er bedeutet aber beim jetzigen Stand der computerlinguistischen Möglichkeiten auch eine massive Reduktion der sprachlichen Möglichkeiten. Die Folge ist eine Standardisierung unseres Sprachverhaltens, eine Reduzierung der Variation und eine Vermeidung von Ambiguitäten, die zum Misslingen der Kommunikation führen könnten.

Die Chance, dass Computer unsere sprachlichen Äußerungen im von uns intendieren Sinn verarbeiten kann, steigen dramatisch, wenn unsere Äußerung geringe phonetische oder orthographische Variation aufweist, eine einfache, zuverlässig parsbare Syntax hat und wir Kernwortschatz oder terminologisierter Ausdrücke benutzen. Die computerinduzierte Standardisierung unserer Sprache führt also zu Vereinheitlichung, Vereinfachung und Logisierung.

Standardisierung freilich ist nichts, was erst mit dem Computer in die Sprache kam. In allen Sprachen formieren sich Sprachstandards und viele Sprachgemeinschaften haben sogar kodifizierte Standardsprachen ausgebildet. Diese Standardsprachen und ihre Beherrschung werden zweckrational (Verständigung optimieren), kulturelitär (differenzierte Literatursprache als kulturelle Errungenschaft) und gesellschaftspolitisch (Integration durch gemeinsame Sprache) begründet. Sprachvorbilder, die bei der Konstruktion der Standardnorm herangezogen wurden, waren historisch gesehen die Sprache der Schriftsteller, die Sprache der oberen Schichten in den kultiviertesten Regionen oder die Sprache der überregionalen Zeitungen. Die Digitalisierung macht hier einen Paradigmenwechsel möglich: Im Internet kann jeder Mensch sprachliche Spuren hinterlassen, die technisch auf die gleiche Weise zugänglich sind und mit dem gleichen Aufwand erfasst werden können wie die Texte überregionaler Zeitungen. Eine Standardnorm, die sich stärker am Sprachgebrauch aller Angehörigen einer Sprachgemeinschaft orientiert, ist denkbar. Doch just in diesem historischen Moment wird der Computer selbst zum Faktor der Standardisierung: Sprachnormen werden nicht mehr allein von Menschen auf der Basis menschlichen Handelns gemacht, die Kommunikation mit, für und von Computern führt vielmehr neue Begründungsmuster in den Sprachnormendiskurs ein. Standardsprache wird in Zukunft auch daran gemessen, wie gut sie maschinell verarbeitbar ist.


3. Vom Gewebe zur Struktur: Die Vertextung von Wissen tritt zurück hinter die Repräsentation von Wissen in der Form strukturierter Daten

Der Text ist die klassische Form der Wissensspeicherung, der Wissensvermittlung und der diskursiven Verhandlung von Wissen. Und das mit gutem Grund: in Texten kann Wissen begründet, hinterfragt und durch Verweise auf andere Texte mit Kontextwissen verknüpft werden. Texte sind kohärente, d.h. thematisch orientierte, Sprachhandlungen, die aus transphrastischen semantischen und syntaktischen Beziehungen, kulturellen Konventionen und Stilprinzipien ihre Einheit erhalten. Als Gewebe sind Texte nicht linear, auch wenn ihre graphische Repräsentation das suggeriert. Ihre Bestandteile sind komplex miteinander verknüpft und die Gesamtheit der Verknüpfungen lassen den Text überhaupt erst als solchen entstehen. Und Texte sind offen für Interpretationen, ihr Sinn liegt nicht fest, bestenfalls gibt es Auslegetraditionen.

Mit all diesen Dingen sind Computer überfordert. Im Textmining war ein Text lange eine bag of words, ein Sack voller Wörter. Die grundlegende Idee hinter diesem schon in den 1960er Jahren entwickelten Ansatz ist, dass sich die Bedeutung eines Textes mit Hilfe des Gewichts der im Dokument vorkommenden Terme operationalisieren ließe. Ein Text wird dann als Vektor repräsentiert, dessen Elemente die dokumentenspezifischen Werte jedes einzelnen Terms enthält. Auch wenn die Merkmalsvektoren komplexer geworden sind und mehr Eigenschaftsdimensionen natürlicher Sprachen abbilden, so sind Informatik und Computerlinguistik noch weit davon entfernt, den menschlichen Umgang mit Texten modellieren zu können.

Und solange dieses Defizit besteht, solange wird immer dann, wenn Wissen nicht nur für Menschen, sondern auch für Computer bereitgestellt werden soll, die Datenbank den Vorrang vor dem Text erhalten. Die Entstehung von Wikidata ist ein Symptom für diese Entwicklung. Die vermeintliche Eindeutigkeit der strukturierten Daten, der Versuch, die Komplexität der Welt in einem Datenmodell abzubilden, mag zwar einen Gewinn an Präzision und Eindeutigkeit mit sich bringen, die Computer für ihre Operationen benötigen; diese Eindeutigkeit ist aber per se eine Beschränkung der möglichen Bedeutungen von kulturellen Einheiten, Phänomenen, ja von Fakten und entspricht nicht der Art, wie bislang in unserer Gesellschaft mit Wissen umgegangen wird. Und die Kultur der strukturierten Daten, die maschinell verarbeitet, verknüpft, verbreitet und universell importiert werden können, ist offener für Manipulation und Missbrauch als die Textkultur.


Auch wenn an einzelnen Stellen Kritik anklingt, will ich die geschilderten Tendenzen nicht negativ beurteilen. Denn neben dem Verlust eines Alleinstellungsmerkmals unserer Spezies, an alleiniger Definitionsmacht der Menschen über Sprachnormen und dem Verlust des Primats von Texten gegenüber strukturierten Daten gewinnen wir durch die Digitalisierung der Sprache und ihre maschinelle Modellierung auch unendlich viele neue kommunikative Möglichkeiten. Und an Möglichkeiten, die digitalisierte Sprache zu hacken.



Für die Sächsische Zeitung hat Dominique Bielmeier mit mir über das Thema gesprochen.

Maschinelle Analyse narrativer Muster: Wie Männer und Frauen vom “Ersten Mal” erzählen

Posted on 5th September 2014 in Kollokationen, n-Gramme, Off Topic, Visualisierung

Ich hatte mein erstes Mal -> mein erstes Mal mit # -> nahm mich in den Arm -> fragte er mich ob ich -> wir bei ihm zu Hause -> seine Eltern nicht da waren -> kam er auf mich zu -> mich zu küssen und ich -> legten uns auf sein Bett -> fragte mich was los sei -> noch nie einen Freund gehabt -> zogen wir uns gegenseitig aus -> Wir küssten uns leidenschaftlich und -> Dann zog ich ihm seine -> Er schaute mich an und -> schaute mich an und fragte -> an und fragte ob ich -> mit ihm schlafen wolle und -> Er holte ein Kondom aus -> Dann drang er vorsichtig in -> er vorsichtig in mich ein -> Er fragte mich ob ich -> Als er merkte dass ich -> nahm mich in den Arm -> seit # Jahren zusammen und

Diese Phrasen bleiben von einer Geschichte vom „Ersten Mal“, wenn man von ihr das Vereinzelnde, Individualisierende wegnimmt und nur jene Teile der sprachlichen Gestaltung übrig lässt, die auch in anderen Geschichten zum gleichen Thema häufig vorkommen.

Wenn wir unseren Alltag erzählen, dann bedienen wir uns kulturell geprägter Muster. Diese Narrative sind sozial akzeptierte Interpretationsmuster, die unsere Wahrnehmung und Darstellung von Zusammenhängen überhaupt erst ermöglichen, aber gleichzeitig auch begrenzen. Obwohl sie höchst Persönliches und Individuelles zu codieren vorgeben, folgen auch Narrative vom „Ersten Mal“ kulturell geprägten Mustern, denen man sich mit maschinellen Methoden nähern kann. Zusammen mit Noah Bubenhofer und Nicole Müller habe ich 3376 Geschichten vom „Ersten Mal“ auf geschlechtsspezifische Unterschiede hin untersucht.

Sämtliche Geschichten wurden auf den Internet-Plattformen rockundliebe.de (2094 Erzählungen), Erstes-Mal.com (385 Erzählungen) und planet-liebe.de (897 Erzählungen) gesammelt. Die Webseiten wurden automatisiert heruntergeladen, die Texte extrahiert, mit Metainformationen (Alter beim Ersten Mal und Geschlecht) versehen, mit Hilfe des TreeTagger lemmatisiert und mit Part-of-speech-Informationen annotiert. Zusätzlich wurden alle Zahlen durch ein Raute-Symbol ersetzt. Insgesamt umfasst das Korpus 1.886.588 laufende Wortformen. Im Hinblick auf die Dimension Geschlecht ist das Korpus ungleich verteilt: rund 73% der Geschichten stammen von Frauen, nur rund 27% von Männern. Geschichten von Frauen waren mit durchschnittlich 567.9 Wörtern um rund 33 Wörter länger als die von Männern (534.5). Das Durchschnittsalter beim Ersten Mal, wie es von den Autorinnen und Autoren angegeben wurde, lag bei Frauen bei 15.8, bei Männern bei 16.8 Jahren.

Als Analysekategorien dienten uns die Distribution und Verkettung von n-Grammen. Die folgende Tabelle zeigt einen Vergleich der für das jeweilige Korpus typischsten n-Gramme:


Männer-Korpus Frauen-Korpus
llr n-gram f(1) f(2) llr n-gram f(1) f(2)
145,33 fragte sie mich ob ich 0 54 80,84 drang er in mich ein 134 0
88,81 fragte ich sie ob sie 0 33 77,82 ob ich mit ihm schlafen 129 0
75,36 drang ich in sie ein 0 28 68,97 fragte er mich ob ich 167 5
67,28 Ich fragte sie ob sie 0 25 60,93 in mich ein Es tat 101 0
64,59 drang langsam in sie ein 0 24 60,93 legte er sich auf mich 101 0
64,59 setzte sie sich auf mich 0 24 47,66 legte sich auf mich und 79 0
64,59 und zog es mir ueber 0 24 47,66 und drang in mich ein 79 0
61,9 setzte sich auf mich und 0 23 45,85 nahm mich in den Arm 76 0
59,21 sie sich auf mich und 0 22 44,64 und legte sich auf mich 74 0
56,52 ob ich mit ihr schlafen 0 21 44,04 fing er an mich zu 73 0
53,83 Sie fragte mich ob ich 0 20 43,43 er sich auf mich und 72 0
53,83 in sie ein Es war 0 20 42,83 in mich ein Es war 71 0
53,83 mir ein Kondom ueber und 0 20 41,81 Er fragte mich ob ich 123 6
53,83 und ich fragte sie ob 0 20 41,02 und zog es sich ueber 68 0
51,13 fluesterte sie mir ins Ohr 0 19 40,42 ihn in mir zu spueren 67 0
51,13 ich fragte sie ob sie 0 19 40,42 Er legte sich auf mich 67 0
48,44 an mir einen zu blasen 0 18 38 er fragte mich ob ich 63 0
48,44 ich drang in sie ein 0 18 38 mich ob ich mit ihm 63 0
48,44 legte sich auf den Ruecken 0 18 35,59 fragte mich ob ich es 59 0
48,44 mir das Kondom ueber und 0 18 34,38 Ich war mit meinem Freund 57 0


Aus diesen Listen wird unter anderem erkennbar, dass die verbale Handlung des Fragens, oder präziser: des Einholens von Einverständnis, offenbar häufig Bestandteil von Erstes-Mal-Erzählungen sind. Ebenso zeigen sich einige wenige geschlechtsspezifische Unterschiede: etwa die Referenz auf die Dauer der Beziehung („Ich war mit meinem Freund“).

Als eine erste Annäherung an die narrative Struktur haben wir die typischen Positionen von n-Grammen in den Texten bestimmt. Hierfür haben wir alle Texte in mehrere jeweils gleich große Teile geteilt und dann untersucht, in welchen Teilen der Erzählungen die n-Gramme mit welcher Frequenz vorkommen. Die folgenden Abbildungen zeigen die Distribution einiger n-Gramme, deren Positionierung im Text geschlechtsspezifische Unterschiede aufweist. Dies sind beispielsweise n-Gramme, die sexuelle Erfahrung und Beziehungsstatus betreffen:



Distribution von n-Grammen in den Geschichten von Männern und Frauen (normalisierte Werte)

Distribution von n-Grammen in den Geschichten von Männern und Frauen (normalisierte Werte)



Während das n-Gramm „für uns beide das erste“ von Frauen im ersten und vorletzten Abschnitt am häufigsten gebraucht wird, erwähnen Männer die Tatsache, dass es für beide das Erste Mal war, erst am Ende ihrer Erzählungen. Auch das n-Gramm „schon # Monate zusammen und“ wird von Frauen dominant in den ersten Teilen ihrer Geschichten verwendet, Männer hingegen benutzen es am Ende. Eine Kontextanalyse zeigt allerdings, dass bei Verwendung des n-Gramms am Ende einer Erzählung der Geschlechtsakt der Auftakt der Beziehung war, die ihre Fortsetzung bis in die Gegenwart zum Zeitpunkt des Schreibens hat; die Verwendung des n-Gramms zu Beginn einer Erzählung stellt die Dauer der bereits bestehenden Beziehungen dar.

Größere Differenzen in der Distribution zeigen sich auch bei n-Grammen, die auf Schlüsselhandlungen im Kerngeschehen verweisen.



Distribution von n-Grammen in den Geschichten von Männern und Frauen (normalisierte Werte).

Distribution von n-Grammen in den Geschichten von Männern und Frauen (normalisierte Werte).



So sind die n-Gramme „uns in die Augen und“ und „gab mir einen Kuss und“ je gegensätzlich verteilt. Während in den Erzählungen der Frauen der Kuss am Anfang jener Abschnitte zu finden ist, die sich mit sexuellen Handlungen befassen, berichten Männer hier vorwiegend von Blicken in die Augen; Männer berichten, am Ende der sexuellen Aktivitätsphase geküsst zu werden, Frauen erzählen hier dagegen vom Austausch von Blicken. Dies könnte man so deuten, dass für Frauen mit dem Vollzug des Geschlechtsaktes eine Intensivierung der Beziehung einhergeht, die für den Mann durch die Gabe des Einverständnisses zum Geschlechtsakt durch den tiefen Blick bereits erreicht ist und sich dann im Akt manifestiert. Ein weiterer Aspekt könnte sein, dass Männer narratologisch versichern wollen, dass Einverständnis vorgelegen hat, Frauen dagegen, dass zwischen den Partner emotionale Nähe herrschte. Dies könnte ein Hinweis darauf sein, dass sich aufgrund kultureller Stereotype geschlechtsspezifische Ängste mit dem „Ersten Mal“ verbinden. In diesen Kontext passen auch die Positionsdifferenzen des n-Gramms „küssten uns die ganze Zeit“. Während das fortwährende Küssen in den Erzählungen der Männer Teil von „Vor-“ bzw. „Nachspiel“ zu sein scheint, schildern Frauen ihr Erstes Mal so, dass das Küssen Bestandteil aller Phasen des Kerngeschehens sein kann.

Unser Verfahren zur Rekonstruktion narrativer Muster auf der Makroebene kombiniert typische Musterpositionen mit n-Gramm-Verkettungen (d.h. kookkurierenden n-Grammen) und visualisiert sie als hierarchischen Graphen. Der folgende Graph (hier als PDF zum Vergrößern), der Tetragrammverkettungen in den Geschichten von Frauen illustriert, bildet die Abfolge von Mustern in der vertikalen Dimension (von oben nach unten) ab. Mehrere voneinander unabhängige narrative Muster im gleichen Abschnitt, das heißt an ähnlichen Erzählpositionen, werden nebeneinander dargestellt. In diesem Graphen sind Bereiche von geringer phraseologischer Durchdringung und Verdichtungsbereiche sichtbar.



Narrationsgraph für die Erzählungen von Frauen

Narrationsgraph für die Erzählungen von Frauen



Muster in 1 referieren auf das Alter der Hauptpersonen der Erzählung:

Mein erstes Mal hatte – ich mit meinem Freund – hatte ich mit # – erstes Mal mit # – Bei meinem ersten Mal – ersten Mal war ich – Freund und ich waren – Ich war damals # – Ich war # und – # und er war – älter als ich und – ist # Jahre älter

Muster in 2 referieren auf die Dauer der Beziehung:

# Monate mit meinem – Monate mit meinem Freund – # Wochen mit meinem – mit mei-nem Freund zusammen – # Monate mit ihm – Monate mit ihm zusammen

Muster in 3 referieren auf die Frage des Mannes nach dem Einverständnis:

schaute mir tief in die – schaute mir lange in die – in die Augen und – fragte mich ob ich – Er fragte mich ob – mit ihm schlafen – ich es wirklich will – ich es wirklich wollte

Muster in 4 referieren auf das sexuelle Geschehen, in dem vor allem der Mann aktiv ist:

Er holte ein Kondom – Kondom aus seiner Hosentasche – aus seiner Tasche – Kondom aus seinem Nachttisch – holte ein Kondom raus – und streifte es sich – zog es sich über – sich über und drang – ganz vorsichtig in mich – langsam und vorsichtig in – langsam in mich ein – drang in mich ein – in mich ein Es – Es tat überhaupt nicht – tat überhaupt nicht weh

Muster in 5 referieren auf den gegenwärtigen Beziehungsstatus:

Und wir sind immer – immer noch zusammen und – immer noch mit ihm – noch mit ihm zusammen – Schatz ich liebe dich – liebe dich über alles

Die Umrisse der typischen Erzählung vom Ersten Mal aus der Sicht von Frauen werden anhand dieses Verfahrens gut sichtbar. Alternative Erzählstränge, die sich teilweise paral-lel zu den grau hinterlegten Teilen befinden, beziehen sich auf die Aspekte Schmerz („erst tat es ein“, „ein bisschen weh aber“, „dann war es einfach“, „es einfach nur noch“), praktische Unerfahrenheit („versuchte in mich einzudringen“) und die Evaluation („Es war ein wunderschönes“, „Es war ein unbeschreibliches“, „war ein unbeschreibliches Gefühl“, „Ich hätte nie gedacht“).

Aus dem folgenden Narrationsgraph (hier als PDF zum Vergrößern), der die Muster aus männlicher Perspektive verfasster Geschichten visualisiert, will ich nur zwei Auffälligkeiten aufgreifen.



Narrationsgraph der Geschichten von Männern

Narrationsgraph für die Erzählungen von Männern



Zum einen sind dies jene sprachlichen Muster im mit 1 bezeichneten Bereich, die auf die Einholung des Einverständnisses zum Geschlechtsakt verweisen. Hier ist es so, dass die Frage von männlicher wie weiblicher Seite kommen kann („fragte sie mich ob“, „ich fragte sie ob“). Zum anderen findet sich im mit 2 bezeichneten Bereich (siehe die nächste Abbildung) eine auffällige Verbindung mehrerer n-Gramme mit der Mehrworteinheit „Sie meinte ich solle“.



Ausschnitt aus dem Narrationsgraphen der Männer

Ausschnitt aus dem Narrationsgraphen der Männer



Die Analysen zeigen, dass Geschichten vom Ersten Mal von Männern und Frauen recht ähnlich erzählt werden und zwar nicht nur im Hinblick auf das sexuelle Geschehen, sondern auch im Hinblick auf die verbalen Handlungen, die ihm vorausgehen und es begleiten. Zentraler Bestandteil typischer Erzählungen beider Geschlechter ist die verbale Verständigung über die Bereitschaft zum Geschlechtsakt und die explizite Gabe des Einverständnisses durch die Frau. Das von der Paarsoziologie als Schwellen-Wendepunkt bezeichnete Erste Mal wird also als eine durch Einverständnis der Frau legitimierte Handlungsfolge erzählt, in der der Mann mehr Handlungsmacht hat als die Frau.

Die Ergebnisse der Analyse haben wir in folgendem Artikel zusammengefasst, den es auch als Preprint gibt:

Bubenhofer, Noah / Nicole Müller / Joachim Scharloth (2014): Narrative Muster und Diskursanalyse: Ein datengeleiteter Ansatz. In: Zeitschrift für Semiotik. Band 35, Heft 3-4 (2013), S. 419-444.


comments: Kommentare deaktiviert für Maschinelle Analyse narrativer Muster: Wie Männer und Frauen vom “Ersten Mal” erzählen tags: , , , , , , , , , , ,

DIE ZEIT über Kulturwissenschaften im Data-driven Turn

Posted on 22nd August 2014 in Datengeleitete Analysen, Digitale Revolution

Stefanie Schramm hat für DIE ZEIT (N° 35/2014, S. 27) einen großen Artikel über David Eugsters, Noah Bubenhofers und meine Analyse ihres Printarchivs geschrieben.



Kollokationsgraph von ZEIT-Artikeln, die den Tugendframe enthalten

Kollokationsgraph von ZEIT-Artikeln, die den Tugendframe enthalten



Die Studie „Kulturwissenschaften im Data-driven Turn“, die ich schonmal hier im Blog vorgestellt hatte, ist in folgendem Sammelband erschienen:

Scharloth, Joachim/Eugster, David/Bubenhofer, Noah (2013): Das Wuchern der Rhizome. Linguistische Diskursanalyse und Data-driven Turn. In: Busse, Dietrich/Teubert, Wolfgang (Hrsg.): Linguistische Diskursanalyse. Neue Perspektiven. Wiesbaden: Springer VS. S. 345-380.

Das Preprint zum Aufsatz ist hier einsehbar.


comments: Kommentare deaktiviert für DIE ZEIT über Kulturwissenschaften im Data-driven Turn tags: , ,