Themenerkennung durch Kompositaanalyse

Posted on 17th März 2012 in ideology mapping, Linguistische Kategorien

Liebe Freunde der Sicherheit,

heute wollen wir uns eine sprachliche Kategorie ansehen, die zusammen mit anderen einen Beitrag zur Ideologieerkennung leisten kann: Komposita. Die deutsche Sprache ermöglicht es ihren Sprecherinnen und Sprechern ja bekanntermaßen, Wörter aus mehreren Bestandteilen (sog. Morphemen) zusammenzusetzen. Aus dem Nomen „König“ und dem Suffix „lich“ wird zum Beispiel „königlich“. Ein Wort wie „Königstiger“ besteht aus dem lexikalischen Morphem /könig/, einem sog. Fugenelement /s/ und dem lexikalischen Morphem /tiger/. Im ersten Fall, wo ein neues Wort mit Hilfe eines Affix gebildet wird, spricht man von Derviation. Wird ein Wort aus zwei oder mehr lexikalischen Morphemen (also Morphemen, die auch alleine stehen können) zusammengesetzt, dann sprechen Linguistinnen und Linguisten von Komposition.

Die Komposition ist im Deutschen ein sehr wichtiges Wortbildungsmittel, wichtiger als in vielen anderen Sprachen. So können mit Hilfe der Komposition sogar ad hoc Sachverhalte mit neuen Wörtern bezeichnet werden, wenn sich die Bedeutung aus den einzelnen Gliedern erschließen lässt. Denken wir an das schöne Kompositum „Selbstverteidigungsminister“.

Interessant wird es aber wie immer erst dann, wenn man sich Komposita in größeren Mengen anschaut. Denn wenn über ein Thema intensiv gesprochen und geschrieben wird, dann steigt nicht nur die Frequenz des themenspezifischen Wortschatzes, sondern es steigt auch die Anzahl der verwendeten Komposita, die mit Hilfe dieses Wortschatzes gebildet werden können. Augenscheinlich wird dies am Beispiel des lexikalischen Morphems /terror/, dessen Distribution in der ZEIT (print) ich visualisiert habe.


Komposita mit dem lexikalischen Morphem /terror/ in der ZEIT (print) 1995-2011


Man sieht, dass mit dem Jahr 2001 die Frequenz des Lemmas „Terror“ zwar ansteigt, die Verwendung von Komposita (token), die /terror/ enthalten, jedoch noch viel stärker zunimmt. Gleichzeit steigt auch die Anzahl der Komposita (types), die überhaupt verwendet werden. Der themenspezifische Wortschatz differenziert sich mittels Komposition also aus und wird zudem häufiger verwendet. Komposita scheinen also ein guter Themenindikator zu sein, vielleicht sogar ein besserer als Schlagworte.

Wenn man das, was hier am Beispiel von /terror/ illustriert wurde, für den gesamten Wortschatz in einem Korpus macht, erhält man natürlich ein sehr viel aussagekräftigeres Bild. Ich will dies anhand einer Analyse eines rechtsextremen Nachrichtenportals anschaulich machen. Es handelt es sich dabei um den inzwischen sowohl online als auch offline eingestellten sog. „Rundbrief an Freunde und Förderer der volkssozialistischen Bewegung“ mit dem Titel „Der Fahnenträger“. Von diesem Elaborat enthält das Untersuchungskorpus 222 Texte mit zusammen 566.905 laufenden Wortformen.

Um die Aussagekraft der Ergebnisse zu erhöhen, wurde berechnet, welche lexikalischen Morpheme im „Fahnenträger“ signifikant häufiger zur Bildung von Komposita benutzt wurden als in der gedruckten ZEIT der letzten 17 Jahre. Das Ergebnis habe mit den 90 signifikantesten lexikalischen Morphemen habe ich in einer Wortwolke visualisiert:


Der Fahnenträger

DemokratwirtschaftlichirischrevolutionierenMilitärneoliberalpolitischEigentumGewaltLohnarbeitenantiUnionistKundgebungAutonomieDKPimperialBDMimperialistischIreRasseAgrarzentralistischmarxistischPSIGewerkschaftMarxistKAPDKlasseFaschismusRegierungWiderKampfPolitikstaatlichkapitalHerrschaftregierenMachtImperialImperialismusISAFFAUArditiEuzkadiScheringerVWNsozialRUCBDOADGBKapitalSchlageterArbeitOrganisationNiekischBaskeFaschistFrontLinksfaschistischreaktionärNRWirtschaftGSRNNationalerevolutionärBahamasSFMASNKFDFéinBRDParteikapitalistischFiumeAntifaflämischStaatSozialistKPDETAKapitalistnationalNSVolkFlameIRAsozialistischStrasser

Das Ergebnis ist auf den ersten Blick verwirrend: Es finden sich auffällig viele Komposita mit den Akronymen radikaler, extremistischer und terroristischer Organisationen der Linken wie der Rechten, lexikalische Morpheme aus dem Kontext der (marxisitschen) Kapitalismuskritik („neoliberal“, „Lohn“, „Eigentum“, „Klasse“, „Imperialismus“, „reaktionär“, „kapital“ etc.), zugleich aber auch lexikalische Morpheme, die auf nationalistisch-völkische Ideologie verweisen („Volk“, „national“, „Flame“, „flämisch“, „faschistisch“, „Strasser“). Dies entsprach freilich der politischen Selbstverortung der Macher. Sie sahen sich „jenseits des ‚rechten Mainstreams'“ und orientierten sich, laut Endstation Rechts „an Bestandteilen des Rätekommunismus, des Syndikalismus und der ‚Dritten Welle‘ des Weimarer Nationalbolschewismus.“ Dies erklärt auch die häufigen Komposita mit dem Namen Gregor Strassers.

Die Kompositaanalyse scheint also ein durchaus adäquates Abbild des Themenspektrums des „Fahnenträgers“ zu liefern. Dass die Welt auch eine schönere Seite hat, zeigt der komplementäre Blick auf die für die ZEIT typischen lexikalischen Morpheme, aus denen die meisten Komposita bestehen.


DIE ZEIT

MotorEuroberatenSommerBühnePartyFahrtsparenKundeInselTischHerstellerhohÖkoMaschineFarbeEisliebPlatzWerbungSzeneMarkesuperWaldMannManagerTypGartenModellGerätFanModeNachtGeschäftPlatteBaumNetzSchiffRaumSportTierKlangFußballFirmaTraumRomanFernsehStückZimmerSchuleLichtInternetKünstlerRadBandDorfKarteForscherTechnikWeinTestHotelStraßeTourFußProjektTonfahrenHolzLiebeBahnAutoWerkReisReiseTheaterFamilieKunstFilmMusikHausBuchfliegenBildKindforschenStadtFlugBallSpiel


Comments are closed.