Off Topic: Stromsparen in Japan – Die Atomindustrie hilft!

Posted on 5th August 2012 in Off Topic

Liebe Freunde der Sicherheit,

Die japanischen Atomkraftwerkbetreiber gehen in die Charmeoffensive. Damit wir stromsparend ohne Klimaanlage gut durch den heißen japanischen Sommer kommen, beschenken sie uns mit sympathischen und überaus praktischen Giveaways. Den modischen Fächer ziert auf der einen Seite ein charmantes Figurenensemble, das sich für ein sommerliches Matsuri in Schale geworfen hat, auf der anderen Seite das Atomkraftwerk unseres Vertrauens. Kawaii!



Praktisches Giveaway der japanischen Atomindustrie

Praktisches Giveaway der japanischen Atomindustrie



(Gesehen im Tsubaki no Yu in Matsuyama.)


comments: Kommentare deaktiviert für Off Topic: Stromsparen in Japan – Die Atomindustrie hilft! tags: , ,

Darüber lacht Fefe: Sprachliche Marker für Emotionen im Dienst der Ideologieerkennung

Liebe Freunde der Sicherheit,

geschriebene Sprache ist oft vieldeutiger als gesprochene Sprache, weil sie ohne prosodische Merkmale auskommen muss und wir obendrein weder Gestik noch Mimik der Schreibenden sehen. Um Aussagen zu vereindeutigen benutzen aber viele Online-Schreiberinnen und -Schreiber Marker für Emotionen. Für Linguisten sind solche Marker sehr interessant, denn man kann versuchen, mit ihrer Hilfe Modelle zu trainieren, die z.B. die automatische Identifizierung von Ironie in Texten ermöglichen. Sicherheitsinformatiker finden solche Marker aber auch sehr praktisch, denn man kann mit ihrer Hilfe noch besser messen, was Menschen zu bestimmten Themen denken.

Besonders fleißig werden solche Marker in Fefes Blog verwendet. Wenn Fefe sich über etwas oder jemanden lustig macht, setzt er oft ein „muhahaha“, ein „HAHAHA“ oder ein „Bwahahaha“ hinzu. Der folgende Kollokationsgraph zeigt, worüber Fefe lacht (auch als zoombares PDF):



Kollokationsgraph, der die Kollokationen zu den primären Kollokatoren von Lach-Indikatoren in Fefes Blog visualisiert



Im Bereich mit der größten Dichte finden sich Wörter wie „USA“, „Deutschland“, „Polizei“, „deutsch“, „Amis“, die für diejenigen, die keine Lust oder keine Zeit zum Lesen haben, Rückschlüsse auf Fefes Einstellungen zu deutschen Staatsorganen und zu den USA haben.



Kollokationsgraph zu Lach-Markern in Fefes Blog (Ausschnitt)



Doch worüber ärgert sich Fefe? Erstellt man anhand jener Blogposts, in denen das Akronym „WTF“ auftritt, einen Kollokationsgraphen, dann erhält man folgendes Ergebnis (auch als zoombares PDF):



Kollokationsgraph anhand von Posts mit „WTF“ in Fefes Blog



Wie der folgende Ausschnitt zeigt, ist ein besonders häufiges Lemma mit vielen signifikanten Kollokatoren das Lemma „Euro“. Offenbar ärgert sich Fefe besonders oft über sinnlose Ausgaben.



Kollokationsgraph anhand von Texten mit „WTF“ in Fefes Blog (Ausschnitt)



Spaßeshalber habe ich auch noch einmal visualisiert, was Fefe dazu motiviert, Popcorn zu fordern / bereitszustellen / zu bevorraten. Popcorn ist bei Fefe ein Marker für Schadenfreude. (auch als zoombares PDF):



Kollokationsgraph anhand von Posts mit „Popcorn“ in Fefes Blog




Viel Spaß beim Zoomen!


UPDATE: Hier noch einmal die Grafiken im SVG-Format.

Geschichte der computergestützten Autorenerkennung am Beispiel der Texte der „militanten gruppe“

Liebe Freunde der Sicherheit,

Die Verfahren, die bei der maschinellen Autorenidentifizierung zum Einsatz kommen, wurden im Verlauf der Geschichte immer mächtiger, analog zur Entwicklung der Rechenleistung von Computern. Die computergestützte Autorenerkennung kann grob in drei Phasen eingeteilt werden.

1. Die Suche nach globalen Konstanten
Ausgehend von der Annahme, dass dem Stil eines Autors etwas Invariantes eignen müsse, waren die ersten Versuche, Autorschaft aufgrund sprachlicher Merkmale zuzuschreiben, von der Suche nach einem Maß geprägt, das die stilistische Einmaligkeit in einem einzigen Wert ausdrückt. Ich habe an anderer Stelle (hier und hier) einige Werte zur Wortschatzkomplexität vorgestellt und getestet, die in der Forschung als Repräsentanten von Ideolekten verstanden wurden.

2. Autorenidentifizierung mittels multivariater Statistik
Während die Klassifikation mittels einer autorspezifischen Konstanten ein univariates Verfahren ist, wurde ab den 1960er Jahren damit begonnen, mehrere Merkmale von Texten zur Identifizierung von Autorschaft heranzuziehen. Das grundlegende Verfahren dabei ist, einzelne Dokumente als Punkte in einem mehrdimensionalen Raum aufzufassen. Der wahrscheinliche Autor eines in Frage stehenden Textes ist dann jener, dessen Texte die größte Nähe zum Punkt des anonymen Textes im multidimensionalen Raum haben.

3. Klassifikation mittels maschinellen Lernens
Bei der Autorenidentifikation wird seit den 1990er Jahren mit überwachtem maschinellen Lernen gearbeitet. Ziel des maschinellen Lernens ist es, einen Klassifikator zu finden, der ein Set an Texten möglichst gut in Klassen einteilt, um danach zu prüfen, welcher Klasse der Klassifikator den anonymen Text zuordnen würde. Hierfür werden Merkmale von Trainingstexten, also von Texten, von denen die Autoren bekannt sind, als numerische Vektoren abgebildet. Mit Methoden maschinellen Lernens sucht man dann im Vektorraum nach Klassengrenzen, die eine Klassifikation mit möglichst wenigen Fehlern ermöglicht.

Im Folgenden möchte ich die verschiedenen Verfahren anhand diverser linguistischer Merkmale illustrieren, vor allem mit dem Ziel, einen kritischen Blick darauf zu ermöglichen, was eigentlich gemessen wird, wenn Autorenidentifikation betrieben wird. Zur Illustration wähle ich einen fünf Jahre zurückliegenden Fall, bei dem das BKA linguistisches Profiling betrieb.


Der „Fall“

Am 31. Juli 2007 brannten in Brandenburg / Havel mehrere Fahrzeuge der Bundeswehr. Drei mutmaßliche Täter wurden bei der Ausführung des Brandanschlags verhaftet. Am 1. August 2007 stürmte ein Sondereinsatzkommando auch die Wohnung des Soziologen Andrej Holm. Ihm wird vorgeworfen, Mitglied der „militanten gruppe“, einer damals als terroristisch eingestuften linksradikalen Gruppierung zu sein, die auch für die Brandanschläge in Brandenburg verantwortlich war. Die Polizei hielt ihn für den intellektuellen Kopf der Gruppe und den Verfasser der zahlreichen Bekennerschreiben und Diskussionspapiere, die die militante Gruppe veröffentlicht hatte. Die militante gruppe wird für 25 Brandanschläge, vornehmlich auf Fahrzeuge von Polizei und Bundeswehr, aber auch auf Sozial- und Arbeitsämter in den Jahren 2001-2007 verantwortlich gemacht. Sie gab 2009 ihre Selbstauflösung bekannt. Sie wird nicht mehr als terroristische, sondern als linksradikale kriminelle Vereinigung angesehen.

Andrej Holm hatte sich in den Augen der Polizei dadurch verdächtig gemacht, dass seine wissenschaftlichen Arbeiten in sprachlicher Hinsicht Ähnlichkeiten mit den Bekennerschreiben der Gruppe hatten: die Polizei stellte fest, dass Lemmata wie „Gentrifizierung“ und „Prekarisierung“ in den Texten Holms und der mg signifikant häufig vorkamen. Die Polizei hatte gegooglet, berichteten die Medien. Immerhin auch ein computergestütztes Verfahren. Da Verfassungsschutzbehörden sicherlich auch in den Fall involviert waren, kann jedoch auch gemutmaßt werden, dass andere, evtl. auch komplexere Verfahren der maschinellen Autorenidentifizierung zum Einsatz kamen, auch wenn diese im Ermittlungsverfahren gegen Andrej Holm keine weitere Rolle spielen konnten.


Die „Verdächtigen“

Aus Sicht der forensischen Linguistik soll nun der Fall neu aufgerollt werden. Um es gleich zu Beginn zu sagen: Das hier ist kein ernst zu nehmendes linguistisch-forensisches Gutachten und die Ergebnisse sind in keiner Weise dazu geeignet, Verdächtige zu überführen. Das zeigt auch schon die Liste jener, die ich „verdächtige“, Autoren der mg-Texte zu sein, die mithin mit Texten in meinen Trainingsdaten vertreten sind.

Zunächst folge ich unseren Strafverfolgungsbehörden und nehme zwei Korpora des vom BKA Verdächtigten Andrej Holm:

  • gentrification blog, Blog von Andrej Holm: 491 Posts, 304.406 laufende Wortformen, 2008-2012
  • gentrification Theorie, wissenschaftliche Aufsätze von Andrej Holm: 5 Aufsätze, 40.853 laufende Wortformen, 2004-2012.

Wenn Terrorverdacht im Raum steht, dürfen natürlich auch Ermittlungen in islamistischen Kreisen nicht fehlen:

  • Ich nehme zwei Korpora mit allen Forenbeiträgen der Autoren aus einem salafistischen Forum (derW****, 570.016 / Muu****, 268.165), die sich irgendwann einmal zur Situation auf dem Wohnungsmarkt geäußert haben, und
  • das Blog der Islambruderschaft Deutschland, 129.965 laufende Wortformen

Auch muss man aufpassen, sich nicht dem Vorwurf auszusetzen, auf dem rechten Auge blind zu sein:

  • Ich nehme zwei Autorenkorpora aus dem inzwischen geschlossenen NPD-Forum Gernot (88.161), Spinne (147.144) und
  • Michael Kühnens „Schriften“, 111.873 laufende Wortformen.

Zudem will ich überprüfen, ob nicht Alt-RAFler oder andere ehemalige Linksterroristen als militante Gruppe wieder aktiv sind. Daher nehme ich:

  • die Texte der Revolutionären Zellen (203.492) und
  • die Texte der Roten Armee Fraktion (195.939).

Ich nehme auch noch zwei Diskutanden aus dem Diskussionsforum eines globalisierungskritischen Netzwerks hinzu, weil Globalisierungskritiker nunmal verdächtig sind:

  • bur*** (102.955 laufende Wortformen), Pom*** (21.241 laufende Wortformen), 2007-2009.

Hinzu kommen noch zwei Autoren, die sich durch ihre publizistisches Wirken verdächtig gemacht haben:

  • Fefe, wegen Verbreitung von Verschwörungstheorien in seinem Blog: 24.239 Posts, 1.928.027 laufende Wortformen, 2005-2012
  • Franz Josef Wagner mit seiner Kolumne „Post von Wagner“, die von manchem als schwer staatsgefährdend empfunden wird: 1.390 „Briefe“, 233.008 laufende Wortformen, 2006-2012.

Später kommen dann noch die Texte der militanten gruppe dazu:

  • 15 Anschlagserklärungen (27.828)
  • 4 mg express (7.679)
  • 14 Texte zur Militanzdebatte (50.078)
  • 8 thematische Beiträge (90.328)

Die Suche nach globalen Konstanten ist so wenig zeitgemäß, dass ich hier auf die älteren Blogbeiträge verweise. Weil sich die Ergebnisse so gut veranschaulichen lassen, illustriere ich das Vorgehen bei der Autorenidentifizierung mittels multivariater Statistik anhand der Clusteranalyse.


Textclustering

Die Clusteranalyse ist ein strukturentdeckendes Verfahren der multivariaten Statistik. Sie entdeckt Gruppen von „ähnlichen“ Objekten. In unserem Fall sind die Objekte Texte, die aufgrund ihrer Ähnlichkeit bzw. Unähnlichkeit im Hinblick auf linguistische Merkmale gruppiert werden. Natürlich ist es von entscheidender Bedeutung, anhand welcher linguistischer Merkmale ich die Gruppierung vornehmen. Die folgenden drei Analysen zeigen eindrucksvoll, wie unterschiedlich die Ergebnisse bei je unterschiedlichen linguistischen Kategorien sind. Der Übersichtlichkeit halber habe ich mit den Gesamtkorpora gerechnet.

Sicherheitsinformatiker halten Funktionswörter für besonders gute linguistische Kategorien, weil sie glauben, dass sie unbewusst verwendet werden und daher auch nicht manipuliert werden können. Führt man eine Clusteranalyse anhand der Distribution von Funktionswörtern (z.B. Artikel, Präpositionen, Konjunktionen) durch, dann erhält man folgendes, eher unklare Bild:



Dendrogramm Funktionswörter



Die Texte Andrej Holms und der militanten Gruppe sind jeweils gelb gekennzeichnet, jedoch durch verschiedene Schriftfarben von einander abgesetzt. Eine Autorschaft Andrej Holms kann auf der Basis dieser Daten nicht abgeleitet werden — im Gegenteil. Zusammen mit anderen eher weltanschaulich-theorielastigen Texten (RZ, RAF, Islambruderschaft, Kühnen) bilden die Textkorpora der militanten Gruppe ein eigenes Cluster. Offenbar fungiert hier die Textsorte als Hintergrundvariable. Dass Fefe sich in der Nachbarschaft von Franz Josef Wagner befindet, ist ein interessantes Detail.

Führt man eine Clusteranalyse anhand der Distribution von Inhaltswörtern durch, kommt man zu einer anderen Gruppierung der Texte.



Dendrogramm Inhaltswörter



Die Texte zur Rechtfertigung linker Gewalt (RAF, RZ, mg) bilden ein Cluster. Auch Andrej Holms wissenschaftliche Texte und Blogbeiträge lassen sich zusammen als eigene Gruppe interpretieren, die aber einen großen Abstand zum Cluster der mg-Texte aufweist. Obwohl also bestimmte Inhaltswörter das BKA dazu verleitet haben, Andrej Holm zu verdächtigen, ergibt die Analyse von Inhaltswörtern, dass auf ihrer Basis eine Autorschaft kaum wahrscheinlich ist. Ansonsten zeigt das Dendrogramm, das Inhaltswörter sich nur leidlich gut für die Identifizierung inhaltlicher Gemeinsamkeiten eignen. Zwar liegen die Texte von Islambruderschaft und Salafisten in einem Cluster, allerdings befindet sich dort auch Franz Josef Wagner. Auch irritiert die Nachbarschaft, in der sich Fefe befindet.

Ein weitere Kategorie, mittels derer man Texte in interessanter Weise gruppieren kann, sind komplexe n-Gramme; vgl. hierzu einen älteren Beitrag.



Dendrogramm komplexe n-Gramme



Die Ananlyse zeigt hier zwar, dass die Texte Andrej Holms zusammen mit den Texten der militanten Gruppe ein Cluster bilden, allerdings ist auch hier offensichtlich, dass Texte, die entweder wissenschaftlich argumentieren oder sich stilistisch den Anschein von Wissenschaftlichkeit (Kühnen, RAF, RZ) geben wollen, gemeinsam gruppiert wurden. Es ist damit relativ offensichtlich, dass wir hier nicht Autorschaft messen, sondern Stilkonventionen oder Textsorten.


Maschinelles Lernen

Beim maschinellen Lernen sind die oben beschriebenen Korpora die Trainingsdaten, mit deren Hilfe ein Klassifikator berechnet wird. Der Klassifikator kann dann dazu benutzt werden, die anonymen Texte einer Klasse zuzuweisen. Bei der Autorenidentifizierung mittles maschinellem Lernen benutzt man üblicherweise eine große Vielzahl an linguistischen Merkmalen. Ich habe mich auf folgende beschränkt:

  • relative Frequenz intensivierende Partikel (Gradpartikel)
  • durchschnittliche Satzlänge
  • Wortschatzkomplexitätsmaß Yule‘s K
  • relative Frequenz Passiv-Konstruktionen
  • relative Frequenz Konjunktiv I
  • relative Frequenz Konjunktiv II
  • relative Frequenz von Partizipialkonstruktionen
  • relative Frequenz von Präpositionalgruppenclustern
  • Schwierigkeit der Präpositionalgruppencluster (durchschnittliche Häufigkeitsklasse (Quelle: DeReKo) der in Präpositionalgruppenclustern auftretenden Präpositionen)

Anders als bei den Untersuchungen vorher wurde nicht mit Gesamtkorpora gerechnet. Zum Trainieren des Klassifikators wurden alle Einzeltexte benutzt, die mindestens 800 laufende Wortformen haben.

Um zu illustrieren, wie so ein Klassifikator aussehen kann, habe ich das Entscheidungsbaumverfahren benutzt. Beim Entscheidungsbaumverfahren wird eine Datensatz Schritt für Schritt in Unterklassen geteilt.



Aus den Trainingsdaten abgeleiteter Entscheidungsbaum



Im obigen Graph kodiert jeder Pfad vom Wurzelknoten zu einem Blatt eine Entscheidungsregel. Berechnet man nun die linguistischen Merkmale der anonymen Texte, in unserem Fall der Texte der militanten Gruppe, dann können diese mit Hilfe der Entscheidungsregeln einem Autor zugewiesen werden.

Von den 41 Texten der militanten Gruppe werden mittels dieses Klassifikators 13 den Revolutionären Zellen zugeschrieben, 4 einem Diskutanden aus einem Forum, einen Beitrag zur Militanzdebatte soll Fefe verfasst haben, und 23 Texte der militanten Gruppe werden als den Blogbeiträgen von Andrej Holm am ähnlichsten klassifiziert. Dabei ist es bei den allermeisten Blogbeiträgen nur eine Kombination zweier Merkmale, die für die Klassifikation als Holm-Text verantwortlich sind: eine geringe Anzahl von Konjunktiv-II-Formen und ein relativ hoher Anteil Partizipialkonstruktionen. Ich habe die betreffende Entscheidungsregel in der folgenden Abbildung farblich markiert.



Entscheidungsbaum mit markierter Entscheidungsregel



Der Konjunktiv II ist eine grammatische Form, die häufig zum Ausdruck von Höflichkeit benutzt wird oder der Formulierung von Irrealem (etwa in irrealen Konditionalsätzen) dient. Es ist daher nicht falsch anzunehmen, dass es Zusammenhänge zwischen dem Inhalt des Gesagten und der Frequenz von Konjunktiv-II-Formen gibt. Partizipialkonstruktionen sind hingegen typische Merkmale eines Nominalstils, die in einem Wissenschaftler-Blog durchaus erwartbar sind, auch in meinem.

Messen wir hier also tatsächlich einen Individualstil? Oder nicht doch eher inhaltliche und kommunikationsbereichsspezifische Merkmale? Und wenn wir nicht genau wissen, ob unsere Messinstrumente valide sind, wie verhält es sich dann eigentlich mit der prognostischen Güte unseres Modells? Die Frage ist natürlich eine rhetorische, denn wenn die Merkmale nicht valide sind, dann ist der Klassifikator zwar gut genug, um die Trainingsdaten zu klassifizieren, aber er hat keinerlei prognostischen Wert.

Die Analyse zeigt, wie sehr die maschinelle Autorenidentifikation davon abhängig ist, anhand welcher linguistischer Merkmale wir die Klassifikation vornehmen und ob diese Merkmale tatsächlich als Repräsentanten eines Individualstils gelten können. Die Bedeutung kommunikationsbereichs-, textsortenspezifischer und inhaltlicher Faktoren ist bislang von der Forschung noch nicht annähernd hinreichend gewürdigt. Die Gefahr fälschlicherweise in Verdacht zu geraten, ist daher groß.


DIE KLAU MICH SHOW – dOCUMENTA(13)

Posted on 25th Juni 2012 in Off Topic, Politik, Terrorismus

Liebe Freunde der Sicherheit,

ich war in den letzten Wochen leider sehr beschäftigt. Unter anderem damit, nach Kassel zur dOCUMENTA(13) zu reisen. Dort durfte ich als Gast an der KLAU MICH SHOW (Radicalism in society meets experiment on TV) teilnehmen, einem Projekt von Dora Garcia. Weitere Gäste waren Rainer Langhans (Kommune I usw.) und Jessica Miriam Zinn (Piratenpartei Berlin), Jan Mech spielte souverän den Talk- und Showmaster.

Es ging um Eigentum und Diebstahl, Hedonismus und Spaßguerilla, Körper und Vergeistigung, Politik und Utopie, 1968 und Piraten. (Über Letztere hatte ich ja schon einmal geblogt.) Das Video ist online:



DIE KLAU MICH SHOW, dOCUMENTA(13)

DIE KLAU MICH SHOW, dOCUMENTA(13), 22. Juni 2012, Screenshot



Der Titel der Show zitiert den Titel des Buches „Klau mich“ der Kommune I. Die Kommune I war eine „Lebensgemeinschaft junger Maoisten“, die 1967 bis 1969 durch medienwirksame Protestinszenierungen und einen ostentativ hedonistischen Lebensstil einen großen Einfluss auf die 68er-Bewegung hatte und viel Aufmerksamkeit provozierte. Eine ihrer Provokationen war ein Flugblatt, in dem sie anlässlich eines Kaufhausbrandes in Brüssel mit etlichen Toten fragte „Wann brennen die Berliner Kaufhäuser?“ Die Autorinnen und Autoren behaupteten, Anti-Vietnamkriegsaktivisten hätten das Feuer gelegt, um den „saturierten Bürgern“ zu vermitteln, wie sich das Leben in Vietnam anfühlt, um den Krieg vom anderen Ende der Welt in die westlichen Metropolen zu tragen. „Keiner von uns braucht mehr Tränen über das arme vietnamesische Volk beim der Frühstückszeitung zu vergiessen“, heißt es im Flugblatt. „Ab heute geht sie in die Konfektionsabteilung von KaDeWe, Hertie, Woolworth, Bilka oder Neckermann und zündet sich diskret eine Zigarette in der Ankleidkabine an.“ Die Staatsanwaltschaft sah darin eine Anstiftung zur Brandstiftung und klagte Rainer Langhans und Fritz Teufel an. Es kam zu einem Prozess, den die beiden Kommunarden als Bühne für eine bis dahin nicht dagewesene Anti-Justiz-Show benutzten. Sie spielten virtuos auf der Klaviatur des Antiritualismus und brachten Richter, Staatsanwaltschaft und Zeugen mehrfach zur Verzweiflung. Den Prozessverlauf, die Einvernahmen und die Medienberichte rekonstruierten sie im Buch „Klau mich“.

In der Klau Mich Show am 22. Juni war Rainer Langhans zu Gast. Weil ich mich mit dem Prozess in meinem Buch „1968. Eine Kommunikationsgeschichte“ ausführlich beschäftigt habe und auch sonst viel zu viel über performative Praktiken als Medium des Protests geschrieben habe, wurde ich als Gast eingeladen. Weil Rainer Langhans keine Nostalgie-Show wollte, kam auch Jessica Miriam Zinn von der Piratenpartei Berlin als Gast.

Die Klau Mich Show hat ihre eigenen Rituale entwickelt: die Mitglieder des Theater Chaosium, die am Anfang über die Bühne auf die Plätze für das professionelle Publikum (Chor und Jury) gehen, die reißerische Ansage der Gäste, der kleine Dialog mit der Show-Stewardess Tabu oder die vom Theater Chaosium moderierten Übergänge, das bunte Finale. Beim Sehen von nur einer Folge erzeugen sie Irritationen, wie bei den Studierenden meines Semis, in Serie machen sie den Charme der Show aus. Anders als die Kommune I früher fügen sich in der Klau Mich Show die Gäste in die Rituale.

Ritualkritik und Antiritualismus waren nämlich wichtige Charakteristika der 68er-Bewegung. Durch Rituale nämlich aktualisieren Gemeinschaften ihre Ordnung und versichern sich ihrer Werte. Durch die performative Kraft der Rituale werden Identitäten konstruiert, durch sie erhalten sie den Anschein von Faktizität. Wer also die Gesellschaft und ihre Werte verändern will, der muss ihre Rituale kritisieren, verändern oder durch neue Rituale ersetzen.

Die 1960er Jahre waren die Zeit der Entdeckung des Performativen: in der Kunst wurde mit performativen Praktiken experimentiert, um dem Funktionieren von Zeichenprozessen nachzuspüren. Soziale Bewegungen nutzten Ritualstörungen und Antirituale, um unsichtbare gesellschaftliche Schranken bewusst zu machen und ihre Beseitigung im Hier und Jetzt vorwegzunehmen. So stilisierte Rudi Dutschke in der deutschen 68er-Bewegung die performative Regelverletzung zum Medium der Selbstaufklärung der Aktivisten und zum Schlüssel ihrer individuellen Veränderung. Aber auch die Wissenschaft theoretisierte nicht nur, sondern nutzte performative Praktien wie Krisenexperimente (Garfinkel), um grundlegende Organisationsprinzipien der menschlichen Interaktion aufzudecken. Auch das Nachspiele von Ritualen wurde in der performativen Ethnologie als Erkenntnisquelle benutzt.

Das erste Thema der Show war dann auch die Theatralität selbst und das vergemeinschaftende Potenzial von Ritualen. Showmaster-Darsteller und Moderator Jan Mech holte das Publikum auf die Bühne und ließ es wie Woof im Musical Hair „We are all one“ rufen. Diese Durchbrechung der vierten Wand der Guckkastenbühne war als ein Re-enactment der Vorgänge am Ende der Hair-Aufführungen in den späten 60ern und frühen 70er Jahren gedacht, wo die Zuschauer auf die Bühne kamen, um mitzutanzen.

Der Gegensatz von Zuschauer und Mitwirkendem, von Bühnenraum und Zuschauerraum, von realer Welt und Spiel wurde aber gleich wieder hergestellt, als die eingeladenen Gäste zu einer Ballade (sinnreich: Seeräuber, Brecht) auf die Bühne kamen. Rainer Langhans wurde zum Star gemacht, der erstmal ein Autogramm geben muss. Deshalb durfte er auch in der Mitte sitzen.

Dann ging es um die Nazivergangenheit und den Generationenkonflikt und um die Frage des Privateigentums, bei der sich Jessica Miriam Zinn im Namen der Piratenpartei wehrte, in einer Tradition mit den 68er gesehen zu werden. Implizit wurde dabei die Frage verhandelt, ob durch die 68er ein Wertewandel hin zu einer Auflösung des Eigentumsbegriffs eingesetzt hat, der die Piratenpartei erst ermöglichte; denn die Piratenpartei bezieht sich positiv auf die urheberrechts-/copyright-kritische Bewegung in Schweden, aus der heraus der BitTorrent-Tracker „The Pirate Bay“ und die schwedische „Piratpartiet“ entstanden sind.

Ob sich die Piratenpartei Deutschlands die 68er, speziell die Kommunebewegung, als Tradition aneignen will, ist letztlich eine politische Frage, denn die Aneignung von Traditionen sind Identitätsakte. Der Anspruch auf Transparenz und die Utopie einer tiefer gehenden Demokratie verbindet beide Bewegungen, wie ich an andere Stelle ausgeführt habe. Gleichzeitig würde sich die Piratenpartei aber wohl dem Verdacht ausgesetzt sehen, offen zu sein für Ideen wie die Abschaffung des Eigentums, die Aufgabe der Privatsphäre und einem Anspruch auf radikale Veränderung jedes Einzelnen und der gesellschaftlichen Verhältnisse. Dabei ist das Narrativ für die Verbindung von digitalem Aktivismus und 68er-Bewegung längst vorhanden: Der Chaos Computer Club wurde am 12. September 1981 in den Redaktionsräumen der taz gegründet — am Tisch der Kommune I.

Aber zurück zur Klau Mich Show: Theatral wurde es wieder, als der Körper in den Mittelpunkt der Diskussion gerückt wird. Rainer Langhans vertritt seine These von der Vergeistigung der Kommune. Leider kam ich nicht dazu zu sagen, dass ich die Kommune für sehr körperlich halte, nicht nur wegen ihres ostentativen Hedonismus sondern auch wegen der bewussten Inszenierung ihrer Körper als nicht-, ja antifaschistisch. Haben sich die Grenzen des Anstands seit den 60er Jahren nicht nur im Hinblick auf das Eigentum, sondern auch im Hinblick auf den Körper verschoben? Dieser Frage wollte der Showmaster näher kommen, inderm er eine Zuschauerin bat, sich so weit zu entblößen, wie es ihrer Meinung nach Scham und Anstand zuließen. Als Jessica Miriam Zinn den Moderator aufforderte, es der Zuschauerin gleich zu tun, entkleidete auch er sich. Der performative Effekt seiner partiellen Nacktheit war jedoch ein diskursiver Kontrollverlust, der erst nach Wiederanlegen der Hose überwunden wurde.

So lieferte die Show selbst einen Beleg für die (de)konstruktive Kraft von (Anti-)Ritualen, mithin dafür, dass das Durchbrechen von Ritualen das Potenzial hat, Ordnung ins Wanken zu bringen. Die Klau Mich Show changiert wunderbar zwischen Ironie und Ernst, zwischen Anstand und Zumutung, zwischen Gespräch und Performance, zwischen Anspruch und Unterhaltung. Sie ist aber nichts von alledem. Sie ist ein Muss für alle dOCUMENTA-Besucher, die realen wie die virtuellen.

Noch ein paar persönliche Anmerkungen: Den Studierenden der Dokkyo sei noch einmal gesagt, dass ich nicht der Moderator bin und dass das Musical „Hair“ nicht wegen mir ein Leitmotiv der Show war. Ich habe die Performance des Theater Chaosium am Anfang nicht verstanden, fand den Kalauer aber sehr lustig. Einmal habe ich in die Kamera gewinkt, um die Studierenden zu grüßen. Ich habe ziemlich viel auf dem Drehstuhl herumgewackelt. Und ja, ich weiß, das Taschentuch…


Vorher war ich an der TU Dresden, wo ich ab 1.10. eine Professur für Angewandte Linguistik antreten werden, zu einem Vortrag zum Thema „Autorenidentifizierung und Autorschaftsverschleierung. Maschinelle Methoden in der forensischen Linguistik und Möglichkeiten ihrer Überlistung“. Aus diesem Anlasse gibt es demnächst wieder mehr Posts zu technischen Fragen.


comments: Kommentare deaktiviert für DIE KLAU MICH SHOW – dOCUMENTA(13) tags: , , , , , ,

Kommunikationsformen und die Utopie von einer anderen Demokratie: Piraten, Grüne und 68er

Posted on 16th April 2012 in Off Topic, Politik

Wer nachhaltig für seine politischen Ziele mobilisieren will, der braucht Kommunikationsformen, die die Utopie von einer anderen Demokratie glaubhaft symbolisieren.


1968

Als am 15. September 1967 einige hundert junge Menschen versuchten, mit einem Go-in in die Sondersitzung des Abgeordnetenhauses Berlin im Schöneberger Rathaus einzudringen, gaben sie vor, dies nicht zur Durchsetzung vorher abgestimmter politischer Ziele zu tun. Sie skandierten vielmehr „Wir wollen diskutieren“.

„Diskutieren“ war das Fahnenwort der 68er-Bewegung. Diskutieren war gleichbedeutend mit dem Praktizieren von Demokratie. In einem Berliner Flugblatt mit dem Titel „Warum wir demonstrieren — Warum wir diskutieren“ formulierte eine Studentin: „eine demokratie funktioniert nicht durch verbote, sondern durch argumentation und gegenargumentation — auch, wenn diese anregungen von einer minderheit ausgehen.“ Das Politikverständnis, das in der Formel „Demokratie ist Diskussion“ sinnfälligen Ausdruck erhielt, ist in mehrfacher Hinsicht bemerkenswert: Demokratische Entscheidungen erhalten ihre Legitimität allein aus der Ratio des besseren Arguments, der sich eine ggf. irrende Mehrheit unterwerfen muss.



Ausschnitt aus einem diskussionskritischen Flugblatt der Kommune I



Das Go-in in die Sitzung des Abgeordnetenhauses Berlin zeigt zudem, dass die Parlamente in den Augen der 68er nicht der Ort waren, in denen sich das bessere Argument Geltung verschaffen konnte. Die außerparlamentarische und in weiten Teilen auch antiparlamentarische Bewegung setzte vielmehr auf nicht-repräsentative Formen diskursiver Meinungsbildung, etwa das Teach-in. Das Teach-in war eine Form der politischen Massendiskussion, die ohne Beschränkung der Teilnahme und des Rederechts auskommen wollte und in der nicht der Diskussionsleiter, sondern alle Teilnehmer demokratisch über Inhalte und Verfahrensfragen entscheiden sollten.

Diskutieren innerhalb der Bewegung repräsentierte einen hierarchiefreien, egalitären Umgang zwischen den Gesprächspartnern und versprach Erkenntnisgewinn. Diskussionen mit den politischen Gegnern wurden eingefordert, um deren mangelndes Demokrativerständnis zu entlarven. Natürlich waren im einleitenden Beispiel die Berliner Parlamentarier nicht bereit, mit den Protestierenden im Rahmen einer Abgeordnetenhaussitzung zu diskutieren, was die Aktivisten als Beleg ihrer undemokratischen Haltung und der in ihren Augen völlig ungenügendenden Partizipationsmöglichkeiten in der parlamentarischen Demokratie denunzieren konnten. Diskussion forderten die Aktivistinnen und Aktivisten überall dort ein, wo Autorität oder Tradition in ihren Augen größeres Gewicht hatten als das bessere Argument:

  • In Vorlesungen und Seminare, in denen Wissen ex cathedra verkündet und nicht diskursiv verhandelt wurde.
  • Bei Immatrikulationsfeiern, in denen die Ordinarien die Hochschule feierten, Studenten aber kein Rederecht hatten.
  • In Parlamentssitzungen, in denen über, aber nicht mit den Aktivisten debattiert wurde.
  • In Gottesdiensten, in denen zwar Frieden gepredigt wurde, die Gräuel des Vietnamkrieges aber unerwähnt blieben.
  • In Gerichtsverhandlungen, in denen von Angeklagten unter Androhung von Strafe die totale Unterordnung in die in Gerichten geltenden Verhaltensnormen verlangt wurden.

Selten wurde die Forderung freilich erfüllt und so entstanden kritische Ereignisse, die erheblich zur Mobilisierung und Radikalisierung der Bewegung beitrugen.

Diskutieren im Sinne einer argumentativen und kontroversen Aussprache wurde von den Aktivisten zu einer Praxis erhoben, deren Symbolwert mindestens so groß war wie ihre kommunikative Funktion. Allein der formale Vollzug der Aussprache erfüllte bereits einen Zweck. Diskutieren war damit (auch) ein Ritual, über das sich die Protestbewegung definierte, ein Ritual durch das sie sich von den Etablierten zu unterscheiden glaubte, ein Ritual, das mobilisierte und integrierte.


DIE GRÜNEN

Auch als DIE GRÜNEN 1983 erstmals in den Bundestag einzogen, sorgten sie nicht nur wegen ihrer politischen Inhalte für Aufsehen, sondern auch wegen der Formen ihrer politischen Kommunikation. Zur konstituierenden Sitzung des 10. Bundestages am 29. März 1983 zogen die Abgeordneten — einem Demonstrationszug gleich — vom Bonner Hofgarten ins Regierungsviertel und ließen sich dabei symbolisch von der Basis begleiten. In ihrem Selbstverständnis war die Partei nämlich lediglich ein Ast des mächtigen Baumes der neuen sozialen Bewegungen, der in die Parlamente hineinwuchern sollte. In der Präambel des Bundesprogramms von 1980 heißt es: „Wir halten es für notwendig, die Aktivitäten außerhalb des Parlaments durch die Arbeit in den Kommunal- und Landesparlamenten sowie im Bundestag zu ergänzen. […] Wir werden damit den Bürger- und Basisinitiativen eine weitere Möglichkeit zur Durchsetzung ihrer Anliegen und Ideen eröffnen.“

Die Grünen inszenierten sich als „Anti-Parteien-Partei“ (Petra Kelly) und waren ihrem Selbstverständnis nach „die Alternative zu den herkömmlichen Parteien“ (Präambel des Bundesprogramms von 1980). Der Antiparlamentarismus speiste sich aus der Kritik an einer politischen Klasse, die den Interessen von Wirtschaft und Kapital diente, an einem Repräsentationsprinzip, das die Abgeordneten nicht auf den Willen der Volkes verpflichtete, und an einer Professionalisierung der Politik, die die Durchsetzung neuer Ideen verhinderte. Um eine Korrumpierung der eigenen Abgeordneten durch das parlamentarische System zu verhindern, fassten die Grünen im Januar 1983 die sog. Sindelfinger Beschlüsse. Demnach sollten die Abgeordneten ihr Mandat nur zwei Jahre wahrnehmen und dann für ihre Nachfolger Platz machen (Rotationsprinzip), in ihrem Abstimmungsverhalten und in ihrer sonstigen parlamentarischen Tätigkeit an die Beschlüsse der Basis gebunden sein (imperatives Mandat) und nur so viel verdienen wie ein Facharbeiter (Diätenbegrenzung). Daneben beschlossen die Grünen auch eine Trennung von Parteiamt und Mandat, um eine Machtkonzentration auf wenige Personen zu verhindern.

Auch in kommuniktiver Hinsicht setzten die Grünen alles daran, sich als basisdemokratische Partei zu inszenieren. Sie benannten keine Spitzenkandidaten für Wahlen, druckten keine Köpfe auf Wahlplakate, und gaben der Partei auf Bundes- und Länderebene kollektive Führungen aus zunächst je drei Vorsitzenden, die jedoch den Titel „Sprecher“ führten, um zu betonen, dass diese eigentlich keine Macht besäßen, sondern nur die Beschlüsse der Basis nach außen kommunizierten.

Die Grünen verschrieben sich zudem dem Prinzip der Transparenz: Statt Delegiertenversammlungen sollten ausschließlich Mitgliederversammlungen abgehalten werden; die „Mitgliederoffenheit der Sitzungen und Gremien auf allen Ebenen“ ist im Bundesprogramm 1980 festgeschrieben. Zudem sollten die Versammlungen der Grünen nicht nur den Mitgliedern, sondern allen interessierten Menschen offen stehen. Auch die ersten Fraktionssitzungen der Grünen im Bundestag waren öffentlich. Neben zahlreichen Pressevertretern nahmen auch die Nachrücker, Fraktionsmitarbeiter und Vertreter der Basis an den Sitzungen teil, die in der Anfangszeit nicht selten 10 bis 15 Stunden dauerten.

Und sie bedienten sich selbstverständlich weiterhin aktionistischer Formen der Politik. Zur konstitutierenden Sitzung des 10. Bundestages zog einer „eine spindeldürre, nadellose Fichte hinter sich her. Zwei andere rollten eine überdimensionale Weltkugel. Viele trugen Blumen.“ erinnert sich Ludger Vollmer in seinem Buch „DIE GRÜNEN. Von der Protestbewegung zur etablierten Partei — Eine Bilanz“ (2009) an die Prozession ins Regierungsviertel. Am 15. Juli 1983 setzten sich Petra Kelly und Gert Bastian zusammen mit Wolf Biermann in einen Käfig und ketteten sich an den Zaun des Bundeskanzleramts, um gegen die Auslieferung eines Kurden an die Türkei zu demonstrieren.

Auch die Grünen benutzten also neue Kommunikationsformen und kommunikative Rituale, um ihre Identität als basisdemokratische Anti-Parteien-Partei und als parlamentarischer Ausleger der neuen sozialen Bewegungen zu symbolisieren. Die öffentlichkeitswirksamen Inszenierungen und Provokationen bescherten ihnen Aufmerksamkeit und Glaubwürdigkeit.

Den neuen Kommunikationsformen der 68er und der Grünen wohnte ein utopisches Moment inne: sie schienen das Versprechen zu geben, dass eine qualitativ andere Demokratie möglich ist. Eine Demokratie, die dem besseren Argument verpflichtet ist, die allen Menschen Zugang zu politischen Entscheidungsprozessen ermöglicht und in der die Entscheidungsfindung sich transparent vollzieht.


Und die Piraten

Wirft man einen Blick auf die Anfänge der Grünen, dann erscheint die Piratenpartei nur noch wenig originell. Vorsitzende, die sich als Sprecher verstehen und sich an die Voten der Basis gebunden fühlen, die Verpflichtung der Mandatsträger auf den Willen der Basis, öffentliche Fraktionssitzungen, Transparenzversprechen und öffentlich ausgetragene Streitigkeiten — das alles gab es schon bei den Grünen und sogar radikaler als bei den Piraten heute.

Dennoch verkörpert auch die Piratenpartei die Utopie einer anderen Demokratie. Und zwar weniger durch ihr politisches Programm als vielmehr durch die Formen der innerparteilichen Kommunikation und Entscheidungsfindung. Mit neuen technischen Mitteln wird der Versuch unternommen „Entscheidungen nicht im Rahmen von Vertreterversammlungen zu treffen, sondern einen basisdemokratischen Ansatz auch bei steigenden Mitgliederzahlen umsetzen zu können“, wie es im Piratenwiki zum Schlagwort Liquid Democray heißt. Dabei wird das Prinzip der Basisdemokratie um die Möglichkeit der Delegation der eigenen Stimme für bestimmte Themen oder Politikfelder ergänzt. Auch die Piratenpartei versucht die Utopie einer direkten Demokratie (Möglichkeit der Beteiligung aller Mitglieder an der Entscheidungsfindung) zu verwirklichen und setzt darauf, dass sich in Systemen wie LiquidFeedback Kompetenz (delegated voting) und der besser argumentierende Antrag Geltung verschaffen werden. Die innerparteiliche Kommunikation soll am Ende ein Modell für die Demokratie als Ganze sein.

68er, Grüne und Piraten haben in ihrer jeweiligen Zeit Kommunikationsformen besetzt und zu ihrem Markenzeichen gemacht, die Ausdruck eines alternativen Demokratieverständnisses waren, das gemessen an der Realität der parlamentarischen Demokratie durchaus als utopisch gelten kann. Es ist dieser durch die alternativen Kommunikationsformen symbolisierte Anspruch, der den neuen Bewegungen und Parteien ihr Charisma verlieh und verleiht und den neugegründeten Parteien eine so schnelle Mobilisierung von Wählern ermöglichte.

Freilich: Debatten mit den politischen Gegnern waren in den späten 60er und frühen 70er Jahren selten herrschaftsfreie rationale Diskussionen, sondern hatten häufig Tribunalcharakter. Und die Grünen haben Rotation, imperatives Mandat und öffentliche Fraktionssitzungen schnell wieder abgeschafft. Auch LiquidFeedback ist bei den Piraten längst keine allgegenwärtige Plattform zur politischen Meinungsbildung. Und dennoch: Der Anspruch ist symbolisch formuliert, das Versprechen, alles besser machen zu wollen, ist gegeben. Ob es gehalten wird, das wird die Zukunft zeigen. Das Symbol aber wirkt schon in der Gegenwart.


Interview zum Thema „Protest, Medien, Gewalt und Staat“

Posted on 21st März 2012 in Politik

Vor einiger Zeit habe ich Manuela Frey vom Magazin prisma, das von Studierenden der Universität St. Gallen (HSG) gemacht wird, ein Interview zum Thema „Protest, Medien, Gewalt und Staat“ gegeben. Den Text gebe ich hier wieder. Im Kontext kann man das Interview hier lesen. Das ganze Heft kann man auch als PDF herunterladen.


Herr Scharloth, was ist Protest?

Öffentliche Äusserung von Dissens.

Haben sich Protestformen seit 1945 stark verändert? Oder wird das soziologische Phänomen des Protests im Grunde immer ähnlich bleiben?

Ich denke nicht, dass wir von starken Veränderungen sprechen können. Eher von einer Ausdifferenzierung und Professionalisierung. Zudem hat es das Internet, das alle Teilnehmer zu potenziellen Sendern macht, leichter gemacht Protest zu organisieren und zu artikulieren. Ob der Protest ähnlich bleiben wird, hängt nicht vom Protest alleine ab. Protest ist immer bezogen auf die politischen und sozialen Verhältnisse und auf die Strukturen der Öffentlichkeit. Wenn sich hier etwas fundamental ändert, dann ändert sich auch der Protest.

Medien (Pressefreiheit) und Proteste (Versammlungs- und Meinungsfreiheit) sind oft genannte Grundpfeiler einer Demokratie. Wie hängen diese zwei Pfeiler zusammen?

Protest braucht Medien, um für ein Thema möglichst viel Aufmerksamkeit zu erzeugen. Daher sind Protestbewegungen darum bemüht, Ereignisse zu inszenieren, die in die Medienlogik passen und einen Nachrichtenwert haben. Solche Ereignisinszenierungen im Medienformat sind ein Zeichen für die Professionalisierung des Protests. Andererseits transformieren die Medien die Botschaften, um sie für ihr spezifisches Publikum interessant und konsumierbar zu machen. Daher gehört es zur Medienpolitik von Protestbewegungen auch, dass sie sich eigene Medien schaffen, seien es Live-Streams von Protestereignissen, Flugblätter oder Webseiten. Interessant erscheint mir vor diesem Hintergrund die Frage der begrenzten Regelverletzung und noch mehr der Gewalt. Medien berichten nämlich bevorzugt dann von Protesten, wenn es in ihrem Rahmen zu Auseinandersetzungen zwischen Demonstrierenden und Polizei oder zu nennenswerten Sachbeschädigungen gekommen ist. Der Wunsch der Medien (und ihrer Konsumentinnen und Konsumenten) nach Skandalisierbarem und das Aktionsrepertoire von Protestbewegungen beeinflussen sich hier gegenseitig. Ich kenne Aktivisten, die deshalb auch stillschweigend Aktionen des Schwarzen Blocks billigen, auch wenn sie sich offiziell von Gewalt distanzieren.

Welche Rolle hat also Gewalt für Protestbewegungen?

Gewalt schafft natürlich auch kritische Ereignisse, durch die Bewegungen eine Identität bekommen oder sich radikalisieren können. Denken Sie an die so genannten Globuskrawalle, die die Situation in Zürich 1968 komplett veränderten, an den Tod von Benno Ohnesorg 1967 in Berlin, der ein Wendepunkt für die 68er-Bewegung in Deutschland war, oder an den Tod von Carlo Giuliani während des G8-Gipfels 2001 in Genua.

Interessant ist aber auch eine andere Frage: Welche Rolle spielt die Gewalt in sozialen Bewegungen für den Staat?

Zu den nichtintendierten Effekten von Protestbewegungen gehört, dass sie dazu geführt haben, dass Polizei und Nachrichtendienste aufgerüstet haben. Denken Sie an die Anschaffung von Wasserwerfern in Folge der Proteste der 68er oder die Ausstattung der Polizei mit Gummigeschossen im Zuge der Jugendunruhen in den frühen 1980ern. Gewaltsamer Protest kann daher von staatlicher Stelle durchaus gewünscht sein, um in einer Güterabwägung Einschränkungen von Grundrechten zu rechtfertigen. Daher gibt es auch immer wieder Gerüchte über Agents Provocateurs, die sich wie im Fall der 68er-Bewegung in der BRD teilweise als wahr erwiesen haben.

Kann man im Zusammenhang mit dem Internet und Social/New Media von einer „Verbequemlichung“ des Protests sprechen?

Es lässt sich ja heutzutage von der Couch aus eine Onlinepetition ausfüllen oder seine Meinung auf Facebook oder Twitter massenwirksam kundtun. Die Hürde, Protest zu artikulieren, ist dadurch sicher kleiner geworden. Aber Ihre Frage klingt so, als müsse es mit grosser Anstrengung verbunden sein, Kritik öffentlich zu äussern, damit sie glaubhaft ist. Der Punkt ist hier: Es mag leichter geworden sein, Dissens zu artikulieren. Aber weil so viele die Möglichkeit haben, sich zu allem Möglichen zu äussern, ist es auch viel schwieriger, Aufmerksamkeit dafür zu erzeugen. Eine einzelne Äusserung auf Twitter oder Facebook interessiert doch nur eine sehr kleine Anzahl von Menschen und wird im Strom der anderen Meldungen davongespült. Damit Aufmerksamkeit im Netz entstehen kann, müssen viele Menschen etwas Ähnliches tun. Und das zu organisieren und zu orchestrieren, ist wieder eine Menge Arbeit und Engagement von vielen Einzelnen.

Glauben Sie, dass der Arabische Frühling auch ohne die Hilfe von Twitter, Facebook und Co. in der Form stattgefunden hätte?

Zum Arabischen Frühling: Ehrlich gesagt — keine Ahnung. Da gibt es solche und solche Meinungen. Interessant finde ich eher, dass das Internet und die sozialen Medien in den letzten Jahren selbst zum Politikum geworden sind. Das ist im Grunde nicht neu: Auch früher haben sich Proteste gegen Medien gerichtet, denken Sie an die Anti-Springer-Kampagne der deutschen 68er-Bewegung. Aber die Situation ist heute natürlich eine andere: Facebook und Twitter stellen selbst keine Inhalte zur Verfügung und haben eher das Image, eine Plattform zu sein, auf der jeder seine Meinung frei äussern kann. Einerseits wegen der Erfahrungen im Arabischen Frühling (Internetabschaltungen, Sperrung sozialer Netzwerke), aber auch wegen ihres Datenhungers und der Gerüchte über Backdoors für amerikanische Sicherheitsbehörden hat die Reflexion darüber begonnen, was es bedeutet, dass kritische Öffentlichkeit über die Plattformen und Server von weltweit sehr wenigen privaten Unternehmen hergestellt wird. Die Strukturen des Internets sind daher selbst zum Thema einer Protestbewegung geworden. In ihrer Folge wird sich meiner Meinung nach die Bewegung hin zu dezentralen sozialen Netzwerken, die sich Abschaltung, Zensur und staatlicher Überwachung weitgehend entziehen, verstärken.

Wie wird ein Protest in 50 Jahren aussehen?

Warten wir’s ab!


comments: Kommentare deaktiviert für Interview zum Thema „Protest, Medien, Gewalt und Staat“ tags: , , , ,

Themenerkennung durch Kompositaanalyse

Posted on 17th März 2012 in ideology mapping, Linguistische Kategorien

Liebe Freunde der Sicherheit,

heute wollen wir uns eine sprachliche Kategorie ansehen, die zusammen mit anderen einen Beitrag zur Ideologieerkennung leisten kann: Komposita. Die deutsche Sprache ermöglicht es ihren Sprecherinnen und Sprechern ja bekanntermaßen, Wörter aus mehreren Bestandteilen (sog. Morphemen) zusammenzusetzen. Aus dem Nomen „König“ und dem Suffix „lich“ wird zum Beispiel „königlich“. Ein Wort wie „Königstiger“ besteht aus dem lexikalischen Morphem /könig/, einem sog. Fugenelement /s/ und dem lexikalischen Morphem /tiger/. Im ersten Fall, wo ein neues Wort mit Hilfe eines Affix gebildet wird, spricht man von Derviation. Wird ein Wort aus zwei oder mehr lexikalischen Morphemen (also Morphemen, die auch alleine stehen können) zusammengesetzt, dann sprechen Linguistinnen und Linguisten von Komposition.

Die Komposition ist im Deutschen ein sehr wichtiges Wortbildungsmittel, wichtiger als in vielen anderen Sprachen. So können mit Hilfe der Komposition sogar ad hoc Sachverhalte mit neuen Wörtern bezeichnet werden, wenn sich die Bedeutung aus den einzelnen Gliedern erschließen lässt. Denken wir an das schöne Kompositum „Selbstverteidigungsminister“.

Interessant wird es aber wie immer erst dann, wenn man sich Komposita in größeren Mengen anschaut. Denn wenn über ein Thema intensiv gesprochen und geschrieben wird, dann steigt nicht nur die Frequenz des themenspezifischen Wortschatzes, sondern es steigt auch die Anzahl der verwendeten Komposita, die mit Hilfe dieses Wortschatzes gebildet werden können. Augenscheinlich wird dies am Beispiel des lexikalischen Morphems /terror/, dessen Distribution in der ZEIT (print) ich visualisiert habe.


Komposita mit dem lexikalischen Morphem /terror/ in der ZEIT (print) 1995-2011


Man sieht, dass mit dem Jahr 2001 die Frequenz des Lemmas „Terror“ zwar ansteigt, die Verwendung von Komposita (token), die /terror/ enthalten, jedoch noch viel stärker zunimmt. Gleichzeit steigt auch die Anzahl der Komposita (types), die überhaupt verwendet werden. Der themenspezifische Wortschatz differenziert sich mittels Komposition also aus und wird zudem häufiger verwendet. Komposita scheinen also ein guter Themenindikator zu sein, vielleicht sogar ein besserer als Schlagworte.

Wenn man das, was hier am Beispiel von /terror/ illustriert wurde, für den gesamten Wortschatz in einem Korpus macht, erhält man natürlich ein sehr viel aussagekräftigeres Bild. Ich will dies anhand einer Analyse eines rechtsextremen Nachrichtenportals anschaulich machen. Es handelt es sich dabei um den inzwischen sowohl online als auch offline eingestellten sog. „Rundbrief an Freunde und Förderer der volkssozialistischen Bewegung“ mit dem Titel „Der Fahnenträger“. Von diesem Elaborat enthält das Untersuchungskorpus 222 Texte mit zusammen 566.905 laufenden Wortformen.

Um die Aussagekraft der Ergebnisse zu erhöhen, wurde berechnet, welche lexikalischen Morpheme im „Fahnenträger“ signifikant häufiger zur Bildung von Komposita benutzt wurden als in der gedruckten ZEIT der letzten 17 Jahre. Das Ergebnis habe mit den 90 signifikantesten lexikalischen Morphemen habe ich in einer Wortwolke visualisiert:


Der Fahnenträger

DemokratwirtschaftlichirischrevolutionierenMilitärneoliberalpolitischEigentumGewaltLohnarbeitenantiUnionistKundgebungAutonomieDKPimperialBDMimperialistischIreRasseAgrarzentralistischmarxistischPSIGewerkschaftMarxistKAPDKlasseFaschismusRegierungWiderKampfPolitikstaatlichkapitalHerrschaftregierenMachtImperialImperialismusISAFFAUArditiEuzkadiScheringerVWNsozialRUCBDOADGBKapitalSchlageterArbeitOrganisationNiekischBaskeFaschistFrontLinksfaschistischreaktionärNRWirtschaftGSRNNationalerevolutionärBahamasSFMASNKFDFéinBRDParteikapitalistischFiumeAntifaflämischStaatSozialistKPDETAKapitalistnationalNSVolkFlameIRAsozialistischStrasser

Das Ergebnis ist auf den ersten Blick verwirrend: Es finden sich auffällig viele Komposita mit den Akronymen radikaler, extremistischer und terroristischer Organisationen der Linken wie der Rechten, lexikalische Morpheme aus dem Kontext der (marxisitschen) Kapitalismuskritik („neoliberal“, „Lohn“, „Eigentum“, „Klasse“, „Imperialismus“, „reaktionär“, „kapital“ etc.), zugleich aber auch lexikalische Morpheme, die auf nationalistisch-völkische Ideologie verweisen („Volk“, „national“, „Flame“, „flämisch“, „faschistisch“, „Strasser“). Dies entsprach freilich der politischen Selbstverortung der Macher. Sie sahen sich „jenseits des ‚rechten Mainstreams'“ und orientierten sich, laut Endstation Rechts „an Bestandteilen des Rätekommunismus, des Syndikalismus und der ‚Dritten Welle‘ des Weimarer Nationalbolschewismus.“ Dies erklärt auch die häufigen Komposita mit dem Namen Gregor Strassers.

Die Kompositaanalyse scheint also ein durchaus adäquates Abbild des Themenspektrums des „Fahnenträgers“ zu liefern. Dass die Welt auch eine schönere Seite hat, zeigt der komplementäre Blick auf die für die ZEIT typischen lexikalischen Morpheme, aus denen die meisten Komposita bestehen.


DIE ZEIT

MotorEuroberatenSommerBühnePartyFahrtsparenKundeInselTischHerstellerhohÖkoMaschineFarbeEisliebPlatzWerbungSzeneMarkesuperWaldMannManagerTypGartenModellGerätFanModeNachtGeschäftPlatteBaumNetzSchiffRaumSportTierKlangFußballFirmaTraumRomanFernsehStückZimmerSchuleLichtInternetKünstlerRadBandDorfKarteForscherTechnikWeinTestHotelStraßeTourFußProjektTonfahrenHolzLiebeBahnAutoWerkReisReiseTheaterFamilieKunstFilmMusikHausBuchfliegenBildKindforschenStadtFlugBallSpiel


comments: Kommentare deaktiviert für Themenerkennung durch Kompositaanalyse tags: , , , , ,

Post-Privacy im 19. Jahrhundert: Das Kind im Glashaus

Posted on 23rd Februar 2012 in Überwachung und Sicherheit

Liebe Freunde der Sicherheit,

schon im 19. Jahrhundert wusste man um die heilsame Wirkung des Entzugs der Privatheit. Der Frankfurter Verleger und Kinderbuchautor Heinrich Oswalt liefert uns hierfür mit seiner moralisierenden Verserzählung „Das Kind im Glashaus“ von 1877 einen beeindruckenden Beleg. Der Text ist der Sammlung „Unter’m Märchenbaum: Allerlei Märchen, Geschichten und Fabeln in Reimen und Bildern“ entnommen und ist mit Bildern von Eugen Johann Georg Klimsch illustriert.



Das Kind im Glashaus

In Frankfurt lebt ein Glasermeister,
Herr Lebrecht Scheibenmann, so heißt er;
Der hat ein kleines Töchterlein,
Das wollte nie gewaschen sein.
Und kam mit Schwamm und Seif sein Gretchen,
Da lief davon das böse Mädchen;
Es warf sogar den Waschtisch um –
Das Wasser floß im Haus herum.





Da fing Herr Lebrecht Scheibenmann
Ein seltsam Haus zu bauen an,
Aus lauter Glas ein Haus, das, ach!
Durchsichtig war bis unters Dach.
Und in dies Glashaus setzte man
Das böse Töchterlein sodann.
Da blieben, um es anzusehn,
Die Leute auf der Straße stehn.
Von allen Seiten kamen sie,
Wenn’s jetzt beim Waschen wieder schrie;
Sie sah’n ins Glashaus all hinein
Und lachten: „Ei! wer wird so schrei’n!“
Am Nähtisch saß Frau Scheibenmann
Und warnte: „Jeder sieht dich an!“
Da schämte sich das Kind und lief
Im ganzen Haus herum und rief:
„Wo soll ich mich denn nur verstecken?
Man sieht mich ja in allen Ecken!
Das Dach, der Keller, jedes Zimmer
Ist ja von Glas! man sieht mich immer!“





Die Mutter sprach: „Mein liebes Kind!
Ein Mittel gibt’s, das hilft geschwind:
Wenn dich die Leute artig sehn
Dann werden sie vorübergehn;
Wirst du beim Waschen nicht mehr schrei’n,
Dann sehn sie auch nicht mehr herein:
Wirst du dich brav und gut benehmen,
Dann brauchst du dich nicht mehr zu schämen.
Ein artig Kind nur Freude macht;
Unart’ge werden ausgelacht!“ –
Das merkte sich das Töchterlein;
Es nahm sich vor, geschickt zu sein.
Und weil’s beim Waschen nicht mehr schrie,
Da lachten auch die Leute nie;
Denn jeder, der ins Haus jetzt blickt,
Der sieht ein Kind, das ganz geschickt.





Und habt Ihr selbst ein Kind, Ihr Leut‘,
Das bei dem Waschen immer schreit,
Sagts nur Herrn Lebrecht Scheibenmann,
Der schafft Euch gleich ein Glashaus an.

Und die Moral der Geschichte für unsere heutige Zeit? Alle Datenschutzkritiker dürfen sich bestätigt sehen. Und auch die letzten Verteidiger der Privatsphäre sollten endlich zugeben, dass Post-Privacy mehr ist als eine Zustandsbeschreibung, sondern ein Programm zur moralischen Besserung der Welt.


Das ökonomische 9/11: Fnord in der ZEIT im Verhältnis zum DAX

Posted on 16th Februar 2012 in Off Topic

Liebe Freunde der Sicherheit,

vor einiger Zeit habe ich eine kleine Statistik vorgelegt, die zeigte, dass in SPIEGEL Online der Angstindex im Ressort Politik seit dem 11. September 2001 auf einem höheren Niveau verharrt, als vorher. Der Angstindex ist eine simple Größe: er repräsentiert die relative Frequenz von mehr als 800 potenziell Angst verbreitenden Wörtern und n-Grammen. Ein Angstindex von 0.002 bedeutet, dass jedes 500. Wort das Potenzial hat, auf Sachverhalte zu verweisen, die angstbesetzt sind. Interessant war, dass mit der Finanzkrise der Angstindex im Ressort Wirtschaft erstmals über den im Ressort Politik kletterte.

Natürlich habe ich mich – so wie einige Kommentatoren – gefragt, ob die beobachteten Entwicklungen schon früher bei besonderen Ereignissen in ähnlicher Form auftraten oder ob sie als historisch einmalig und damit als Zeitphänomen gedeutet werden müssten. Da verlässliche Daten für SPON nur für die letzten 12 Jahre zu haben sind, habe ich mir das ZEIT-Archiv vorgenommen und den Fnord-Index seit den 1960er Jahren untersucht. Die folgende Grafik zeigt einen Vergleich des Angstindexes in den Ressorts Politik und Wirtschaft:



Angstindex im ZEIT-Archiv: Vergleich der Ressorts Politik und Wirtschaft



Auf den ersten Blick sieht man, dass auch in der gedruckten ZEIT der Angstindex im Ressort Wirtschaft seit Ausbruch der Finanzkrise über den im Ressort Politik geklettert ist. Anders als bei SPON geht der Angstindex im Politik-Ressort der ZEIT nach dem Maximum nach 9/11 wieder deutlich zurück und steigt erst wieder mit dem Beginn der Finanzkrise.

Betrachtet man die Entwicklung des Angstindex im Ressort Wirtschaft genauer, dann zeigen sich die monströsen Ausmaße, die die ZEIT der Finanzkrise zuschreibt.



Angstindex im ZEIT-Archiv, Ressort Wirtschaft



Niemals vorher kletterte der Angstindex auf ein so hohes Niveau und verharrte dort so lange: Die Ölkrisen, das Ende des Systems von Bretton Woods, das Platzen der Dotcom-Blase und sogar die Verunsicherungen nach dem 11. September 2001 erscheinen marginal angesichts der sich inzwischen über mehrere Jahre hinziehenden Finanz- und Wirtschaftskrise.

Legt man den (zurückberechneten) DAX über die Kurve des Angstindex, dann zeigt sich seit den späten 1990er Jahren ein Zusammenhang zwischen den beiden Kurven.



Angstindex im ZEIT-Archiv, Ressort Wirtschaft, und zurückberechneter DAX



Interessanterweise sieht es so aus, dass die Aktienkurse schon bei einem gleichbleibenden Angstindex steigen. Nur in Zeiten, in denen der Angstindex steigt, fallen die Aktienkurse. So ist der DAX trotz hohem Angstindex nach wie vor auf relativ hohem Niveau.

DISCLAIMER: Der monatliche Angstindex ist ein sehr grobes Messinstrument und ich behaupte nicht, dass er prognostische Qualitäten hat.


Entscheidungsbaumverfahren: Vornamen von Neonazis in Abhängigkeit von Wohnort und Alter

Posted on 25th Januar 2012 in Maschinelles Lernen

Liebe Freunde der Sicherheit,

wenn man Urheber von Bekennerschreiben identifizieren oder feststellen will, ob die Beiträge in einem Internetforum rechtsextreme Tendenzen haben, dann handelt es sich aus mathematisch-informatischer Perspektive um Klassifizierungsprobleme. Man nimmt im ersten Fall eine Menge von Texten, von denen man weiß, wer die Autoren sind. Diese Dokumente werden dann als numerische Vektoren dargestellt, die die Ausprägung möglicher relevanter Merkmale dieser Texte abbilden. Dann wendet man Methoden des maschinellen Lernens an, um einen Klassifikator zu finden, der die Texte, die zu unterschiedlichen Klassen gehören, voneinander unterscheidet. Dieser Klassifikator liefert uns dann einen Hinweise darauf, welcher Klasse sich der Urheber eines Bekennerschreibens mit einer gewissen Wahrscheinlichkeit zuordnen lässt.

Natürlich sind die Ergebnisse des Lernverfahrens nur so gut, wie die Entscheidung, welche Merkmale der Texte für die Klassifizierung relevant sein können. Einige der am häufigsten für die Autorenidentifizierung benutzten linguistischen Feature habe ich in einem früheren Post zusammengestellt. Mir geht es aber hier um die Grundidee des maschinellen Lernens: Man benutzt eine bereits klassifizierte Datenmenge, um aus ihr jene Merkmale zu extrahieren, die für die Klassifizierung unbekannter Daten relevant sind. Eine Möglichkeit, aus Daten Regeln für die Klassifizierung abzuleiten, ist das Entscheidungsbaumverfahren.

Entscheidungsbäume

Beim Entscheidungsbaumverfahren wird eine Datensatz Schritt für Schritt in Unterklassen geteilt. Diese Teilungen der Gesamtmenge in immer kleinere Teilmengen erfolgt anhand eines Sets von Merkmalen, von denen wir vermuten, dass sie für die Einteilung relevant sind.

Nun wollen wir den Datensatz in zwei Unterklassen teilen, die in sich möglichst homogen sind und sich daher auch möglichst stark von einander unterscheiden. Meist wird hier das Kriterium des Informationsgehaltes (Entropie) angewendet. Die Trennkriterien sind so zu wählen, dass die entstehenden Unterklassen im Hinblick auf eine resultierende Klassenverteilung möglichst homogen sind. Dieses Verfahren wendet man nun auch auf jede der neu berechneten Unterklassen an. Ist der Informationsgewinn durch eine weitere Teilung einer Unterklasse sehr gering, dann beendet man das Aufsplitten des Datensatzes an dieser Stelle.

Nach und nach wächst so ein „Baum“, die Bezeichnung eines gerichteten Graphen mit einem Wurzelknoten. Knoten markieren den Vergleich hinsichtlich eines Attributs, Kanten repräsentieren die verschiedenen Ausprägungen des Attributs, Blätter bezeichnen die Klasse. Pfade zu den Blattknoten stellen „Regeln“ dar, die auf künftige Klassifizerungsaufgaben angewendet werden können.

Vornamen von Neonazis in Abhängigkeit von Wohnort und Alter

Nehmen wir ein unverfängliches Beispiel: Wir wollen wissen, welche Namen Neonazis in Abhängigkeit von Alter und Region typischerweise haben. Hierfür nehmen wir einen Datensatz, der auf der Nazileaks-Plattform publiziert wurde und Informationen zu Wohnort und Geburtsdatum enthält. Damit das Ergebnis einigermaßen übersichtlich bleibt, operationalisieren wir die Variable Region über den Postleitzahlenbereich. Um genau zu sein: wir definieren die erste Ziffer der Postleitzahl als relevantes Attribut für die Klassifizierung. Als zweites relevantes Attribut bestimmen wir das Alter.

decision tree: nazivornamen ~ alter + plz_raum (minsplit 20, maxdepth 7)
Entscheidungsbaum: Vornamen von Neonazis
in Abhängigkeit von Alter und PLZ-Raum
(CART, minsplit = 20, maxdepth = 7)

Der berechnete Entscheidungsbaum zeigt, dass zunächst die Variable Alter mit dem Merkmal „jünger als 36“ vs. „36 Jahre und älter“ den Datensatz am besten in zwei Klassen trennt. Die beiden berechneten Subklassen werden beide wiederum durch das Attribut Alter in zwei Subklassen geteilt, ehe das Attribut PLZ-Bereich zu Spaltungen führt. Eine sich aus dem Entscheidungsbaum ableitbare Regel wäre: Neonazis, die über 44 Jahre alt sind und in den PLZ-Bereich 2, 3, 5 oder 7 wohnen, heißen Erik. Allerdings ist die Fehlerquote in den berechneten Klassen so hoch, dass eigentlich keine belastbaren Aussagen möglich sind. Wahrscheinlich haben wir nicht die richtigen Variablen in das Modell eingefügt.

Zwar ist der Baum in dieser Form gerade noch lesbar, aber dennoch überkomplex. Es gibt viele Endknoten, die nur wenige Objekte enthalten. Um die Ergebnisse besser generalisieren zu können, werden die Bäume „beschnitten“. Dieses Verfahren nennt man „Pruning“. Für den obigen Baum wurde schon ein Pre-Pruning vorgenommen: Die Anzahl der Verzweigungen wurde auf 7 begrenzt. Weil das immer noch recht viel ist, kann man auch ein Post-Pruning durchführen. Dabei fallen Knoten wegen oder werden durch ein Blatt ersetzt, die für die Relevanz für die Klassifizierung keine (oder nur geringe) Relevanz besitzen. Der beschnittene Baum hat dann z.B. diese Form:

decision tree: namen ~ alter + plz_raum (minsplit 20, maxdepth 7)
Beschnittener Entscheidungsbaum

Es gibt unterschiedliche Algorithmen zur Berechnung von Entscheidungsbäumen. Hier wurde mit dem CART-Verfahren gerechnet, bei dem der Datensatz bei einem Knoten jeweils binär gesplittet wird. Mein Kollege Noah Bubenhofer, von dem ich das Namensbeispiel übernommen habe, rechnet mit dem C4.5-Algorithmus.

Was kann man nun mit so einem Baum anfangen? Mit diesem speziellen Baum nicht viel. Die Fehlerquote ist zu hoch. Wäre sie niedriger, könnte man die Regeln wie folgt benutzen: Wenn wir den Vornamen einer Person kennen und wissen, dass diese Person ein Neonazi ist, dann könnten wir mit einer gewissen Wahrscheinlichkeit auf Alter und PLZ-Bereich des Wohnortes schließen.



Postleitzahlbereiche in der BRD (Quelle: Wikipedia, Stefan Kühn, CC0 1.0)



Natürlich könnten wir nun nicht einfach behaupten, dass Menschen, die André heißen, älter als 31 Jahre alt sind und aus dem PLZ-Bereich 0 kommen, mit einer bestimmten Wahrscheinlichkeit Neonazis sind. Um solche Aussagen zu ermöglichen hätten wir einen Datensatz gebraucht, der auch die Daten von nicht-Neonazis enthielte. Es könnte ja schließlich auch sein, dass Noenazis genause heißen wie der Rest der Bevölkerung und der obige Baum nur die regionale und altersspezifische Verteilung in Deutschland abbildet. Macht euch also keine Sorgen, wenn ihr Erik heißt und jünger als 22 Jahre alt seid: Wir wissen nicht, welche Gesinnung ihr habt. Noch nicht…

comments: Kommentare deaktiviert für Entscheidungsbaumverfahren: Vornamen von Neonazis in Abhängigkeit von Wohnort und Alter tags: , , ,