Blog

Automatisierte Kommunikation im Datensatz

In den Medien ist im Vorfeld vergangener Wahlen immer wieder die Frage aufgekommen, inwiefern die Kommunikation in den sozialen Medien überhaupt noch von Menschen ausgeht. Stattdessen wird spekuliert, dass ein beträchtlicher Teil der Tweets in automatisierter Form zustande kommt.

Unter Automatisierung versteht man zunächst den Anteil der Twitter-Nachrichten eines Accounts, welcher mit Hilfe verschiedener Dienste veröffentlicht wurde, ohne dass der Account-Besitzer den Beitrag manuell auf Twitter postet. Im politischen Kontext wurde dieses Thema im Vorfeld der Bundestagswahl unter dem Gesichtspunkt sog. Social Bots diskutiert.

Social Bots

Mit diesem Begriff werden Social Media-Accounts (häufig auf Twitter) beschrieben, welche menschliches Verhalten imitieren und von menschlichen Nutzern auf den ersten Blick nicht als künstliche Accounts zu identifizieren sind. Durch die Automatisierung solcher Accounts stellen sie zudem eine effiziente Möglichkeit dar, Nachrichten massenhaft zu veröffentlichen und so die Sichtbarkeit bestimmter Inhalte zu erhöhen. Wenn eine entsprechend große Anzahl solcher Postings nicht als automatisiert wahrgenommen wird, besteht zudem das Potential, dass menschliche Nutzer die so verbreiteten Ansichten als geläufiger wahrnehmen als sie eigentlich sind und so Einfluss auf das öffentliche Meinungsbild genommen wird.

Der Einsatz solcher Social Bots konnte etwa 2016 für die Kommunikation bzgl. des Brexit oder der US-Präsidentschaftswahlen gezeigt werden. Aufgrund bevorstehender Wahlen in Deutschland entstand auch hier eine Diskussion zum Einsatz solcher Accounts im Wahlkampf, insb. vor dem Hintergrund von Aussagen der AfD, solche Accounts ggf. einzusetzen.

Kategorisierung von Twitter-Kommunikation

Die Identifikation solcher Accounts ist nicht trivial, da hierfür diverse Metriken herangezogen werden können und es keinen Goldstandard gibt, welcher unter allen Bedingungen zuverlässige Ergebnisse liefert. Laut Hegelich und Janetzko (2016) lässt sich der Automatisierungsgrad von Accounts unter anderem am sogenannten „Source“-Attribut eines Tweets erkennen. Hierbei handelt es sich um die Information, mit welcher Anwendung ein Tweet verfasst wurde. Diese Information wird von Twitter gespeichert und ist öffentlich zugänglich. Wir haben daher die von uns beobachteten Tweets nach dem „Source“-Attribut geprüft und die auftretenden Fälle in die Kategorien „offizielle Clients“, „alternative Clients“, „Andere“ und „Automatisiert“ sortiert.

Offizielle Twitter-Clients sind die offiziellen Twitter-Apps für verschiedene Plattformen wie Android, iOS, macOS oder Windows. Es ist zwar möglich, automatisiert Tweets über diese offiziellen Clients abzuschicken, aber dies ist ungleich komplizierter als über einen eigenen API-Zugang („Andere“) oder eine Automatisierungs-App („Automatisiert“).

Alternative Twitter-Clients sind Twitter-Clients von Drittanbietern wie etwa Tweetbot oder Twidere. Auch hier ist es zwar möglich, dass automatisiert Tweets verschickt werden, doch dies ist hierfür nicht die einfachste Option.

Automatisiert: Hierzu zählen Anwendungen, die damit werben, dass sie die Automatisierung von Twitterkommunikation vereinfachen. Allerdings: Solche Anbieter, etwa IFTTT (If This Then That) werden zwar von Bot-Entwicklern genutzt, um massenweise Tweets abzusetzen oder automatisch die Tweets anderer Accounts zu retweeten. Ebenso werden sie allerdings von Unternehmen eingesetzt, die Teile ihres Social Media-Marketings automatisieren möchten. Damit beispielsweise Inhalte nicht auf jeder Plattform einzeln geteilt werden müssen, werden solche Dienste auch eingesetzt, um beispielsweise ein Bild, welches auf Instagram gepostet wird, auch gleichzeitig bei Twitter zu veröffentlichen. Man kann daher nicht davon ausgehen, dass alle Accounts, die auf diese Apps zurückgreifen, „Bots“ sind, und nicht alle „Bots“ verfolgen bösartige Ziele. Ebenso fallen in diese Kategorie Anwendungen, bei denen bei Betrachtung der Tweets offensichtlich wird, dass sie automatisiert sind (beispielsweise weil Tweets über mehrere Tage lang genau einmal pro Stunde gepostet werden). Insgesamt kann in diesem Fall dadurch davon ausgegangen werden, dass das Kommunikationsverhalten der Accounts zu einem gewissen Grad automatisiert ist.

Analyse von Parteihashtags

Im Folgenden sind die Kategorien angewandt auf die Tweets, welche die angegebenen Partei-Hashtags verwenden. Die Tweets stammen also nicht (ausschließlich) von den Parteien selbst, sondern von sämtlichen Twitter-Nutzern, die einen der angegebenen Hashtags verwendet haben. Die Ansicht kann zwischen absoluten Zahlen und prozentualen Anteilen umgeschaltet werden.

Absolut
Prozentual

Daten seit 11. Juli 2017

Wie man der Grafik entnehmen kann, werden die meisten Tweets über die offiziellen Twitter-Clients geschrieben. Betrachtet man die prozentualen Zahlen, sieht man, dass jeweils mindestens 85% der Tweets von diesen offiziellen Quellen abgesetzt werden, in den meisten Fällen sogar von 93%. Die große Anzahl an Tweets mit dem Hashtag #AfD zeigt zudem, dass ein großer Teil der entsprechenden Twitter-Kommunikation von der AfD handelt – unabhängig davon ob positiv oder negativ. Von den über 300.000 Tweets mit dem Hashtag #AfD sind zudem etwa 7.600 automatisiert gepostet worden (Stand: 29.08.2017). Diese gegenüber den anderen Parteihashtags vergleichsweise hohe Zahl relativiert sich jedoch, wenn man die prozentualen Zahlen betrachtet.

Relative Zahlen

Hier liegt der Hashtag #AfD mit 2,3% an allen Tweets lediglich auf Platz drei – hinter dem Hashtag #FDP mit 3% und #Piraten mit ~8%. Vor dem Hintergrund, dass einer der Kernaspekte der Piratenpartei die Netzpolitik und Digitalisierung ist, könnten diese Zahlen auch so interpretiert werden, dass hier eine gewisse Fertigkeit vorhanden ist, auch komplexere Dienste zu nutzen. Entsprechend ist auch die Nutzung alternativer Clients bei dem Hashtag #Piraten mit 3,2% am höchsten. Wie Eingangs erwähnt, muss hier jedoch darauf hingewiesen werden, dass die Datengrundlage nicht (ausschließlich) auf Tweets der jeweiligen Partei basiert, sondern die allgemeine Kommunikation über diese darstellt.

Automatisierte Quellen

Bei genauerer Betrachtung der Quellen der automatisierten Tweets werden insbesondere die Dienste dlvr.it, Hootsuite und buffer verwendet. Dabei handelt es sich wie zuvor erwähnt um Services, welche die Verwaltung diverser Social Media-Accounts zentralisieren und häufig von Unternehmen genutzt werden, um ihre Social Media-Kanäle effizient zu steuern.

Anhand der gezeigten Beispiele ist ersichtlich, dass 1. automatisierte Kommunikation in unserem Datensatz tatsächlich stattfindet und dass es sich 2. dabei nicht zwangsläufig um problematische Vorgänge handeln muss, sondern häufig ein effizientes Management von Social Media-Kanälen Ursache für dieses Vorgehen ist.