Rezension/Einführung: Analyse schriftlicher Gespräche mit VisualDTA

Linda Schwarzl (2014)

Rezension als PDF

Durch die schnelle Entwicklung des Internets in den letzten Jahrzehnten gibt es vermehrt neue Genres der computer-mediated communication (CMC) (auch computer-vermittelte (cvK) oder internetbasierte Kommunikation (ibK)), die in der Linguistik sowie der Soziologie erforscht werden. Ein einheitlicher Standard zur Darstellung und Annotierung dieser Kommunikationsformen hat sich noch nicht durchgesetzt. Von Beißwenger et al. wurden 2012 Richtlinien zur Repräsentation von CMC, im Rahmen der Text Encoding Initiative (TEI) , entwickelt. Das sogenannte TEI Schema dient der Darstellung von strukturellen und linguistischen Eigenschaften von CMC.
Zielt man auf eine strukturelle Darstellung des inhaltlichen Verlaufs (topic flow) von CMC ab, kann man auf das von Kurtz und Herring 2004-2006 entwickelte Java-Programm VisualDTA, das die dynamic topic analysis (DTA) unterstützt, zurückgreifen.  VisualDTA dient der Analyse medial schriftlicher Gespräche und bietet eine Technik zur automatischen Erstellung der Visualisierungen der Daten, welche aber zunächst – gemäß den Vorgaben des Programms – codiert werden müssen. Herring/Kurtz beschreiben VisualDTA als Technik der visuellen Repräsentation interaktionaler und pragmatischer Aspekte von Online-Diskursen, welche über die bloße Darstellung von strukturellen Informationen (Nickname, Nachrichtenlänge etc.) hinausgeht und die sequenziellen Beziehungen innerhalb der synchronen CMC-Nachrichten präsentiert (2006:5). Um inhaltliche Zusammenhänge darzustellen, kann VisualDTA aber nicht nur für die Analyse von Online-Kommunikation verwendet werden, sondern auch für die Gesprächsanalyse gebraucht werden. Benötigt wird hierfür lediglich ein Transkript, auf dessen Grundlage die Untersuchung durchgeführt werden kann.
Die erste Inbetriebnahme des Programms ist denkbar einfach: VisualDTA ist ein – für alle nichtkommerziellen Zwecke – frei verfügbares Programm, das heruntergeladen werden kann. Es ist schnell einsatzbereit, die Datei muss lediglich entpackt werden und kann ohne Installation direkt gestartet werden. Sollte es nicht auf Anhieb funktionieren, sollte ein Java-Update (Java 1.4 oder höher) durchgeführt werden. VisualDTA läuft sowohl unter Windows als auch unter Mac OS. Bei Anregungen, Fragen oder Kritik können die Autoren benachrichtigt werden.
Die Darstellung erfolgt in wenigen Sekunden, sobald man die Datei (DTA coding file) geöffnet hat. Als Hilfestellung stehen im Programmordner eine Beispieldatei und eine Excel-Vorlage zur Verfügung. Die Visualisierung kann dann mithilfe der Steuerelemente modifiziert werden. Entweder man lässt sich die gesamte Struktur auf einmal anzeigen, oder sie baut sich Schritt für Schritt durch Klicken auf den Button Next auf, so kann der Verlauf dargestellt werden.
In der VisualDTA coding help steht beschrieben, worauf man achten muss und welche Werte optional bzw. obligatorisch sind, um eine solche Darstellung (Abbildung 2) angezeigt zu bekommen.
Zunächst gilt es zu beachten, dass man die Daten im Dateiformat TAB-getrennt  (TAB-delimited) abspeichern muss. Die Eingabe erfolgt – so ist es am einfachsten – im dem template für Excel (siehe Abbildung 1), das mit dem Programm heruntergeladen wird.
Obligatorisch ist die Eingabe von column names in der ersten Reihe. Alle weiteren Reihen unterhalb der ersten sind Datenreihen und müssen mit Werten gefüllt werden. Möglich ist die Eingabe NA, wenn keine Werte vorliegen; leer bleiben dürfen diese Zeilen allerdings nicht, da VisualDTA sonst beim Öffnen der TAB-getrennten Datei eine Fehlermeldung anzeigt.

Abbildung 1: Eingabe der Daten in Dateivorlage (tab-getrennt)

Es gibt vier obligatorische Spalten (Proposition, Reponds To, Relation Type und Distance) und drei optionale (Speaker, Dotted Line und Description), die in Abbildung 1 in der Tabelle zu sehen sind.
Es besteht die Möglichkeit, weitere Spalten hinzuzufügen, wie im angezeigten Beispiel Date und Title. Die zusätzlich hinzugefügten Spalten werden als Attribute betrachtet.
Die ersten drei Spalten in Abbildung 1 erklären sich eigentlich von selbst und enthalten Informationen zu Proposition, Speaker und Responds to. Erst Spalte 4 (Relation type) bedarf weiterer Informationen. Die Propositions (Sätze/Äußerungen) werden in fünf verschiedene Gruppen, die so genannten relation types, unterteilt. Je nachdem, wie sie inhaltlich gestaltet sind, können sie entweder T = On Topic, P = Parallel Shift, B = Break, M = Meta Talk oder E = Explanation zugeordnet werden. Bei der ersten Nachricht kann auch NA (not available) angegeben werden.
Mit Distance ist die semantische Distanz zur vorherigen Nachricht gemeint. Schwierig gestaltet sich hierbei die Zuweisung des Distanz-Werts, da man diesen selbst festlegen muss. Die Autoren geben lediglich den Hinweis, dass es sich um einen Wert zwischen 0 und 4 handeln sollte, wobei 0 on topic bedeutet, breaks eine Distanz von 4 aufweisen und shifts zu 1, 2 oder 3 einzuordnen sind (Kurtz/Herring 2004-2006). Die Zuteilung zur semantischen Distanz fiel im Umgang mit VisualDTA als am problematischsten auf, da es keine genauen Vorgaben oder Richtlinien gibt, an die man sich halten kann. Die Einteilung erfolgt nach einem eigenen System, weshalb an der Darstellung eines Online-Diskurses bzw. eines transkribierten Gesprächs nur eine Person arbeiten sollte, da die Einteilung – meiner Auffassung nach – teilweise etwas willkürlich erfolgt, gerade wenn es drei Möglichkeiten für die Einteilung von shifts gibt.
Die Arbeit mit VisualDTA teilt sich also in zwei Schritte: Zunächst die Eingabe in Excel und darauf folgend das Laden der Datei in VisualDTA selbst, um die Visualisierung letztlich dargestellt zu bekommen.
Die eingegebenen Werte (Abbildung 1) werden dann, wie in Abbildung 2 zu sehen, visualisiert. Wie hier zu erkennen, kann man sich Highlights zu den einzelnen Propositionen anzeigen lassen. Dazu fährt man einfach mit dem Mauscursor über den hier mit Abkürzung T, M, E, B, P angegeben Relation Type.


Abbildung 2: Darstellung einer Diskussion in den Kommentaren eines Beitrags

Die Propositions (Sätze/Äußerungen) auf der y-Achse werden in fünf verschiedene Gruppen unterteilt. Die Proposition Number gibt hier die Anzahl der eingegebenen Propositions an. Die x-Achse zeigt die semantische Distanz an, die – obwohl nur 0-4 als Werte eingegeben wurden, in dieser Darstellung bis 7 geht.

Zusätzlich zur Visualisierung stellt VisualDTA einige statistische Auswertungen bereit. Es gibt die Basic Statistics, die eine Auflistung der Proposition, Move, Speaker, Date und Title counts angeben. Da man in der Vorlagendatei die Möglichkeit hat, weitere Attribute einzugeben, werden diese (hier: Date und Title counts) auch angezeigt.


Abbildung 3: Statistische Auswertung mit VisualDTA

Außerdem kann VisualDTA einen statistischen Vergleich anstellen, indem man im Programm unter dem Menüpunkt View auf Custom Comparison klickt und zwei Attribute auswählt.

Abschließend lässt sich sagen, dass die Handhabung von VisualDTA für diejenigen, die eine schnelle Auffassungsgabe im Umgang mit Datenverarbeitungsprogrammen haben, nicht besonders schwer ist. Hat man einmal die Eingabebedingungen der Excel-Vorlage verstanden, gelingt alles Weitere leicht. Wichtig ist, dass die exakte Eingabe der erwünschten Werte beachtet wird, da die Datei sonst nicht vom Programm verarbeitet/gelesen werden kann und keine Visualisierung erfolgt.
Als positiv hervorzuheben sind die kostenlose Bereitstellung des Programms und die Tatsache, dass es unter Mac und Windows OS läuft.
Verbesserungswürdig erscheint mir die manuelle Eingabe der Daten, vor allem die der semantischen Distanz und des relation types. Die selbstständige Einschätzung und Zuordnung der Daten kann sich teilweise als schwierig gestalten und dazu führen, dass die Darstellung nicht genau ist, was dann aber nicht als genuines Problem von VisualDTA angesehen werden kann, sondern als Benutzungsfehler/-problem einzuordnen ist. Schon Herring/Kurtz (2006:5) erkennen diese Schwierigkeit und fordern unter anderem mehr Forschung im Bereich der automatischen Bedeutungserkennung (automatic identification of semantic and pragmatic meaning), um diese Desiderate zu erfüllen.
Durch weitere Forschung in dieser Richtung könnte die Themendynamik (topic dynamic) medial schriftlicher Konversationen schnell – Herring/Kurtz (2006:5) träumen sogar von Übertragung in Echtzeit – mit VisualDTA dargestellt und nachvollzogen werden.
Da der aktuelle Forschungsstand aber noch nicht so weit ist, muss die Eingabe der semantischen und pragmatischen Analyse von Hand geschehen, was dazu führt, dass VisualDTA zwar der Visualisierung der topic dynamic dient, diese Darstellung aber je nach Menge der Daten sehr viel Zeit in Anspruch nehmen kann.
Exemplarisch möchte ich auf Tophinke/Ziegler (2014) verweisen, die in ihrem Aufsatz VisualDTA zur Hilfe nehmen, um die Kohärenz der Kommentare einer Webblogkommunikation zu untersuchen.


Literatur

Beißwenger, M./ Ermakova, M./ Geyken, A./ Lemnitzer, L./ Storrer, A. (2012): A TEI Schema for the Representation of Computer-mediated Communication. In: Journal of the Text Encoding Initiative (jTEI), Issue 3 | November 2012 (DOI: 10.4000/jtei.476).

Herring, S. C. (1996): Computer-Mediated Communication: Linguistic, Social and Cross-Cultural Perspectives. Pragmatics and Beyond series. Amsterdam: John Benjamins.

Herring, S. C. (1997): Computer-mediated discourse analysis: Introduction. Electronic Journal of Communication, 6 (3). URL: http://www.cios.org/www/ejc/v6n396.htm (eingesehen am 17. 10. 2013).

Herring, S. C. (2003): Dynamic topic analysis of synchronous chat. In New Research for New Media: Innovative Research Methodologies Symposium Working Papers and Readings. Minneapolis, MN: University of Minnesota School of Journalism and Mass Communication. URL: http://ella.slis.indiana.edu/~herring/dta.2003.pdf (eingesehen am 17. 10. 2013).

Herring, S. C./ Kurtz, A. J. (2006). Visualizing Dynamic Topic Analysis. Proceedings of CHI'06. ACM Press. Preprint. URL: http://ella.slis.indiana.edu/~herring/chi06.pdf (eingesehen am 17. 10. 2013).
Kurtz, A. J./ Herring, S. (2004-2006): VisualDTA. URL: http://info.slis.indiana.edu/~herring/VisualDTA/ (eingesehen am 17. 10. 2013).

Tophinke, D./ Ziegler, E. (angenommen): „Spontane Dialektthematisierung in der Weblogkommunikation: Interaktiv-kontextuelle Einbettung, semantische Topoi und sprachliche Konstruktionen“. In: Cuonz, Christina/Studler, Rebekka (Hg.): Sprechen über Sprache. Tübingen: Stauffenburg Verlag.


Linda Schwarzl M.A.
Universität Duisburg-Essen
Fakultät Geisteswissenschaften
Universitätsstraße 12
45117 Essen
linda.schwarzl@uni-due.de



Zurück