Automatische Inhaltsanalyse und maschinelles Lernen
Zusammenfassung
Bereits seit einigen Jahren werden verschiedene Verfahren des maschinellen Lernens für die Auswertung von digitalen Medieninhalten eingesetzt – unter anderem bei Suchmaschinen oder automatischen Übersetzungen. Was leisten diese Verfahren jedoch für die quantitative Inhaltsanalyse, wie sie in den Sozialwissenschaften angewandt wird? In diesem Buch werden die methodologischen und forschungspraktischen Besonderheiten der automatischen Inhaltsanalyse denen der klassischen manuellen Codierung gegenübergestellt. Anschließend werden die Vor- und Nachteile des maschinellen Lernens im Vergleich zu anderen computergestützten Verfahren der Textanalyse diskutiert. Praktisch wird das Potential dieses Ansatzes anhand einer umfangreichen Analyse von Online-Nachrichten evaluiert. In einer experimentellen Untersuchung stehen dabei einerseits die Klassifikationsqualität, andererseits die Effektivität des maschinellen Lernprozesses auf dem Prüfstand. Die Ergebnisse der Studie zeigen erstens, dass die Qualität der automatischen Codierung vor allem von den verwendeten Kategorien abhängt, jedoch weitgehend unabhängig vom Textmaterial und etwaigen Bereinigungsschritten. Zweitens belegt die Evaluationsstudie, dass sich der maschinelle Lernprozess durch gezielte statt zufällige Auswahl von Beispieltexten deutlich beschleunigen lässt.
Die Dissertation gibt es unter einer Creative Commons Lizenz komplett als PDF Download oder als gedrucktes Buch direkt bei epubli und im Buchhandel.
Die offizielle digitale Dissertation ist in der Bibliothek der Universität der Künste Berlin erschienen. Die digitale Fassung ist identisch mit dem Buch, so dass ich darum bitte, die Buchfassung zu zitieren:
Scharkow, M. (2012). Automatische Inhaltsanalyse und maschinelles Lernen. Berlin: epubli.