作者: Christian Papilloud , Alexander Hinneburg
DOI: 10.1007/978-3-658-21980-2_2
关键词:
摘要: Topic-Modelle werden zur explorativen Datenanalyse genutzt. Sie konnen auf einer statistischen Grundlage von Wahrscheinlichkeitsverteilungen und Unabhangigkeitsannahmen gebildet werden, die als Bayessche Netzwerke bezeichnet werden. Alternativ sie der linearen Algebra Die Berechnung Modelle wird Optimierungsproblem formuliert, dessen Ergebnis Zerlegung Matrix ist, deren Zeilen Dokumente Spalten Worter des Vokabulars sind. Diese in ein Produkt mehrerer kleinerer Matrizen faktorisiert. fassen den Dokumenten vorkommenden Gruppen zusammen klassifizieren diese Weise. Klassifikation bildet wichtigsten strukturierenden Themen Textsammlung ab. Als explorative, Klassen bildende Methoden mit anderen bildenden Sozialwissenschaften, insbesondere Cluster- Faktorenanalysen, verglichen In diesem Kapitel erklaren wir zuerst wie funktionieren. Anschliesend vergleichen bekannteren Faktorenanalyse.