Topic-Modelle für qualitative Textanalysen

作者: Christian Papilloud , Alexander Hinneburg

DOI: 10.1007/978-3-658-21980-2_2

关键词:

摘要: Topic-Modelle werden zur explorativen Datenanalyse genutzt. Sie konnen auf einer statistischen Grundlage von Wahrscheinlichkeitsverteilungen und Unabhangigkeitsannahmen gebildet werden, die als Bayessche Netzwerke bezeichnet werden. Alternativ sie der linearen Algebra Die Berechnung Modelle wird Optimierungsproblem formuliert, dessen Ergebnis Zerlegung Matrix ist, deren Zeilen Dokumente Spalten Worter des Vokabulars sind. Diese in ein Produkt mehrerer kleinerer Matrizen faktorisiert. fassen den Dokumenten vorkommenden Gruppen zusammen klassifizieren diese Weise. Klassifikation bildet wichtigsten strukturierenden Themen Textsammlung ab. Als explorative, Klassen bildende Methoden mit anderen bildenden Sozialwissenschaften, insbesondere Cluster- Faktorenanalysen, verglichen In diesem Kapitel erklaren wir zuerst wie funktionieren. Anschliesend vergleichen bekannteren Faktorenanalyse.

参考文章(42)
Christopher M. Bishop, Pattern Recognition and Machine Learning (Information Science and Statistics) Springer-Verlag New York, Inc.. ,(2006)
Hinrich Schütze, Christopher D. Manning, Prabhakar Raghavan, Introduction to Information Retrieval ,(2005)
Andrew T. Wilson, Peter A. Chew, Term Weighting Schemes for Latent Dirichlet Allocation north american chapter of the association for computational linguistics. pp. 465- 473 ,(2010)
David M Blei, Andrew Y Ng, Michael I Jordan, None, Latent dirichlet allocation Journal of Machine Learning Research. ,vol. 3, pp. 993- 1022 ,(2003) , 10.5555/944919.944937
Daniel D. Lee, H. Sebastian Seung, Learning the parts of objects by non-negative matrix factorization Nature. ,vol. 401, pp. 788- 791 ,(1999) , 10.1038/44565
David Mimno, Andrew McCallum, Topic models conditioned on arbitrary features with Dirichlet-multinomial regression uncertainty in artificial intelligence. pp. 411- 418 ,(2008)
Gabriel Doyle, Charles Elkan, Accounting for burstiness in topic models Proceedings of the 26th Annual International Conference on Machine Learning - ICML '09. pp. 281- 288 ,(2009) , 10.1145/1553374.1553410
Kristina Toutanova, Dan Klein, Christopher D. Manning, Yoram Singer, Feature-rich part-of-speech tagging with a cyclic dependency network Proceedings of the 2003 Conference of the North American Chapter of the Association for Computational Linguistics on Human Language Technology - NAACL '03. pp. 173- 180 ,(2003) , 10.3115/1073445.1073478
T. L. Griffiths, M. Steyvers, Finding scientific topics Proceedings of the National Academy of Sciences of the United States of America. ,vol. 101, pp. 5228- 5235 ,(2004) , 10.1073/PNAS.0307752101