Interactive cleaning for automatic document clustering and categorization

作者： Caroline Privault , Jean-Michel Renders , Ludovic Menuge

DOI:

关键词: Document clustering 、 Categorization 、 Cluster analysis 、 Ambiguity 、 Computer science 、 Similarity (network science) 、 User input 、 Outlier 、 Class (biology) 、 Information retrieval

摘要: Documents are clustered or categorized to generate a model associating documents with classes. Outlier measures computed for the indicative of how well each document fits into model. identified user based on outlier and selected criterion. Ambiguity number classes which has similarity under If is annotated label class, possible corrective class if higher than class. The clustering categorizing repeated adjusted received input an updated ambiguity also calculated at runtime new classified using

google.com 本地加速

freepatentsonline.com 本地加速

freepatentsonline.com LINK 下载加速

freepatentsonline.com UNKNOWN 下载加速

lens.org UNKNOWN 下载加速

参考文章(28)

Xiaojin Zhu, Zoubin Ghahramani, John Lafferty, None, Time-Sensitive Dirichlet Process Mixture Models Carnegie Mellon University: School of Computer Science. ,(2005)

Bruce Ferguson, Eric Hartman, System and method for pre-processing input data to a support vector machine ,(2002)

Cyril Goutte, Eric Gaussier, Incremental training for probabilistic categorizer ,(2005)

Cyril Goutte, Eric Gaussier, Method and apparatus for explaining categorization decisions ,(2004)

Cyril Goutte, Eric Gaussier, Method for multi-class, multi-label categorization using probabilistic hierarchical modeling ,(2004)

Francine Chen, Ashok Chhabedia Popat, Eric Gaussier, Methods, systems, and articles of manufacture for soft hierarchical clustering of co-occurring objects ,(2002)

Jean-Marc Andreoli, Guillaume Bouchard, Probabilistic latent clustering of device usage intelligent data analysis. pp. 1- 11 ,(2005) , 10.1007/11552253_1

Vladimir Vapnik, Isabelle Guyon, Nada Matic, Discovering informative patterns and data cleaning knowledge discovery and data mining. pp. 181- 203 ,(1996)

Kamala D. Urs, Method and apparatus for message callback in a communication system ,(2002)

10.

David A. Selby, Vincent Thomas, Method, system, and computer program product for outlier detection ,(2002)

Interactive cleaning for automatic document clustering and categorization

来源期刊

我的账户

Interactive cleaning for automatic document clustering and categorization

来源期刊

相似文章 10

我的账户