Réduction de dimension en apprentissage numérique non supervisé

作者: Sébastien Guérif

DOI:

关键词:

摘要: La classification automatique - clustering est une etape importante du processus d'extraction de connaissances a partir donnees (ECD). Elle vise decouvrir la structure intrinseque d'un ensemble d'objets en formant des regroupements clusters qui partagent caracteristiques similaires. complexite cette tache s'est fortement accrue ces deux dernieres decennies lorsque les masses disponibles ont vu leur volume exploser. En effet, le nombre presents dans bases augmente mais egalement taille description. L'augmentation dimension consequences non negligeables sur traitements classiquement mis œuvre: outre l'augmentation naturelle temps traitements, approches classiques s'averent parfois inadaptees presence bruit ou redondance. Dans these, nous interessons reduction cadre supervisee. Differentes selection ponderation variables sont proposees pour traiter problemes lies d'attributs redondants bruites : Nous proposons d'abord l'algorithme p-SOM limite l‘effet calculant attributs d'une simultanee objets et attributs. presentons ensuite approche integree embedded permet fois groupes d' aussi un sous-ensemble pertinents. terminons presentant wβ -SOM introduit fonction cout cartes auto-organisatrices Self Organizing Maps optimisee iterativement alterant trois etapes optimisation affectations, prototypes poids. obtenue apres convergence utilisee proposer filtre Filter variables. concluons these indiquant limites envisageant quelques axes developper lors poursuite recherches.

参考文章(24)
Farida Zehraoui, Younès Bennani, M-SOM-ART: growing self organizing map for sequences clustering and classification european conference on artificial intelligence. pp. 564- 568 ,(2004)
Julius T. Tou, FEATURE SELECTION FOR PATTERN RECOGNITION SYSTEMS Methodologies of Pattern Recognition. pp. 493- 508 ,(1969) , 10.1016/B978-1-4832-3093-1.50031-6
Fabien Moutarde, Alfred Ultsch, U*F clustering: a new performant "cluster-mining" method based on segmentation of Self-Organizing Maps workshop on self organizing maps. ,(2005)
L. Lebart, Marie Piron, A. Morineau, Statistique exploratoire multidimensionnelle ,(1995)
Fabien Moutarde, David Opolon, Fast semi-automatic segmentation algorithm for Self-Organizing Maps the european symposium on artificial neural networks. pp. 507- 512 ,(2004)
Esa Alhoniemi, Juha Vesanto, Juha Parhankangas, Johan Himberg, Self-organizing map in Matlab: the SOM Toolbox ,(1999)
Marie Cottrell, Patrick Letrémy, Jean-Claude Fort, Advantages and drawbacks of the Batch Kohonen algorithm. the european symposium on artificial neural networks. pp. 223- 230 ,(2002)