作者: Sébastien Guérif
DOI:
关键词:
摘要: La classification automatique - clustering est une etape importante du processus d'extraction de connaissances a partir donnees (ECD). Elle vise decouvrir la structure intrinseque d'un ensemble d'objets en formant des regroupements clusters qui partagent caracteristiques similaires. complexite cette tache s'est fortement accrue ces deux dernieres decennies lorsque les masses disponibles ont vu leur volume exploser. En effet, le nombre presents dans bases augmente mais egalement taille description. L'augmentation dimension consequences non negligeables sur traitements classiquement mis œuvre: outre l'augmentation naturelle temps traitements, approches classiques s'averent parfois inadaptees presence bruit ou redondance. Dans these, nous interessons reduction cadre supervisee. Differentes selection ponderation variables sont proposees pour traiter problemes lies d'attributs redondants bruites : Nous proposons d'abord l'algorithme p-SOM limite l‘effet calculant attributs d'une simultanee objets et attributs. presentons ensuite approche integree embedded permet fois groupes d' aussi un sous-ensemble pertinents. terminons presentant wβ -SOM introduit fonction cout cartes auto-organisatrices Self Organizing Maps optimisee iterativement alterant trois etapes optimisation affectations, prototypes poids. obtenue apres convergence utilisee proposer filtre Filter variables. concluons these indiquant limites envisageant quelques axes developper lors poursuite recherches.