作者: Ludmila Himmelspach
DOI:
关键词:
摘要: Die klassischen Methoden zur Clusteranalyse wurden entwickelt um auf vollstandigen Daten Analysen durchzufuhren. Oft fehlen aber in einzelne Werte — systematisch oder unsystematisch —, z.B. infolge der Probleme bei Datenerfassung, Datenubertragung, Datenbereinigung weil aus unterschiedlichen Quellen stammen. Demzufolge konnen die traditionellen Clusteringmethoden Analyse solcher nicht ohne weiteres angewendet werden. Im Rahmen dieses Beitrags werden unterschiedliche Strategien zum Umgang mit fehlenden Werten fur das Clusteringproblem vorgestellt, analysiert und miteinander verglichen. Dabei wird besondere Augenmerk Untersuchung Leistungsfahigkeit dieser Verfahren Abhangigkeit von den Ausfallmechanismen, zugrundeliegen, dem Anteil fehlender gelegt.