Другие новости по теме:
Комментарии (0) Факторный анализ 195
Форма — это расположение точек в пространстве. Несмотря на то, Что обычно кластеры изображают в форме гиперсфер или эллипсоидов, возможны кластеры и другой формы, например удлиненные кластеры. В последнем случае понятие радиуса или диаметра перестает быть полезным. Вместо этого можно вычислить «связность» точек в кластере — относительную меру расстояния между ними. Если же кластеры имеют другие, более причудливые формы (см. Everitt, 1980), то понятие связности становится менее полезным, а ценность относительных оценок диаметра и плотности, следовательно, уменьшается. Отделимость характеризует степень перекрытия кластеров и насколько далеко друг от друга они расположены в пространстве. Так, кластеры могут быть относительно близки друг к другу и не иметь четких границ, или же они могут быть разделены широкими участками пустого пространства.
С Помощью этих терминов можно описать кластеры любого вида. Согласно Эверитту (1980) кластеры — это «непрерывные области (некоторого) пространства с относительно высокой плотностью точек, отделенные от других таких же областей областями с относительно низкой плотностью точек». Важность этого определения заключается в том, что оно не сводит понятие кластера к какой-то частной форме до начала анализа данных.
Разработанные кластерные методы образуют семь основных семейств:
1) иерархические агломеративные методы;
2) иерархические дивизимные методы;
3) итеративные методы группировки;
4) методы поиска модальных значений плотности;
5) факторные методы;
6) методы сгущений;