Факторный анализ 219

Новости
Просмотров: 358



Результаты проведенных исследований трудно свести воедино, потому что каждое из них придает особое значение своей комбинации структур данных и проверяемых методов. Поэтому не удивительно, что были получены противоречивые результаты (Milli-gan, 1981). Однако, по-видимому, четыре фактора оказывают на работу методов кластеризации большое влияние:

1) характеики кластерной структуры;

2) наличие выбросов и степень полноты классификации;

3) степень перекрытия кластеров;

4) выбор меры сходства.

Наиболее важными характеиками кластерной структуры, влияющими на работу методов кластеризации, являются форма кластеров, размеры кластеров (которые выражены в числе объектов, приходящихся на кластер, и в различиях относительных размеров кластеров) и число кластеров. Мы уже показали на нескольких примерах, что определенные методы кластеризации склонны к обнаружению определенных видов кластеров. Расширяющие пространство методы, такие, как метод Уорда, полных связей, итеративные методы группировки, использующие критерий tr W, приводят к кластерам гиперсферической формы. Поэтому не надо удивляться, что в исследованиях, использующих методы Монте-Карло для создания кластеров такой формы, расширяющие пространство методы восстанавливают известную кластерную структуру лучше, чем сужающие пространство методы. Не удивительно и то, что эти методы обычно не в состоянии вос-

становить структуру кластеров, имеющих растянутую или необычную форму. Кроме того, расширяющие пространство методы имеют тенденцию находить кластеры приблизительно равных размеров. Но в этом случае, как показывают исследования по методу Монте-Карло, кластеры, состоящие из относительно небольшого числа объектов, могут слиться с кластерами больших размеров. Мойена (1977) доказал, в частности, что увеличение числа групп в данных неблагоприятно воздействует на работу метода Уорда, но этот результат не нашел подтверждения в другой работе, где применяется метод Монте-Карло. Вообще говоря, сужающие пространство методы, подобные методу одиночной связи, хорошо работают с теми кластерными структурами, для которых расширяющие пространство методы оказываются несостоятельными. Так, исследованиями, использующими метод Монте-Карло, проверено, что сужающие пространство методы действительно дают хорошее восстановление известной кластерной структуры, если кластеры хорошо определены и разделены.

Другие новости по теме:

  • Факторный анализ 204
  • Факторный анализ 220
  • Факторный анализ 218
  • Факторный анализ 221
  • Факторный анализ 205

  •  (голосов: 0)

    Комментарии (0)