Факторный анализ 207

Новости
Просмотров: 361



Тип итерации. Данный момент итерационного процесса связан со способом распределения объектов по кластерам. И опять имеются два основных вида итераций: по принципу fe-средних и по принципу «восхождения на холм».

Итерации по принципу fe-средних (они называются также «итерациями по принципу ближайшего центра» и «перемещающими итерациями») заключаются просто в перемещении объектов в кластер с ближайшим центром тяжести. Итерации по принципу fe-средних могут быть либо комбинаторными, либо некомбинаторными. В первом случае перевычисление центра тяжести кластера производится после каждого изменения его состава, а во втором случае — лишь после того, как будет завершен просмотр всех данных. Кроме того, итерации по принципу -средних подразделяются на исключающие и включающие. В итерациях исключающего типа после вычисления центра тяжести кластера рассматриваемый объект удаляется из кластера, а в итерациях включающего типа — помещается в кластер.

В итерациях, работающих по принципу «восхождения на холм», вместо пединения объектов к кластеру в зависимости от расстояния между объектом и центром тяжести кластера, перемещение объектов производится исходя из того, будет или нет предполагаемое перемещение оптимизировать значение некоторого статистического критерия.

Статистический критерий. Методы, основанные на принципе «восхождения на холм», используют один или несколько следующих критериев (функций качества кластеризации): trW, trW_1/3, det W и наибольшее собственное значение матрицы W-lB, где W — объединенная внутригрупповая ковариационная матрица, в В — объединенная межгрупповая ковариационная матрица. Каждая из этих статистик часто рассматривается в многомерном дисперсионном анализе (MANOVA); их применение выводится из статистической теории, заложенной в MANOVA. Фактически все четыре критерия связаны с обнаружением однородности кластеров в многомерном пространстве. Хотя в явном виде итерации по принципу й-средних не применяют статистический критерий при перемещении объектов, неявно они оптимизируют критерий trW. Таким образом, процедура -средних минимизирует дисперсию внутри каждого кластера. Важно отметить, однако, что итерации по принципам ife-средних и «восхождения на холм», используя критерий trW, приведут к различным результатам при одних и тех же исходных данных.

Другие новости по теме:

  • Факторный анализ 205
  • Факторный анализ 206
  • Факторный анализ 209
  • Факторный анализ 194
  • Факторный анализ 227

  •  (голосов: 0)

    Комментарии (0)