Факторный анализ 181
Полемика ведется и вокруг вопроса о необходимости взвеши-
ванйя переменных. Особенно много таких дискуссий в области биологии. Взвешивание — это манипулирование значением переменной, п...
Факторный анализ 182
Коэффициенты корреляции
Коэффициенты корреляции, часто называемые угловыми мерами ввиду их геометрической интерпретации, — самый распространенный тип сходства в области социальных наук...
Факторный анализ 183
Одним из главных недостатков коэффициента корреляции как меры сходства, является то, что он чувствителен к форме за счет
снижения чувствительности к величине различий между переменными...
Факторный анализ 184
Несмотря на эти недостатки, коэффициент широко использовался в приложениях кластерного анализа. Хаммер и Каннингхем (1981) показали, что при правильном применении кластерного метода коэффици...
Факторный анализ 185
Можно определить и другие виды расстояния. Так, хорошо известной мерой является манхеттенское расстояние, или «расстояние городских кварталов» (city-block), которое определяется ...
Факторный анализ 186
Поскольку в прикладном анализе данных часто возникает необходимость в нормировке, полезно рассмотреть небольшой пример, показывающий влияние нормировки на коэффициенты корреляции и расстояни...
Факторный анализ 187
Факторный анализ 188
Факторный анализ 189
В заключение важно отметить, что все четыре матрицы порождают разные ранжирования коэффициентов сходства. Это замечание важно, так как оно показывает, что выбор коэффициента сходства и преоб...
Факторный анализ 190
Коэффициент Жаккара, определенный следующим образом
/ = а/(а+Ь + с),
не учитывает одновременного отсутствия признака при вычислении сходства (клетка d не рассматривается). ...
Факторный анализ 191
Факторный анализ 192
где Wfjk — весовая переменная, принимающая значение 1, если сравнение объектов по признаку k следует учитывать, и 0 — в противном случае; Su — «вклад» в сходство объектов, завися...
Факторный анализ 193
объект / 10 10
вклад SijH 10 0 0 вес Wm 1110
Для порядковых данных равно 1, если сравниваемые значения равны, и 0 — в противном случае. Наконец, для количественных д...
Факторный анализ 194
БИБЛИОГРАФИЧЕСКИЕ ЗАМЕЧАНИЯ
Обсуждение коэффициентов сходства, используемых в кластерном анализе, проводится в работах Снита и Сокэла (1973), Клиффорда и Стефенсона (1975). Там же можн...
Факторный анализ 195
Форма — это расположение точек в пространстве. Несмотря на то, Что обычно кластеры изображают в форме гиперсфер или эллипсоидов, возможны кластеры и другой формы, например удлиненные кластер...
Факторный анализ 196
7) методы, использующие теорию графов.
Эти семейства соответствуют различным подходам к созданию групп, и применение различных методов к одним и тем же данным может привести к сил...
Факторный анализ 197
0 225 г
0 280 -
0 335 - ]-'-~-—|
0 390 -0 445 -
0 500 - j-1-1-1
0 555 -0 613 -0 665 ~ 0 720 -
i i п л m п...
Факторный анализ 198
Несмотря на простоту методов, они обладают некоторыми недостатками. Если не используются специально разработанные алгоритмы, то применение иерархических алгомеративных методов может потребов...
Факторный анализ 199
d(h,k) =А (J) • d{h,i) +А (/) d{h,j) +B-d{i,j) + + C -ABS(d{h,i) -d(ft,/)), где d(h,k)—различие (расстояние) между кластерами h и k, причем кластер k является результатом объединения класте...
Факторный анализ 200
Главный недостаток метода одиночной связи, однако, состоит в том, что, как было показано на практике, метод приводит к появлению «цепочек» («цепной эффект»), т. е. к ...