Другие новости по теме:
Комментарии (0) Факторный анализ 199
d(h,k) =А (J) • d{h,i) +А (/) d{h,j) +B-d{i,j) + + C -ABS(d{h,i) -d(ft,/)), где d(h,k)—различие (расстояние) между кластерами h и k, причем кластер k является результатом объединения кластеров (или объектов) i и / в ходе агломеративного шага. С помощью этой формулы можно вычислить расстояние между некоторым объектом (ft) и новым кластером (k), полученным объединением объектов i и / в единый кластер. Прописными буквами обозначены параметры, которые определяют конкретный вид группировки; в методе одиночной связи, например, эти параметры принимают следующие значения: A (i)=A (/) = 1/2, 5 = 0 и С=1/2. Полученная формула оказала большую помощь при разработке вычислительных алгоритмов для этих методов.
Чтобы проиллюстрировать работу иерархических методов и показать действие разных правил группировки, данные MMPI-теста были обработаны с помощью четырех наиболее известных методов.
Метод одиночной связи. В этом методе, описанном Снитом (1957), кластер образуется по следующему правилу: объект будет
пединен к уже существующему кластеру, если по крайней мере один из элементов кластера находится на том же уровне сходства, что и объект, претендующий на включение. Таким образом, пединение определяется лишь наличием единственной связи между объектом и кластером. Главное преимущество этого метода заключается в его математических свойствах: результаты, полученные по этому методу, инвариантны к монотонным преобразованиям матрицы сходства; применению метода не мешает наличие «совпадений» в данных (Jardine and Sifoson, 1971). Первое из этих свойств (инвариантность при монотонных преобразованиях) особенно важно по той причине, что все другие иерархические агломе-ративные методы таким свойством не обладают. Это означает, что метод одиночной связи является одним из немногих методов, результаты применения которых не изменяются при любых преобразованиях данных, оставляющих без изменения относительное упорядочение элементов матрицы сходства.
458 227 г
412 035 г-
365 644 г-
319 652 г-
4 Дендрограмма метода одиночной связи для данных MMPI-теста
394 7 698
3535 945
3124 189
2712 494
2300 679
1888 924
1477.169
1065 414
653 660
241 905
5. Дендрограмма метода полных связей для данных MMPI-теста