Другие новости по теме:
Комментарии (0) Факторный анализ 144
Квадрат расстояния Махаланобиса между ближайшими классами
Можно попытаться выделить переменную, которая порождает наибольшее разделение пары классов, являющихся ближайшими на данном шаге. Это приведет к разделению всех классов. Мы можем выбрать одну из трех статистик, чтобы оценить качество разделения. Все они используют квадрат расстояния Махаланобиса между центроидами двух классов.
Конечно, одна из этих статистик — само расстояние D2. Это прямая непосредственная мера, в которой всем парам классов приписываются равные веса.
Межгрупповая -статистика
-статистика различий между двумя классами дается следующей формулой:
{п.—в—р'+ 1)/г,я, F= \ ы |D»(G, О,). (19)
Она отличается от формулы в тесте, использующем только квадрат расстояния, тем, что здесь учитываются выборочные размеры классов. Расстояния для малых классов получат меньшие веса, чем расстояния для больших классов. Таким образом, этот критерий стремится увеличить различия между парами, содержащими большие группы.
Минимизация остаточной дисперсии
Пятый возможный критерий предназначен для минимизации остаточной дисперсии между классами. Формула имеет вид
«-i я 4
Д= £ £ -;— • (20)
Каждый член суммы равен единице минус квадрат множественной корреляции между множеством рассматриваемых дискриминантных переменных и фиктивной переменной, идентифицирующей соответствующую пару классов. Следовательно, R является остаточной дисперсией, потому что каждый член суммы представляет собой долю дисперсии фиктивной переменной, которую нельзя объяснить с помощью дискриминантных переменных. Иногда число пар классов делят на g(g—1)/2, чтобы получить среднюю остаточную дисперсию между классами, но это не влияет на вы-