Факторный анализ 132

Новости
Просмотров: 356



Рассмотрим 11, в которой приведены коэффициенты классифицирующих функций для данных о голосовании в сенате, чтобы проиллюстрировать использование этих функций. Применив такую функцию к первичным данным по позиции сенатора Айкена, мы получим следующие значения для четырех групп: 89,742; 46,578; 78,101 и 78,221. Поскольку первое значение — наибольшее, мы отнесем позицию Айкена к первой группе (что является верным предсказанием).

Обобщенные функции расстояния

Более понятным способом классификации является измерение расстояний между объектом и каждым из центроидов классов, чтобы затем отнести объект в ближайший класс. Однако в тех случаях, когда переменные коррелированы, измерены в разных единицах и имеют различные стандартные отклонения, бывает трудно определить понятие «расстояния». Индийский статистик Маха-ланобис (1963) предложил обобщенную меру растояния, которая устраняет эти трудности. Мы можем использовать ее в следующей форме:

v V

D2(X\Gh) = (n -g) £ £М*«-*« ) (X-Xjh ), (15)

• • •

г=1 3=1

где D2(X\Gk)—квадрат расстояния от точки X (данный объект) до центроида класса k. После вычисления D2 для каждого класса классифицируем объект в группу с наименьшим Z)2. Это класс, чей типичный профиль по дискриминантный переменным больше похож на профиль для этого объекта. Если расстояние до ближай-

Коэффициенты простой классифицирующей функции

шего класса велико, то согласие между профилями будет плохим, но по сравнению с любым другим классом — хорошим.

Соотношение (15) предполагает, что классы имеют равные ковариационные матрицы. Если это предположение не выполняется, то выражение можно модифицировать, как предлагает Татсуока (1971; 222).

Вероятность принадлежности к классу

Оказывается D2 обладает теми же свойствами, что и статистика хи-квадрат с р степенями свободы. Таким образом, мы измеряем расстояние в «хи-квадрат единицах». Если предположить, что каждый класс является частью генеральной совокупности с многомерным нормальным распределением, то большинство объектов будет группироваться вблизи центроида, и их плотность будет убывать по мере удаления от центроида. Зная расстояние от центроида, можно сказать, какая часть класса находится ближе к центроиду, а какая — дальше от него. Следовательно, можно оценить вероятность того, что объект, настолько-то удаленный от центроида, принадлежит классу. Поскольку наши расстояния измеряются в хи-квадрат единицах, то попробуем иайти значимость получения этой вероятности. Обозначим через Pr(X\Gh) вероятность того, что объект, находящийся далеко от центроида, действительно принадлежит классу k.

Другие новости по теме:

  • Факторный анализ 133
  • Факторный анализ 143
  • Факторный анализ 103
  • Факторный анализ 136
  • Факторный анализ 130

  •  (голосов: 0)

    Комментарии (0)