Факторный анализ 137

Новости
Просмотров: 359



Так же можно разделить одномерные графики и гистограммы. Если у нас более двух измерений, графическое изображение областей становится непрактичным из-за невозможности представления таких пространств на листе бумаги. Здесь проявляется другое преимущество классификации с помощью дискриминантных функций — в большинстве исследований требуется только одна или две функции (которые могут быть легко изображены на графике), несмотря на то, что в них используется много дискриминантных переменных. В случае одной функции разделяющая точка между двумя группами равна полусумме величин двух центроидов этих групп. Если же есть две функции, то вычисления затрудняются, но математические идеи остаются простыми. По существу, все сводится к выражению (16) с дополнительным условием:

D4X\Gi)=D*(X\G]).

Решение дает уравнение для прямой линии. Наши рассуждения предполагают, что ковариационные матрицы для отдельных классов можно считать идентичными. Если же это не так, то необходимо сделать уточнения. В случае одной функции разделяющая точка будет находиться ближе к классу с меньшим рассеянием. При двух функциях граница имеет вид кривой, которая охватывает класс с меньшей дисперсией (см. Van de Geer, 1971; 263—265).

КЛАССИФИКАЦИОННАЯ МАТРИЦА

Хотя обычно исследователи обращаются к классификации как к средству предсказания принадлежности к классу «неизвестных» объектов, мы можем использовать ее также для проверки точности процедур классификации. Для этого возьмем «известные» объекты (которыми мы пользовались при выводе классифицирующих функций) и применим к ним правила классификации. Доля правильно классифицированных объектов говорит о точности процедуры и косвенно подтверждает степень разделения классов. Можно составить цу, или «классификационную матрицу», описывающую результаты. Это поможет нам увидеть, какие ошибки совершаются чаще.

12 12 представляет со-Классификациоииая матрица бой классификационную матрицу

для данных о голосовании в сенате. Шесть переменных Бардес правильно предсказывают распределение по фракциям всех сенаторов (кроме Кейпхарта), чья фракционная принадлежность «известна». Точность предсказания в этом случае —94,7% (сумма правильных предсказаний—18, поделенная на общее число «известных» объектов). Мы также видим, что ошибки в этом примере связаны с плохим разделением групп 1 и 4. В нижней строке 12 дано распределение по группам «неизвестных» объектов. Это те сенаторы, чью фракционную принадлежность Бардес не смогла определить по имеющимся у нее данным. Ее главной целью было использовать дискриминантный анализ для классификации позиций этих сенаторов по результатам их голосования, после чего она продолжила исследование отношения сената к различным вариантам помощи иностранным государствам.

Другие новости по теме:

  • Факторный анализ 139
  • Факторный анализ 138
  • Факторный анализ 129
  • Факторный анализ 136
  • Факторный анализ 135

  •  (голосов: 0)

    Комментарии (0)