Факторный анализ 146

Новости
Просмотров: 353



отберем такую переменную, потому что она не дает достаточно большого вклада в различение. Эта частная /-"-статистика с числом степеней свободы, равным (g—1) и (п.—р'—g+l), в качестве теста значимости, чтобы убедиться в статистической значимости улучшения различения. Переменная должна пройти проверку толерантности и /""-включения, прежде чем она будет рассмотрена в соответствии с критерием отбора.

Статистика /•'-удаления

Статистика /""-удаления также является частной /-статистикой с числом степеней свободы, равным (g—1) и (п,—р'—g). Однако она оценивает значимость ухудшения различения после удаления переменной из списка уже отобранных переменных. Эта процедура проводится в начале каждого шага, чтобы проверить, имеется ли какая-нибудь переменная, уже не вносящая достаточно большого вклада в различение, поскольку отобранные позже переменные дублируют ее вклад.

На заключительном шаге статистика -удаления может быть использована для ранжирования дискриминантных возможностей отобранных переменных. Переменная с наибольшим значением статистики /•'-удаления дает наибольший вклад в различение, достигнутое благодаря другим переменным. Переменная, имеющая вторую по величине статистику /""-удаления, является второй по значимости и т. д. Это ранжирование не обязательно совпадает с тем, которое можно было бы получить с помощью одномерной /-статистики, потому что она измеряет полную дискриминантную способность переменной без учета дублирования ее другими переменными.

ПРИМЕР ИСПОЛЬЗОВАНИЯ ПРОЦЕДУРЫ ПОСЛЕДОВАТЕЛЬНОГО ОТБОРА

Для того чтобы понять, как процедура последовательного отбора работает на практике, применим эту методику к данным Бардес о голосовании в сенате. Когда квадрат расстояния Маха-ланобиса используется в качестве критерия отбора, мы получаем результаты, приведенные в 13.

На первом шаге толерантность всегда равна 1,0, потому что переменные еще не были отобраны. По той же причине здесь статистика /•'-включения соответствует одномерной /-"-статистике. В четвертом столбце даны значения D2, среди которых мы находим наибольшее. Это значение, равное 0,492, получено для переменной CUTASIAN при сравнении групп 1 и 4. Заметьте, что самая тесная пара (пара самых близких классов) для переменной CUTASIAN не является таковой ни для какой другой переменной (для четырех групп должны быть рассмотрены шесть пар). Наш выбор статистики квадрата расстояния в качестве критерия отбора основан на предположении, что мы хотим уделить больше

Другие новости по теме:

  • Факторный анализ 150
  • Факторный анализ 149
  • Факторный анализ 141
  • Факторный анализ 145
  • Факторный анализ 147

  •  (голосов: 0)

    Комментарии (0)