Факторный анализ 152

Новости
Просмотров: 358



Мы уже немного говорили о проблемах, возникающих, когда данные не удовлетворяют математическим предположениям дискриминантного анализа. Труднее всего удовлетворить требованиям о нормальности многомерного распределения дискриминантных переменных и равенстве ковариационных матриц классов. Некоторые исследователи (см., в частности, Lachenbruch, 1975) показали, что дискриминантный анализ является достаточно устойчивым методом, допускающим некоторые отклонения от этих предположений. Кроме того, не все выводы дискриминантного анализа требуют их выполнения.

Предположение о нормальности многомерного распределения важно для проверки значимости, где сопоставляются статистики, вычисленные по выборочным данным, с теоретическим вероятностным распределением для этой статистики. Можно вычислить теоретическое распределение, сделав некоторые удобные математические предположения (например, такие, как требование, чтобы генеральная совокупность имела многомерное нормальное распределение). Если интересующая нас генеральная совокупность не удовлетворяет этому требованию, истинное выборочное распределение статистики будет отличаться от распределения, полученного теоретически. Различия между этими двумя распределениями могут быть очень малыми или очень большими в зависимости от степени нарушения предположений. Лахенбрук (1975) показал, что дискриминантный анализ не очень чувствителен к небольшим нарушениям предположения о нормальности. Это приводит лишь к некоторым потерям в эффективности и точности.

Предположение о нормальности играет важную роль в классификации, основанной на использовании вероятности принадлежности к классу. Эти вероятности вычисляются исходя из распределения хи-квадрат, что оправдано лишь, когда дискриминантные переменные имеют многомерное нормальное распределение. Если это предположение не выполняется, вычисленные вероятности будут неточными. Может оказаться, например, что вероятности

для некоторых групп будут преувеличены, в то время как вероятности для других групп — недооценены. Следовательно, эта процедура не будет оптимальной в смысле уменьшения числа неправильных классификаций.

Другие новости по теме:

  • Факторный анализ 95
  • Факторный анализ 153
  • Факторный анализ 161
  • Факторный анализ 154
  • Факторный анализ 96

  •  (голосов: 0)

    Комментарии (0)