Другие новости по теме:
Комментарии (0) Факторный анализ 138
Процент «известных» объектов, которые были классифицированы правильно является дополнительной мерой различий между группами. Им мы воспользуемся наряду с общей Л-статистикой Уилкса и каноническими корреляциями для указания количества дискриминантной информации, содержащейся в переменных. Как непосредственная мера точности предсказания это процентное содержание является наиболее подходящей мерой дискриминантной информации. Однако о величине процентного содержания можно судить лишь относительно ожидаемого процента правильных классификаций, когда распределение по классам производилось случайным образом. Если есть два класса, то при случайной классификации можно ожидать 50% правильных предсказаний. Для четырех классов ожидаемая точность составит только 25%. Если для двух классов процедура классификации дает 60% правильных предсказаний, то ее эффективность довольна мала, но для четырех классов такой же результат говорит о значительной эффективности, потому что случайная классификация дала бы лишь 25% правильных предсказаний. Это приводит нас к т-статистике ошибок, которая будет стандартизованной мерой эффективности для любого количества классов:
«
Пс— 2 РгПг
т--— (17)
П.— 2 РгПг 1=1
предполагаемые группы
Исходные группы
1
to
со
1
4
1
8
0
0
1
2
0
2
0
0
3
0
0
5
0
4
0
0
0
3