Факторный анализ 177

Новости
Просмотров: 352



1) коэффициенты корреляции;

2) меры расстояния;

3) коэффициенты ассоциативности;

4) вероятностные коэффициенты сходства. Позже каждая из групп будет кратко описана.

1Й0

ПОНЯТИЕ СХОДСТВА

То, что некоторые вещи обнаруживают между собой сходство или различие, является весьма важным моментом для процесса классификации. Несмотря на кажущуюся простоту, понятие сходства и особенно процедуры, используемые при измерении сходства, не так просты. В самом деле, понятие сходства тесно связано с такими основополагающими эпистемологическими проблемами, как: «Каким образом мы можем образовывать полезные абстрактные понятия, позволяющие внести порядок в то, что мы знаем?». Конечно, чтобы ответить на этот вопрос, нужно уметь рассортировывать вещи по классам, что требует умения объединять вещи, воспринимающиеся как схожие. Проблема сходства состоит, однако, не в простом распознавании сходных или несходных вещей, а в том, какое место эти понятия занимают в научных исследованиях. Наука для плодотворного развития должна базироваться на объективных, воспроизводимых процедурах; таким образом, разработка статистических процедур для измерения более «объективного» сходства вещей является естественным следствием необходимости в воспроизводимых и надежных классификациях.

Количественное оценивание сходства отталкивается от понятия метрики. При этом подходе к сходству события представляются точками координатного пространства, причем замеченные сходства и различия между точками находятся в соответствии с метрическими расстояниями между ними (Tversky, 1977). Размерность пространства определяется числом переменных, использованных для описания событий. Существует четыре стандартных критерия, которым должна удовлетворять мера сходства, чтобы быть метрикой:

1) Симметрия. Даны два объекта х и у; расстояние между ними удовлетворяет условию

d(x,y)=d(y, х)0.

2) Неравенство треугольника. Даны три объекта х, у, г; расстояния между ними удовлетворяют условию

d(xy)d(x,z)+d{y,z).

Очевидно, это просто утверждение, что длина любой стороны треугольника меньше или равна сумме двух других сторон. Полученное выражение также называется метрическим неравенством.

3) Различимость нетождественных объектов. Даны два объекта х и у:

если d(xty)=0, то хфу*.

4) Неразличимость идентичных объектов. Для двух идентичных объектов х и х1

d(x,x')=0,

т. е. расстояние между этими объектами равно нулю**. * Если хфу, то d (х, у)фО. Примеч ред.

** Если d (х, x')—Q, то объекты х и х' идентичны. — Примеч. ред.

Перечисленные математические требования очень важны, поэтому многие исследователи, среди которых наиболее известны Джардин и Сибсон (1971), а также Клиффорд и Стефенсом (1975), выдвигают аргументы против механического использования коэффициентов сходства, не являющихся метриками. Не все из обсуждаемых ниже мер расстояния могут быть метриками. Ряд корреляционных мер метриками не являются. Коэффициенты, не представляющие собой метрики, могут не быть совместно монотонными; другими словами, значения различных коэффициентов на одних и тех же данных не будут согласованно изменяться. Это вызывает опасение, что коэффициенты могут указывать на наличие сильно различающихся зависимостей между объектами. Поскольку такая признанная мера сходства, как смешанный момент корреляции Пирсона, явно не удовлетворяет третьему критерию, и, как считают Клиффорд и Стефенсон (1975), во многих приложениях может не выполняться второй критерий (т. е. неравенство треугольника), то следует проверить, действительно ли некоторая мера является метрикой.

Другие новости по теме:

  • Факторный анализ 187
  • Факторный анализ 178
  • Факторный анализ 181
  • Факторный анализ 185
  • Факторный анализ 184

  •  (голосов: 0)

    Комментарии (0)