Критерий ПирсонаСмотрите также: Проверка гипотез критерием хи-квадрат Пирсона χ2 критерий Пирсона (хи-квадрат, кси-квадрат) Внимание! Если у вас меньше 30 наблюдений (n<30), то не стоит применять критерий хи-квадрат Пирсона! Поищите другие статистические методы... АЛГОРИТМ 13 Расчет критерия χ2 1. Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты (первый столбец). 2. Рядом с каждой эмпирической частотой записать теоретическую частоту (второй столбец). 3. Подсчитать разности между эмпирической и теоретической частотой по каждому разряду (строке) и записать их в третий столбец. 4. Определить число степеней свободы по формуле: ν=κ-1 где κ - количество разрядов признака. Если ν=1, внести поправку на "непрерывность". 5. Возвести в квадрат полученные разности и занести их в четвертый столбец. 6. Разделить полученные квадраты разностей на теоретическую часто ту и записать результаты в пятый столбец. 7. Просуммировать значения пятого столбца. Полученную сумму обо значить как χ2ЭМП. 8. Определить по Табл. IX Приложения 1 критические значения для данного числа степеней свободы V. Если χ2эмп меньше критического значения, расхождения между распределениями статистически недостоверны. Если χ2эмп равно критическому значению или превышает его, расхождения между распределениями статистически достоверны.
Слева дана общая схема применения критерия для сопоставления двух эмпирических распределений. Кликните на неё для улучшения изображения. Назначения критерия Критерий χ2 применяется в двух целях; 1) для сопоставления эмпирического распределения признака с теоретическим - равномерным, нормальным или каким-то иным; 2) для сопоставления двух, трех или более эмпирических распределений одного и того же признака1. Описание критерия Критерий χ2 отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях. Преимущество метода состоит в том, что он позволяет сопоставлять распределения признаков, представленных в любой шкале, начиная от шкалы наименований (см. п. 1.2). В самом простом случае альтернативного распределения "да - нет", "допустил брак - не допустил брака", "решил задачу - не решил задачу" и т. п. мы уже можем применить критерий χ2. Допустим, некий наблюдатель фиксирует количество пешеходов, выбравших правую или левую из двух симметричных дорожек на пути из точки А в точку Б (см. Рис. 4.3). Допустим, в результате 70 наблюдений установлено, что Э\ человек выбрали правую дорожку, и лишь 19 - левую. С помощью критерия χ2 мы можем определить, отличается ли данное распределение выборов от равномерного распределения, при котором обе дорожки выбирались бы с одинаковой частотой. Это вариант сопоставления полученного эмпирического распределения с теоретическим. Такая задача может стоять, например, в прикладных психологических исследованиях, связанных с проектированием в архитектуре, системах сообщения и др. Но представим себе, что наблюдатель решает совершенно другую задачу: он занят проблемами билатерального регулирования. Совпадение полученного распределения с равномерным его интересует гораздо в меньшей степени, чем совпадение или несовпадение его данных с данными других исследователей. Ему известно, что люди с преобладанием правой ноги склонны делать круг против часовой стрелки, а люди с преобладанием левой ноги - круг по ходу часовой стрелки, и что в исследовании коллег2 преобладание левой ноги было обнаружено у 26 человек из 100 обследованных. С помощью метода χ2 он может сопоставить два эмпирических распределения: соотношение 51:19 в собственной выборке и соотношение 74:26 в выборке других исследователей. Это вариант сопоставления двух эмпирических распределений по простейшему альтернативному признаку (конечно, простейшему с математической точки зрения, а отнюдь не психологической). Аналогичным образом мы можем сопоставлять распределения выборов из трех и более альтернатив. Например, если в выборке из 50 человек 30 выбрали ответ (а), 15 человек - ответ (б) и 5 человек -ответ (в), то мы можем с помощью метода χ2 проверить, отличается ли это распределение от равномерного распределения или от распределения ответов в другой выборке, где ответ (а) выбрали 10 человек, ответ (б) -25 человек, ответ (в) - 15 человек. В тех случаях, если признак измеряется количественно, скажем, в баллах, секундах или миллиметрах, нам, быть может, придется объединить все обилие значений признака в несколько разрядов. Например, если время решения задачи варьирует от 10 до 300 секунд, то мы можем ввести 10 или 5 разрядов, в зависимости от объема выборки. Например, это будут разряды: 0-50 секунд; 51-100 секунд; 101-150 секунд, и т. д. Затем мы с помощью метода χ2 будет сопоставлять частоты встречаемости разных разрядов признака, но в остальном принципиальная схема не меняется. При сопоставлении эмпирического распределения с теоретическим мы определяем степень расхождения между эмпирическими и теоретическими частотами. При сопоставлении двух эмпирических распределений мы определяем степень расхождения между эмпирическими частотами и теоретическими частотами, которые наблюдались бы в случае совпадения двух этих эмпирических распределений. Формулы расчета теоретических частот будут специально даны для каждого варианта сопоставлений. Чем больше расхождение между двумя сопоставляемыми распределениями, тем больше эмпирическое значение у}. Гипотезы Возможны несколько вариантов гипотез, в зависимости от задач, которые мы перед собой ставим. Первый вариант: Н0: Полученное эмпирическое распределение признака не отличается от теоретического (например, равномерного) распределения. Н1: Полученное эмпирическое распределение признака отличается от теоретического распределения. Второй вариант: Н0: Эмпирическое распределение 1 не отличается от эмпирического распределения 2. Н1: Эмпирическое распределение 1 отличается от эмпирического распределения 2. Третий вариант: Н0: Эмпирические распределения 1, 2, 3, ... не различаются между собой. Н1: Эмпирические распределения 1, 2, 3, ... различаются между собой. Критерий χ2 позволяет проверить все три варианта гипотез. 1 На самом деле области применения критерия %2 многообразны (см., например: Суходольский Г.В., 1972, с. 295), но в данном руководстве мы ограничиваемся только этими двумя, наиболее часто встречающимися на практике, целями. 2 Доброхотова Т. А., Брагина Н. Н. Левши. М.: "Книга", 1994.
Ограничения критерия 1. Объем выборки должен быть достаточно большим: п≥30. При п<30 критерий χ2 дает весьма приближенные значения. Точность критерия повышается при больших п. 2. Теоретическая частота для каждой ячейки таблицы не должна быть меньше 5: f>5. Это означает, что если число разрядов задано заранее и не может быть изменено, то мы не можем применять метод χ2, не накопив определенного минимального числа наблюдений. Если, например, мы хотим проверить наши предположения о том, что частота обращений в телефонную службу Доверия неравномерно распределяются по 7 дням недели, то нам потребуется 5*7=35 обращений. Таким образом, если количество разрядов (k) задано заранее, как в данном случае, минимальное число наблюдений (nmin) определяется по формуле: nmin=k*5. 3. Выбранные разряды должны "вычерпывать" все распределение, то есть охватывать весь диапазон вариативности признаков. При этом группировка на разряды должна быть одинаковой во всех сопоставляемых распределениях. 4. Необходимо вносить "поправку на непрерывность" при сопоставлении распределений признаков, которые принимают всего 2 значения. При внесении поправки значение χ2 уменьшается (см. Пример с по правкой на непрерывность). 5. Разряды должны быть неперекрещивающимися: если наблюдение отнесено к одному разряду, то оно уже не может быть отнесено ни к какому другому разряду. Сумма наблюдений по разрядам всегда должна быть равна общему количеству наблюдений. Правомерен вопрос о том, что считать числом наблюдений - количество выборов, реакций, действий или количество испытуемых, которые совершают выбор, проявляют реакции или производят действия. Если испытуемый проявляет несколько реакций, и все они регистрируются, то количество испытуемых не будет совпадать с количеством реакций. Мы можем просуммировать реакции каждого испытуемого, как, например, это делается в методике Хекхаузена для исследования мотивации достижения или в Тесте фрустрационной толерантности С. Розенцвейга, и сравнивать распределения индивидуальных сумм реакций в нескольких выборках. В этом случае числом наблюдений будет количество испытуемых. Если же мы подсчитываем частоту реакций определенного типа в целом по выборке, то получаем распределение реакций разного типа, и в этом случае количеством наблюдений будет общее количество зарегистрированных реакций, а не количество испытуемых. С математической точки зрения правило независимости разрядов соблюдается в обоих случаях: одно наблюдение относится к одному и только одному разряду распределения. - Можно представить себе и такой вариант исследования, где мы изучаем распределение выборов одного испытуемого. В когнитивно-бихевиоральной терапии, например, клиенту предлагается всякий раз фиксировать точной время появления нежелательной реакции, например, приступов страха, депрессии, вспышек гнева, самоуничижающих мыслей и т. п. В дальнейшем психотерапевт анализирует полученные данные, выявляя часы, в которые неблагоприятные симптомы проявляются чаще, и помогает клиенту строить индивидуальную программу предупреждения неблагоприятных реакций. Можно ли с помощью критерия χ2 доказать, что некоторые часы являются в этом индивидуальном распределении более часто встречающимися, а другие - менее часто встречающимися? Все наблюдения - зависимы, так как они относятся к одному и тому же испытуемому; в то же время все разряды - неперекрещивающиеся, так как один и тот же приступ относится к одному и только одному разряду (в данном случае - часу дня). По-видимому, применение метода χ2 будет в данном случае некоторым упрощением. Приступы страха, гнева или депрессии могут наступать неоднократно в течение дня, и может оказаться так, что, скажем, ранний утренний, 6-часовой, и поздний вечерний, 12-часовой, приступы обычно появляются вместе, в один и тот же день: в то же время дневной 3-часовой приступ появляется не ранее как через сутки после предыдущего приступа и не менее чем за двое суток до следующего и т. п. По-видимому, речь здесь может идти о сложной математической модели или вообще о чем-то таком, чего нельзя "поверить алгеброй". И тем не менее в практических целях может оказаться полезным использовать критерий для того, чтобы выявить систематическую неравномерность наступления каких-либо значимых событий, выбора, предпочтений и т. п. у одного и того же человека. Итак, одно и то же наблюдение должно относиться только к одному разряду. Но считать ли наблюдением каждого испытуемого или каждую исследуемую реакцию испытуемого - вопрос, решение которого зависит от целей исследования (см.. напр., Ганзен В.А., Балин В.Д., 1991, с.10). Главное же "ограничение" критерия χ2 - то, что он кажется большинству исследователей пугающе сложным.
Таблица. Расчет критерия χ2 при сопоставлении эмпирического распределения с равномерным распределением
Необходимо всякий раз убеждаться в том, что сумма разностей между эмпирическими и теоретической частотами (сумма по третьему столбцу) равна 0. Если это равенство не соблюдается, это означает, что в подсчете частот или разностей допущена ошибка. Необходимо найти и устранить ее прежде чем переходить к дальнейшим расчетам. Алгоритм вычислений, таким образом, выражается формулой:
где fэj - эмпирическая частота по j-тому разряду признака; fт - теоретическая частота; j - порядковый номер разряда; k - количество разрядов признака. В данном случае:
Для того, чтобы установить критические значения % , нам нужно определить число степеней свободы V по формуле: ν=k-l где k - количество разрядов. В нашем случае ν=4—1=3. По Табл. IX Приложения 1 определяем:
Построим "ось значимости". Ясно, что чем больше отклонения эмпирических частот от теоретической, тем больше будет величина χ2 . Поэтому зона значимости располагается справа, а зона незначимости -слева.
К сожалению, на основании этих данных мы не сможем подтвердить выделение какой-то группы из ожидаемого теоретического равномерного распределения: χ2 эмп<χ2 кр. Ответ: Н0 принимается. Распределение между группами не отличается от равномерного распределения. Смотрите также: Проверка гипотез критерием хи-квадрат Пирсона Ваша оценка: |