Критерий Пирсона
Автор: Виктория Тихомирова • Март 2, 2023 • Реферат • 682 Слов (3 Страниц) • 308 Просмотры
Эссе на тему «Критерий Пирсона»
Критерием Пирсона (критерий хи-квадрат) является метод математической статистики, который предназначен для оценки значимости различий между двумя или несколькими относительными признаками. Данный метод был основан в 1900 году английским ученым Карлом Пирсоном. Основной задачей данного метода является анализ таблиц сопряженности, которые содержат сведения о частоте исходов в зависимости от наличия факторов. Главным достоинством критерия Пирсона является его универсальность, т.к. он позволяет проверить различные гипотезы, которые основаны на законах распределения случайных величин (СВ).
Обычно эмпирические и теоретические частоты различаются. Случайно ли расхождение частот? Критерий Пирсона дает ответ на этот вопрос, правда, как и любой статистический критерий, он не доказывает справедливость гипотезы в строго математическом смысле, а лишь устанавливает на определенном уровне значимости ее согласие или несогласие с данными наблюдений.
Итак, пусть по выборке объема [pic 1]получено статистическое распределение значений признака[pic 2], где[pic 3]— наблюдаемые значения признака,[pic 4]— соответствующие им частоты:
[pic 5] | [pic 6] | [pic 7] | [pic 8] | [pic 9] | [pic 10] |
[pic 11] | [pic 12] | [pic 13] | [pic 14] | [pic 15] | [pic 16] |
Суть критерия Пирсона состоит в вычислении критерия [pic 17]по следующей формуле:
[pic 18]
где [pic 19]— это число разрядов наблюдаемых значений, а[pic 20]— теоретические частоты соответствующих значений.
Понятно, что чем меньше разности [pic 21], тем ближе эмпирическое распределение к эмпирическому, поэтому, чем меньше значение критерия[pic 22], тем с большей достоверностью можно утверждать, что эмпирическое и теоретическое распределение подчинены одному закону.
Критерий хи-квадрат может применяться при анализе таблиц сопряженности, содержащих сведения о частоте исходов в зависимости от наличия фактора риска. Например, четырехпольная таблица сопряженности выглядит следующим образом:
| Исход есть (1) | Исхода нет (0) | Всего |
Фактор риска есть (1) | A | B | A + B |
Фактор риска отсутствует (0) | C | D | C + D |
Всего | A + C | B + D | A + B + C + D |
Условия и ограничения применения критерия хи-квадрат Пирсона
- Сопоставляемые показатели должны быть измерены в номинальной шкале (например, пол пациента - мужской или женский) или в порядковой (например, степень артериальной гипертензии, принимающая значения от 0 до 3).
- Данный метод позволяет проводить анализ не только четырехпольных таблиц, когда и фактор, и исход являются бинарными переменными, то есть имеют только два возможных значения (например, мужской или женский пол, наличие или отсутствие определенного заболевания в анамнезе...). Критерий хи-квадрат Пирсона может применяться и в случае анализа многопольных таблиц, когда фактор и (или) исход принимают три и более значений.
- Сопоставляемые группы должны быть независимыми, то есть критерий хи-квадрат не должен применяться при сравнении наблюдений "до-"после". В этих случаях проводится тест Мак-Немара (при сравнении двух связанных совокупностей) или рассчитывается Q-критерий Кохрена (в случае сравнения трех и более групп).
- При анализе четырехпольных таблиц ожидаемые значения в каждой из ячеек должны быть не менее 10. В том случае, если хотя бы в одной ячейке ожидаемое явление принимает значение меньше 10, то для анализа лучше использовать точный критерий Фишера.
В случае анализа многопольных таблиц ожидаемое число наблюдений не должно принимать значения менее 5 более чем в 20% ячеек. В случае несоблюдения данного условия для сравнения долей следует также использовать точный критерий Фишера.
Как интерпретировать значение критерия хи-квадрат Пирсона?
В том случае, если полученное значение критерия χ2 больше критического, делаем вывод о наличии статистической взаимосвязи между изучаемым фактором риска и исходом при соответствующем уровне значимости.
...