Гипотеза о законе распределения генеральной совокупности. Критерий согласия Пирсона
Автор: Yerassyl Tastybay • Февраль 4, 2023 • Лекция • 1,703 Слов (7 Страниц) • 183 Просмотры
13. Гипотеза о законе распределения генеральной совокупности.
Критерий согласия Пирсона
Итак, после разгрома двух десятков задач ставим вишенку на торт статистических гипотез, а именно разбираем важнейшую гипотезу о виде (законе) распределения и распространённые тематические примеры.
Рассмотрим генеральную совокупность, распределение которой неизвестно. Однако есть основание полагать, что она распределена по некоторому закону [pic 1] (чаще всего, нормально). Это предположение может появиться как до, так и в результате статистического исследования, когда мы извлекли и изучили выборку объёма [pic 2].
И нам требуется на уровне значимости [pic 3] проверить нулевую гипотезу [pic 4] – о том, что генеральная совокупность распределена по закону [pic 5]против конкурирующей гипотезы [pic 6] о том, что она по нему НЕ распределена.
Как проверить эту гипотезу? Постараюсь объяснить кратко. Как вы знаете, выборочные данные группируются в дискретный или интервальный вариационный ряд с вариантами [pic 7] и соответствующими частотами [pic 8]
[pic 9]
Поскольку эти данные взяты из практического опыта, то выборочный вариационный ряд называют эмпирическим рядом, а частоты [pic 10] – эмпирическими частотами.
Далее строятся графики, рассчитываются выборочные характеристики (выборочная средняя [pic 11], выборочная дисперсия [pic 12] и другие), словом, выполняются все те хорошие дела, которыми мы занимались на протяжении многих уроков.
На основе некоторых выборочных характеристик по специальным формулам, которые зависят от проверяемого закона [pic 13], строится теоретическое распределение, где для тех же вариант [pic 14] рассчитываются теоретические частоты [pic 15].
И возникает вопрос: значимо или незначимо различие между эмпирическими [pic 16] и соответствующими теоретическими [pic 17] частотами?
Для ответа на это вопрос рассматривают различные статистические критерии, которые называют критериями согласия, и наиболее популярный из них разработал Карл Пирсон: [pic 18]
При достаточно большом [pic 19] (объёме выборки) распределение этой случайной величины близкО к распределению хи-квадрат с количеством степеней свободы [pic 20], где [pic 21] – количество оцениваемых параметров закона [pic 22].
…всем понятно, почему величина [pic 23] случайная? – по той причине, что в разных выборках мы будем получать разные, заранее непредсказуемые эмпирические частоты.
Далее строится правосторонняя критическая область:
[pic 24]
Критическое значение [pic 25] можно отыскать с помощью соответствующей таблицы или Экселя (Пункт 11б).
Наблюдаемое значение критерия рассчитывается по эмпирическим и найденным теоретическим частотам:
[pic 26]
Если [pic 27], то на уровне значимости [pic 28] нет оснований отвергать гипотезу [pic 29] о том, что генеральная совокупность распределена по закону [pic 30]. То есть, различие между эмпирическими и теоретическими частотами незначимо и обусловлено случайными факторами (случайностью самой выборки, способом группировки данных и т.д.)
...